题目0461:汉明距离

题目描述

两个整数之间的汉明距离指的是这两个数字对应二进制位不同的位置的数目。

给出两个整数x和y,计算它们之间的汉明距离。

注意:0 ≤ x, y < 231.

示例:

输入: x = 1, y = 4
输出: 2
解释:
1   (0 0 0 1)
4   (0 1 0 0)
       ↑   ↑

上面的箭头指出了对应二进制位不同的位置。

解题技巧

汉明距离广泛应用于多个领域。在编码理论中用于错误检测,在信息论中量化字符串之间的差异。两个整数之间的汉明距离是对应位置上数字不同的位数。根据以上定义,提出一种XOR的位运算,当且仅当输入位不同时输出为1。

计算x和y之间的汉明距离,可以先计算x XOR y,然后统计结果中等于1的位数。

现在,原始问题转换为位计数问题。位计数有多种思路,将在下面的方法中介绍。

方法一:内置位计数功能

思路:大多数编程语言中,都存在各种内置计算等于1的位数函数。如果这是一个项目中的问题,应该直接使用内置函数,而不是重复造轮子。

但这是一个力扣问题,有人会认为使用内置函数就好像使用使用LinkedList实现LinkedList。对此,我们完全赞同。因此后面会有手工实现的位计数算法。

class Solution:
    def hammingDistance(self, x: int, y: int) -> int:
        return bin(x ^ y).count('1')

复杂度分析

时间复杂度: $\mathcal{O}(1)$ 。该算法有两个操作。计算XOR花费恒定时间。调用内置的bitCount函数。最坏情况下,该函数复杂度为 $\mathcal{O}(k)$ ,其中k是整数的位数。在Python和Java中Integer是固定长度的。因此该算法复杂度恒定,与输入大小无关。

空间复杂度: $\mathcal{O}(1)$ ,使用恒定大小的空间保存XOR的结果。假设内置函数也使用恒定空间。

方法二:移位

思路:为了计算等于1的位数,可以将每个位移动到最左侧或最右侧,然后检查该位是否为1。

更准确的说,应该进行逻辑移位,移入零替换丢弃的位。

这里采用右移位,每个位置都会被移动到最右边。移位后检查最右位的位是否为1即可。检查最右位是否为1,可以使用取模运算(i % 2)或者AND操作(i & 1),这两个操作都会屏蔽最右位以外的其他位。

class Solution(object):
    def hammingDistance(self, x, y):
        """
        :type x: int
        :type y: int
        :rtype: int
        """
        xor = x ^ y
        distance = 0
        while xor:
            # mask out the rest bits
            if xor & 1:
                distance += 1
            xor = xor >> 1
        return distance

复杂度分析

时间复杂度: $\mathcal{O}(1)$ ,在Python和Java中Integer的大小是固定的,处理时间也是固定的。32位整数需要32次迭代。

空间复杂度: $\mathcal{O}(1)$ ,使用恒定大小的空间。

方法三:布赖恩·克尼根算法

思路:方法二是逐位移动,逐位比较边缘位置是否为1。寻找一种更快的方法找出等于1的位数。是否可以像人类直观的计数比特为1的位数,跳过两个1之间的0。例如:10001000。

上面例子中,遇到最右边的1后,如果可以跳过中间的0,直接跳到下一个1,效率会高很多。

这是布赖恩·克尼根位计数算法的基本思想。该算法使用特定比特位和算术运算移除等于1的最右比特位。

当我们在number和number-1上做AND位运算时,原数字number的最右边等于1的比特会被移除。

基于以上思路,通过2次迭代就可以知道10001000中1的位数,而不需要8次。

class Solution:
    def hammingDistance(self, x, y):
        xor = x ^ y
        distance = 0
        while xor:
            distance += 1
            # remove the rightmost bit of '1'
            xor = xor & (xor - 1)
        return distance

注意:该算法发布在1988年《C语言编程第二版》的练习中(由Brian W. Kernighan和Dennis M. Ritchie编写),但是Donald Knuth在2006年4月19日指出,该方法第一次是由Peter Wegner在1960年的CACM3上出版。顺便说一句,可以在上述书籍中找到更多位操作的技巧。

复杂度分析

时间复杂度: $\mathcal{O}(1)$ 。与移位方法相似,由于整数的位数恒定,因此具有恒定的时间复杂度。但是该方法需要的迭代操作更少。

空间复杂度: $\mathcal{O}(1)$ ,与输入无关,使用恒定大小的空间。