题目0023:合并K个排序链表

题目描述

合并k个排序链表,返回合并后的排序链表,请分析和描述算法的复杂度。

示例:

输入:
[
  1->4->5,
  1->3->4,
  2->6
]
输出: 1->1->2->3->4->4->5->6

解题技巧

前置知识:合并两个有序链表

在解决合并K个排序链表这个问题之前,我们先来看一个更简单的问题:如何合并两个有序链表?假设链表a和b的长度都是n,如何在O(n)的时间代价以及O(1)的空间代价完成合并?这个问题在面试中常常出现,为了达到空间代价是O(1),我们的宗旨是原地调整链表元素的next指针完成合并。以下是合并的步骤和注意事项,对这个问题比较熟悉的读者可以跳过这一部分。此部分建议结合代码阅读。

首先我们需要一个变量head来保存合并之后链表的头部,你可以把head设置为一个虚拟的头(也就是head的val属性不保存任何值),这是为了方便代码的书写,在整个链表合并完之后,返回它的下一位置即可。

我们需要一个指针tail来记录下一个插入位置的前一个位置,以及两个指针aPtr和bPtr来记录a和b未合并部分的第一位。注意这里的描述,tail不是下一个插入的位置,aPtr和bPtr所指向的元素处于待合并的状态,也就是说它们还没有合并入最终的链表。当然你也可以给他们赋予其他的定义,但是定义不同实现就会不同。

当aPtr和bPtr都不为空的时候,取val熟悉较小的合并;如果aPtr为空,则把整个bPtr以及后面的元素全部合并;bPtr为空时同理。在合并的时候,应该先调整tail的next属性,再后移tail和Ptr(aPtr或者bPtr)。那么这里tail和Ptr是否存在先后顺序呢?它们谁先动谁后动都是一样的,不会改变任何元素的next指针。

代码

C++

ListNode* mergeTwoLists(ListNode *a, ListNode *b) {
    if ((!a) || (!b)) return a ? a : b;
    ListNode head, *tail = &head, *aPtr = a, *bPtr = b;
    while (aPtr && bPtr) {
        if (aPtr->val < bPtr->val) {
            tail->next = aPtr; aPtr = aPtr->next;
        } else {
            tail->next = bPtr; bPtr = bPtr->next;
        }
        tail = tail->next;
    }
    tail->next = (aPtr ? aPtr : bPtr);
    return head.next;
}

复杂度

时间复杂度:O(n)。

空间复杂度:O(1)。

方法一:顺序合并

思路:我们可以想到一种最朴素的方法:用一个变量ans来维护以及合并的链表,第i次循环把第i个链表和ans合并,答案保存到ans中。

代码

/**
 * Definition for singly-linked list.
 * struct ListNode {
 *     int val;
 *     ListNode *next;
 *     ListNode(int x) : val(x), next(NULL) {}
 * };
 */
class Solution {
public:
    ListNode* mergeTwoLists(ListNode *a, ListNode *b) {
        if ((!a) || (!b)) return a ? a : b;
        ListNode head, *tail = &head, *aPtr = a, *bPtr = b;
        while (aPtr && bPtr) {
            if (aPtr->val < bPtr->val) {
                tail->next = aPtr; aPtr = aPtr->next;
            } else {
                tail->next = bPtr; bPtr = bPtr->next;
            }
            tail = tail->next;
        }
        tail->next = (aPtr ? aPtr : bPtr);
        return head.next;
    }

    ListNode* mergeKLists(vector<ListNode*>& lists) {
        ListNode *ans = nullptr;
        for (size_t i = 0; i < lists.size(); ++i) {
            ans = mergeTwoLists(ans, lists[i]);
        }
        return ans;
    }
};

复杂度分析

时间复杂度:假设每个链表的最长长度是n。在第一次合并后,ans的长度为n;第二次合并后,ans的长度为 $2\times n$ ,第i次合并后,ans的长度为 $i\times n$ 。第i次合并的时间代价是 $O(n + (i - 1) \times n) = O(i \times n)$ ,那么总的时间代价为 $O(\sum_{i = 1}^{k} (i \times n)) = O(\frac{(1 + k)\cdot k}{2} \times n) = O(k^2 n)$ ,故渐进时间复杂度为 $O(k^2 n)$ 。

空间复杂度:没有用到与k和n规模相关的辅助空间,故渐进空间复杂度为O(1)。

方法二:分治合并

考虑优化方法一,用分治的方法进行合并。

将k个链表配对并将同一对中的链表合并;

第一轮合并以后,k个链表被合并成了 $\frac{k}{2}$ 个链表,平均长度为 $\frac{2n}{k}$ ,然后是 $\frac{k}{4}$ 个链表, $\frac{k}{8}$ 个链表等等;

重复这一过程,直到我们得到了最终的有序链表。

代码

/**
 * Definition for singly-linked list.
 * struct ListNode {
 *     int val;
 *     ListNode *next;
 *     ListNode(int x) : val(x), next(NULL) {}
 * };
 */
class Solution {
public:
    ListNode* mergeTwoLists(ListNode *a, ListNode *b) {
        if ((!a) || (!b)) return a ? a : b;
        ListNode head, *tail = &head, *aPtr = a, *bPtr = b;
        while (aPtr && bPtr) {
            if (aPtr->val < bPtr->val) {
                tail->next = aPtr; aPtr = aPtr->next;
            } else {
                tail->next = bPtr; bPtr = bPtr->next;
            }
            tail = tail->next;
        }
        tail->next = (aPtr ? aPtr : bPtr);
        return head.next;
    }

    ListNode* merge(vector <ListNode*> &lists, int l, int r) {
        if (l == r) return lists[l];
        if (l > r) return nullptr;
        int mid = (l + r) >> 1;
        return mergeTwoLists(merge(lists, l, mid), merge(lists, mid + 1, r));
    }

    ListNode* mergeKLists(vector<ListNode*>& lists) {
        return merge(lists, 0, lists.size() - 1);
    }
};

复杂度分析:

时间复杂度:考虑递归向上回升的过程——第一轮合并 $\frac{k}{2}$ 组链表,每一组的时间代价是 $O(2n)$ ;第二轮合并 $\frac{k}{4}$ 组链表,每一组的时间代价是 $O(4n)$ ......所以总的时间代价是 $O(\sum_{i = 1}^{\infty} \frac{k}{2^i} \times 2^i n) = O(kn \times \log k)$ ,故渐进时间复杂度为 $O(kn \times \log k)$ 。

空间复杂度:递归会使用到 $O(\log k)$ 空间代价的栈空间。

方法三:使用优先队列合并

这个方法和前两种方法的思路有所不同,我们需要维护当前每个链表没有被合并的元素的最前面一个,k个链表就最多有k个满足这样条件的元素,每次在这些元素里面选取val属性最小的元素合并到答案中。在选取最小元素的时候,我们可以用优先队列来优化这个过程。

代码

/**
 * Definition for singly-linked list.
 * struct ListNode {
 *     int val;
 *     ListNode *next;
 *     ListNode(int x) : val(x), next(NULL) {}
 * };
 */
class Solution {
public:
    struct Status {
        int val;
        ListNode *ptr;
        bool operator < (const Status &rhs) const {
            return val > rhs.val;
        }
    };

    priority_queue <Status> q;

    ListNode* mergeKLists(vector<ListNode*>& lists) {
        for (auto node: lists) {
            if (node) q.push({node->val, node});
        }
        ListNode head, *tail = &head;
        while (!q.empty()) {
            auto f = q.top(); q.pop();
            tail->next = f.ptr; 
            tail = tail->next;
            if (f.ptr->next) q.push({f.ptr->next->val, f.ptr->next});
        }
        return head.next;
    }
};

复杂度

时间复杂度:考虑优先队列中的元素不超过k个,那么插入和删除的时间代价为 $O(\log k)$ ,这里最多有 $kn$ 个点,对于每个点都被插入删除各一次,故总的时间代价即渐进时间复杂度为 $O(kn \times \log k)$ 。

空间复杂度:这里用了优先队列,优先队列中的元素不超过k个,故渐进空间复杂度为 $O(k)$ 。