题目0023:合并K个排序链表
题目描述
合并k个排序链表,返回合并后的排序链表,请分析和描述算法的复杂度。
示例:
输入:
[
1->4->5,
1->3->4,
2->6
]
输出: 1->1->2->3->4->4->5->6
解题技巧
前置知识:合并两个有序链表
在解决合并K个排序链表这个问题之前,我们先来看一个更简单的问题:如何合并两个有序链表?假设链表a和b的长度都是n,如何在O(n)的时间代价以及O(1)的空间代价完成合并?这个问题在面试中常常出现,为了达到空间代价是O(1),我们的宗旨是原地调整链表元素的next指针完成合并。以下是合并的步骤和注意事项,对这个问题比较熟悉的读者可以跳过这一部分。此部分建议结合代码阅读。
- 首先我们需要一个变量head来保存合并之后链表的头部,你可以把head设置为一个虚拟的头(也就是head的val属性不保存任何值),这是为了方便代码的书写,在整个链表合并完之后,返回它的下一位置即可。
- 我们需要一个指针tail来记录下一个插入位置的前一个位置,以及两个指针aPtr和bPtr来记录a和b未合并部分的第一位。注意这里的描述,tail不是下一个插入的位置,aPtr和bPtr所指向的元素处于待合并的状态,也就是说它们还没有合并入最终的链表。当然你也可以给他们赋予其他的定义,但是定义不同实现就会不同。
- 当aPtr和bPtr都不为空的时候,取val熟悉较小的合并;如果aPtr为空,则把整个bPtr以及后面的元素全部合并;bPtr为空时同理。 在合并的时候,应该先调整tail的next属性,再后移tail和Ptr(aPtr或者bPtr)。那么这里tail和Ptr是否存在先后顺序呢?它们谁先动谁后动都是一样的,不会改变任何元素的next指针。
代码
C++
ListNode* mergeTwoLists(ListNode *a, ListNode *b) {
if ((!a) || (!b)) return a ? a : b;
ListNode head, *tail = &head, *aPtr = a, *bPtr = b;
while (aPtr && bPtr) {
if (aPtr->val < bPtr->val) {
tail->next = aPtr; aPtr = aPtr->next;
} else {
tail->next = bPtr; bPtr = bPtr->next;
}
tail = tail->next;
}
tail->next = (aPtr ? aPtr : bPtr);
return head.next;
}
复杂度
时间复杂度:O(n)。
空间复杂度:O(1)。
- 方法一:顺序合并
思路:我们可以想到一种最朴素的方法:用一个变量ans来维护以及合并的链表,第i次循环把第i个链表和ans合并,答案保存到ans中。
代码
/**
* Definition for singly-linked list.
* struct ListNode {
* int val;
* ListNode *next;
* ListNode(int x) : val(x), next(NULL) {}
* };
*/
class Solution {
public:
ListNode* mergeTwoLists(ListNode *a, ListNode *b) {
if ((!a) || (!b)) return a ? a : b;
ListNode head, *tail = &head, *aPtr = a, *bPtr = b;
while (aPtr && bPtr) {
if (aPtr->val < bPtr->val) {
tail->next = aPtr; aPtr = aPtr->next;
} else {
tail->next = bPtr; bPtr = bPtr->next;
}
tail = tail->next;
}
tail->next = (aPtr ? aPtr : bPtr);
return head.next;
}
ListNode* mergeKLists(vector<ListNode*>& lists) {
ListNode *ans = nullptr;
for (size_t i = 0; i < lists.size(); ++i) {
ans = mergeTwoLists(ans, lists[i]);
}
return ans;
}
};
复杂度分析
时间复杂度:假设每个链表的最长长度是n。在第一次合并后,ans的长度为n;第二次合并后,ans的长度为2\times n,第i次合并后,ans的长度为i\times n。第i次合并的时间代价是O(n + (i - 1) \times n) = O(i \times n),那么总的时间代价为O(\sum_{i = 1}^{k} (i \times n)) = O(\frac{(1 + k)\cdot k}{2} \times n) = O(k^2 n),故渐进时间复杂度为O(k^2 n)。
空间复杂度:没有用到与k和n规模相关的辅助空间,故渐进空间复杂度为O(1)。
- 方法二:分治合并
考虑优化方法一,用分治的方法进行合并。
- 将k个链表配对并将同一对中的链表合并;
- 第一轮合并以后,k个链表被合并成了\frac{k}{2}个链表,平均长度为\frac{2n}{k},然后是\frac{k}{4}个链表,\frac{k}{8}个链表等等;
- 重复这一过程,直到我们得到了最终的有序链表。
代码
/**
* Definition for singly-linked list.
* struct ListNode {
* int val;
* ListNode *next;
* ListNode(int x) : val(x), next(NULL) {}
* };
*/
class Solution {
public:
ListNode* mergeTwoLists(ListNode *a, ListNode *b) {
if ((!a) || (!b)) return a ? a : b;
ListNode head, *tail = &head, *aPtr = a, *bPtr = b;
while (aPtr && bPtr) {
if (aPtr->val < bPtr->val) {
tail->next = aPtr; aPtr = aPtr->next;
} else {
tail->next = bPtr; bPtr = bPtr->next;
}
tail = tail->next;
}
tail->next = (aPtr ? aPtr : bPtr);
return head.next;
}
ListNode* merge(vector <ListNode*> &lists, int l, int r) {
if (l == r) return lists[l];
if (l > r) return nullptr;
int mid = (l + r) >> 1;
return mergeTwoLists(merge(lists, l, mid), merge(lists, mid + 1, r));
}
ListNode* mergeKLists(vector<ListNode*>& lists) {
return merge(lists, 0, lists.size() - 1);
}
};
复杂度分析:
时间复杂度:考虑递归向上回升的过程——第一轮合并\frac{k}{2}组链表,每一组的时间代价是O(2n);第二轮合并\frac{k}{4}组链表,每一组的时间代价是O(4n)......所以总的时间代价是O(\sum_{i = 1}^{\infty} \frac{k}{2^i} \times 2^i n) = O(kn \times \log k),故渐进时间复杂度为O(kn \times \log k)。
空间复杂度:递归会使用到O(\log k)空间代价的栈空间。
- 方法三:使用优先队列合并
这个方法和前两种方法的思路有所不同,我们需要维护当前每个链表没有被合并的元素的最前面一个,k个链表就最多有k个满足这样条件的元素,每次在这些元素里面选取val属性最小的元素合并到答案中。在选取最小元素的时候,我们可以用优先队列来优化这个过程。
代码
/**
* Definition for singly-linked list.
* struct ListNode {
* int val;
* ListNode *next;
* ListNode(int x) : val(x), next(NULL) {}
* };
*/
class Solution {
public:
struct Status {
int val;
ListNode *ptr;
bool operator < (const Status &rhs) const {
return val > rhs.val;
}
};
priority_queue <Status> q;
ListNode* mergeKLists(vector<ListNode*>& lists) {
for (auto node: lists) {
if (node) q.push({node->val, node});
}
ListNode head, *tail = &head;
while (!q.empty()) {
auto f = q.top(); q.pop();
tail->next = f.ptr;
tail = tail->next;
if (f.ptr->next) q.push({f.ptr->next->val, f.ptr->next});
}
return head.next;
}
};
复杂度
时间复杂度:考虑优先队列中的元素不超过k个,那么插入和删除的时间代价为O(\log k),这里最多有kn个点,对于每个点都被插入删除各一次,故总的时间代价即渐进时间复杂度为O(kn \times \log k)。
空间复杂度:这里用了优先队列,优先队列中的元素不超过k个,故渐进空间复杂度为O(k)。