《算法导论》第6章 堆排序 (3)K路归并

时间:2022-08-08 19:33:15



问题描述:

问题来自习题6.5-8 给出一个时间为O(nlgk),用来将k个已排序链表合并为一个排序链表的算法。 此处n为所有输入链表中元素的总数。(提示:用一个最小堆来做k路合并)。
在K路归并问题中,取出最小堆的根元素(最小元素)后,如果此元素没有后继元素(next为空), 则有两种方案: 一、从K路中的另一个链表取出一个元素放到根位置。 二、将堆底部最后一个元素挪到根位置,并将堆大小减一。
此处采用方案二。堆大小每减一,说明K路中某一个链表已处理完。 当堆大小为零时,处理结束。

源码与注释:
// 链表结点类 class Node {       int value;       Node next;}
public class KMerge {
       public static void main(String[] args) {
              // 创建五路链表               LinkedList<Node> list1 = createList(2, 5, 8, 10);               LinkedList<Node> list2 = createList(3, 4, 14);               LinkedList<Node> list3 = createList(9, 11, 13, 15, 18);               LinkedList<Node> list4 = createList(7, 12, 17, 22, 25);               LinkedList<Node> list5 = createList(6, 16, 19, 21);                              LinkedList<LinkedList<Node>> kLists = new LinkedList<LinkedList<Node>>();               kLists.add(list1);               kLists.add(list2);               kLists.add(list3);               kLists.add(list4);               kLists.add(list5);                              // 开始归并               LinkedList<Node> resultList = kMerge(kLists);                              for (Node node : resultList) {                      System.out.print(node.value + ", ");               }               System.out.println();        }                public static LinkedList<Node> kMerge(LinkedList<LinkedList<Node>> kLists) {               int heapSize = kLists.size();               Node[] heap = new Node[heapSize + 1];                              // 取出K路中每个链表的第一个元素,用来建堆。               for (int i = 1; i <= heapSize; i++)                      heap[i] = kLists.get(i - 1).getFirst();                              buildMaxHeap(heap, heapSize);                              LinkedList<Node> resultList = new LinkedList<Node>();               while (heapSize > 0) {
                     // 将根位置的最小元素取出到结果中。                      Node minNode = heap[1];                      resultList.add(minNode);
                     // 后继为空,则将堆尾元素挪到根位置。                      // 否则将后继元素添加到堆中。                      if (minNode.next == null) {                            heap[1] = heap[heapSize];                            heapSize -= 1;                      }                      else {                            heap[1] = minNode.next;                      }
                     // 根位置的堆性质被破坏,重新恢复。                      minHeapify(heap, heapSize, 1);               }               return resultList;        }
       public static void buildMaxHeap(Node[] heap, int heapSize) {               for (int i = heapSize / 2; i >= 1; i--)                      minHeapify(heap, heapSize, i);        }                public static void minHeapify(Node[] heap, int heapSize, int i) {               int left = 2 * i;               int right = 2 * i + 1;               int min = i;                              if (left <= heapSize && heap[left].value < heap[i].value)                      min = left;               if (right <= heapSize && heap[right].value < heap[min].value)                      min = right;                              if (min != i) {                      Node tmp = heap[i];                      heap[i] = heap[min];                      heap[min] = tmp;                      minHeapify(heap, heapSize, min);               }        }                public static LinkedList<Node> createList(int... values) {               LinkedList<Node> list = new LinkedList<Node>();               Node preNode = null;               for (int value : values) {                      Node node = new Node();                      node.value = value;                      if (preNode != null)                            preNode.next = node;                      list.add(node);                      preNode = node;               }               return list;        }         }

效率分析:
堆的大小为K,调用buildMaxHeap()建堆花费KlgK。剩余元素为N - K个。 每次取出根元素,放入后继元素后,调用maxHeapify()保持堆性质花费lgK。 所以总的时间为KlgK + (N - K)lgK = NlgK。