PAT甲级题分类汇编——理论

时间:2025-01-03 12:05:26

本文为PAT甲级分类汇编系列文章。

理论这一类,是让我觉得特别尴尬的题,纯粹是为了考数据结构而考数据结构。看那Author一栏清一色的某老师,就知道教数据结构的老师的思路就是和别人不一样。

题号 标题 分数 大意 Author
1051 Pop Sequence 25 判断一个序列是否是pop序列 CHEN, Yue
1052 Linked List Sorting 25 链表排序 CHEN, Yue
1057 Stack 30 一个有中位数功能的stack CHEN, Yue
1074 Reversing Linked List 25 分段逆转链表 CHEN, Yue
1089 Insert or Merge 25 判断插入排序或归并排序 CHEN, Yue
1097 Deduplication on a Linked List 25 链表去重 CHEN, Yue
1098 Insertion or Heap Sort 25 判断插入排序或堆排序 CHEN, Yue

好几道题在上MOOC的时候就在数据结构题集里面做过,有1051、1074和1089。还有1098,是之前做merge那道的时候想一并做的,但后来因为merge花了太多时间就跳过了。

这次讲1074、1098、1051和1057 4道题。没错,不按题号顺序。

1074:

这可能是我做的第一道PAT题,也可能是第一道卡住的题。其实,所有用5位整数来模拟链表的题,好像都必须创建100000大小的数组,直接寻址才能跑进时间限制, std::map 是不行的。不过呢,如果我一开始是用C做的,肯定就直接建数组了,也就没有后面的问题了。

这道题的讲解在数据结构课程里有。

因为是早期作品,所以代码长得比较尴尬,懒得改了,我想睡觉。

 #include <iostream>
#include <vector>
#include <utility>
#include <algorithm>
#include <type_traits>
#include <stack>
#include <iomanip> struct Node
{
int address;
int data;
int next;
}; int main(int argc, char const *argv[])
{
int first, n, k;
std::cin >> first >> n >> k;
std::vector<Node> data(n);
for (int i = ; i != n; ++i)
std::cin >> data[i].address >> data[i].data >> data[i].next; decltype(data) list;
int address = first;
for (int i = ; i != n; ++i)
{
auto pos = std::find_if(std::begin(data), std::end(data), [address](const Node& node) {
return node.address == address;
});
list.emplace_back(*pos);
address = pos->next;
if (address == -)
break;
}
n = list.size(); auto begin = list.begin();
auto end = begin + (list.end() - begin) / k * k;
for (; begin != end; begin += k)
{
std::stack<Node> stack;
for (auto iter = begin; iter != begin + k; ++iter)
stack.push(*iter);
for (auto iter = begin; iter != begin + k; ++iter)
{
*iter = stack.top();
stack.pop();
}
}
for (int i = ; i != n - ; ++i)
list[i].next = list[i + ].address;
list[n - ].next = -; std::cout << std::setfill('');
for (auto& node : list)
{
std::cout << std::setw() << node.address << ' ';
std::cout << std::setw() << node.data << ' ';
if (node.next == -)
{
std::cout << "-1";
break;
}
std::cout << std::setw() << node.next << std::endl;
} return ;
}

1098:

它的兄弟题目1089在数据结构课程中讲过,包括这道题中也用到的判断插入排序的方法。

 #include <iostream>
#include <vector>
#include <algorithm> int main()
{
int size;
std::cin >> size;
std::vector<int> original(size);
std::vector<int> partial(size);
for (auto& i : original)
std::cin >> i;
for (auto& i : partial)
std::cin >> i; int cur = ;
for (; cur != size && partial[cur] >= partial[cur - ]; ++cur)
;
bool insertion = true;
for (auto i = cur; i != size; ++i)
if (partial[i] != original[i])
{
insertion = false;
break;
} if (insertion)
{
std::cout << "Insertion Sort" << std::endl;
int insert = partial[cur];
for (--cur; cur >= ; --cur)
if (partial[cur] > insert)
partial[cur + ] = partial[cur];
else
break;
partial[cur + ] = insert;
}
else
{
std::cout << "Heap Sort" << std::endl;
int cur = size - ;
auto top = partial[];
for (; cur >= ; --cur)
if (partial[cur] <= top)
break;
if (cur >= )
{
std::pop_heap(partial.begin(), partial.begin() + cur + );
partial[cur] = top;
}
}
auto end = partial.end() - ;
for (auto iter = partial.begin(); iter != end; ++iter)
std::cout << *iter << ' ';
std::cout << *end;
}

其实这道还要稍微简单一点,因为那道题要自己写merge,这道题的heap可以用标准库。<algorithm> 提供了 std::pop_heap 等函数用于堆操作。至于查看堆顶元素,把起始迭代器解引用就好,标准库没有给。

BTW,建堆的操作是O(N)的,证明起来挺组合数学的。

还有呢,我感觉这两道题贼尴尬。

1051:

判断一个序列是不是一个stack中pop出来的序列。

 #include <iostream>
#include <vector>
#include <stack> class Stack : public std::stack<int>
{
using super = std::stack<int>;
public:
explicit Stack(int _cap)
: capacity_(_cap)
{
;
}
void push(const int& _data)
{
if (size() == capacity_)
throw ;
super::push(_data);
}
private:
int capacity_;
}; void check(int _cap, const std::vector<int>& _data)
{
Stack stack(_cap);
int pushed = ;
for (auto i : _data)
{
if (stack.empty())
{
stack.push(++pushed);
}
if (stack.top() < i)
{
for (int j = pushed + ; j <= i; ++j)
stack.push(j);
pushed = i;
}
if (stack.top() == i)
{
stack.pop();
continue;
}
if (stack.top() > i)
throw ;
}
} int main()
{
int m, n, k;
std::cin >> m >> n >> k;
std::vector<int> data(n);
for (int i = ; i != k; ++i)
try
{
for (int j = ; j != n; ++j)
std::cin >> data[j];
check(m, data);
std::cout << "YES" << std::endl;
}
catch(...)
{
std::cout << "NO" << std::endl;
} return ;
}

题目不难,这里把代码贴出来,是想作个错误示范。算法本身是正确的,能AC,但是设计是不好的:标准库中的容器类不是用来作基类的,因为其析构函数非虚,我写的 Stack 类直接继承 std::stack<int> 是不好的,尽管在这个类设计中,子类的subclass不需要析构,而且整个程序没有作什么派生类到基类的指针转换。我的本意是想实现adapter,为了偷懒就直接公有继承,理应在 Stack 类中包装一个 std::stack<int> 实例。在工程中,公有继承标准库容器就是错误的。

1057:

这次不按题号讲,就是因为这道题要压轴。

初看,不就一个stack和中位数吗,两个我都会写,放到一起我也会写。然后我就写了第一个版本,做了一个 std::stack<int> 的adapter,提供了push、pop、median操作,其中median是把stack拷贝、排序、寻址中位数。感觉很好,样例也过了,想着一遍AC。

 #include <iostream>
#include <string>
#include <vector>
#include <algorithm> class Stack
{
public:
Stack() = default;
void push(int i)
{
stack.push_back(i);
}
void pop()
{
if (stack.empty())
std::cout << "Invalid";
else
{
std::cout << stack.back();
stack.pop_back();
}
std::cout << std::endl;
}
void median()
{
if (stack.empty())
std::cout << "Invalid";
else
{
auto temp = stack;
std::sort(temp.begin(), temp.end());
int m = ;
if (temp.size() % )
m = temp[(temp.size() - ) / ];
else
m = temp[temp.size() / - ];
std::cout << m;
}
std::cout << std::endl;
}
private:
std::vector<int> stack;
}; int main()
{
int count;
std::cin >> count;
Stack stack;
for (int i = ; i != count; ++i)
{
std::string instr;
std::cin >> instr;
if (instr == "Push")
{
int i;
std::cin >> i;
stack.push(i);
}
else if (instr == "Pop")
{
stack.pop();
}
else
{
stack.median();
}
}
}

然而并没有。5个case,3个超时。

是 std::cin 读取字符串太慢了吗?换成C的输入输出,还有2个case超时。

然后我想到输入数据有个比较小的范围是有用的,就建了个数组,写了个乱七八糟的访问控制来防止每次遍历都把每个元素访问一遍。没用,超时。

我意识到线性结构不能解决这个问题,不然也对不起这30分了。于是我就想到用 std::map 来存储。先放代码:

 #include <iostream>
#include <string>
#include <stack>
#include <map> class Median
{
public:
Median() = default;
int get()
{
return median;
}
void insert(int i)
{
if (median_count == )
{
median = i;
median_count = ;
}
else if (i < median)
++small[i], ++small_count;
else if (i > median)
++large[i], ++large_count;
else
++median_count;
adjust();
}
void erase(int i)
{
if (i < median)
{
--small[i], --small_count;
if (small[i] == )
small.erase(i);
}
else if (i > median)
{
--large[i], --large_count;
if (large[i] == )
large.erase(i);
}
else
--median_count;
adjust();
}
private:
std::map<int, int, std::greater<int>> small;
int small_count = ;
std::map<int, int> large;
int large_count = ;
int median;
int median_count = ;
void small_to_median()
{
median = small.begin()->first;
median_count = small.begin()->second;
small.erase(small.begin());
small_count -= median_count;
}
void large_to_median()
{
median = large.begin()->first;
median_count = large.begin()->second;
large.erase(large.begin());
large_count -= median_count;
}
void median_to_small()
{
small[median] = median_count;
small_count += median_count;
}
void median_to_large()
{
large[median] = median_count;
large_count += median_count;
}
void adjust()
{
if (median_count == )
{
if (small_count < large_count)
large_to_median();
else if (small_count)
small_to_median();
}
else if (small_count + median_count < large_count)
{
median_to_small();
large_to_median();
}
else if (small_count >= median_count + large_count)
{
median_to_large();
small_to_median();
}
}
}; class Stack
{
public:
Stack() = default;
void push(int i)
{
stack_.push(i);
median_.insert(i);
}
void pop()
{
if (stack_.empty())
std::cout << "Invalid";
else
{
int i = stack_.top();
stack_.pop();
std::cout << i;
median_.erase(i);
}
std::cout << std::endl;
}
void median()
{
if (stack_.empty())
std::cout << "Invalid";
else
{
std::cout << median_.get();
}
std::cout << std::endl;
}
private:
std::stack<int> stack_;
Median median_;
}; int main()
{
int count;
std::cin >> count;
Stack stack;
for (int i = ; i != count; ++i)
{
std::string instr;
std::cin >> instr;
if (instr == "Push")
{
int i;
std::cin >> i;
stack.push(i);
}
else if (instr == "Pop")
stack.pop();
else
stack.median();
}
}

这个算法挺复杂的。客户维护一个 Stack 实例,它维护一个 Median 实例,两个都是我自己写的类。Median 中包含两个 std::map<int, int> 实例,分别储存比中位数小的和比中位数大的数。核心算法是 Median::adjust() ,它通过调整两边内容,维护中位数的正确性。不想细说了,看代码吧,只涉及到 std::map 的一些基本操作。

因为两次调整之间只有一个操作,所以可以保证调整一次就好了。

值得吐槽的一点是,C++的输入输出在这道题中比C慢了100ms。然而,算法不对,输入输出再快,也要超时。PAT好像没什么卡输入输出时间的题,毕竟世上除了C和C++还有好多编程语言,要考虑它们的感受。

写完了发现其他博客里没有用这么烦的方法,好像用了什么树状数组,我不会。

 try
{
learn_queue.push("树状数组");
}
catch(...)
{
std::cout << "快去睡觉" << std::endl;
} --------------------------------------------------------------------------------
快去睡觉
Program exited with code ...

正好提到树了,下一篇就写树吧。