NOIP2001 统计单词个数

时间:2024-01-14 21:56:08

题三 统计单词个数(30分)

问题描述
给出一个长度不超过200的由小写英文字母组成的字母串(约定;该字串以每行20个字母的方式输入,且保证每行一定为20个)。要求将此字母串分成k份(1<k<=40),且每份中包含的单词个数加起来总数最大(每份中包含的单词可以部分重叠。当选用一个单词之后,其第一个字母不能再用。例如字符串this中可包含this和is,选用this之后就不能包含th)。
单词在给出的一个不超过6个单词的字典中。
要求输出最大的个数。
输入格式
去部输入数据放在文本文件input3.dat中,其格式如下:
第一行为一个正整数(0<n<=5)表示有n组测试数据
每组的第一行有二个正整数(p,k)
p表示字串的行数;
k表示分为k个部分。
接下来的p行,每行均有20个字符。
再接下来有一个正整数s,表示字典中单词个数。(1<=s<=6)
接下来的s行,每行均有一个单词。
输出格式
结果输出至屏幕,每行一个整数,分别对应每组测试数据的相应结果。

样例
输入:
1
1 3
thisisabookyouareaoh
4
is
a
ok
sab
输出: //说明:(不必输出)
7 // this/isabookyoua/reaoh

【思路】

DP+字符串。

最优划分。设d[i][j]表示把前i个数划分为j段的最大单词数。则有转移方程:

d[i][j]=max(d[i][j],d[k][j-1]+sum[k+1][i]);

  其中sum(s,t)表示st段内的单词数,离线计算。

【代码】

 #include<iostream>
#include<cstring>
using namespace std; const int maxn = +; string expr="";
string words[maxn];
int wordslen[maxn],sum[maxn][maxn];
int d[maxn][maxn];
int p,K,m; int add(int l,int r)
{
int ans=;
if (r->=) ans=sum[l][r-];
bool vis[maxn]={};
for (int i=;i<=m;i++)
{
int qd=r-wordslen[i]+;
if (qd<l) continue;
if (qd==expr.find(words[i],qd))
{
if (vis[qd]) continue;
vis[qd]=;
ans++;
for (int j=;j<=m;j++)
{
int dq=r-wordslen[j];
if (dq==qd)
if (dq==expr.find(words[j],dq))
{
ans--;
break;
}
}
}
}
return ans;
} int main() {
ios::sync_with_stdio(false);
cin>>p>>K;
for(int i=;i<p;i++) {
string s; cin>>s;
expr=expr+s;
}
cin>>m;
for(int i=;i<=m;i++) {
cin>>words[i];
wordslen[i]=words[i].size();
} int len=expr.size();
for(int i=;i<len;i++)
for(int j=i;j<len;j++){
sum[i][j]=add(i,j);
} for(int i=;i<len-;i++)
for(int j=;j<=min(K-,i+);j++)
for(int k=j-;k<i;k++)
if(j==) d[i][j]=sum[][j];
else d[i][j]=max(d[i][j],d[k][j-]+sum[k+][i]);
int ans=;
for(int i=K-;i<len-;i++)
ans=max(ans,d[i][K-]+sum[i+][len-]);
cout<<ans;
return ;
}