NLP-Lab-Assignment:NLP实验室作业

时间:2024-04-21 19:21:21
【文件属性】:

文件名称:NLP-Lab-Assignment:NLP实验室作业

文件大小:205KB

文件格式:ZIP

更新时间:2024-04-21 19:21:21

Python

NLP实验室分配 任务 : 在数据集上完成您分配的任务。 这是您的双语语料库或平行语料库。 开发一个python程序来分割Bangla数据集中的句子。 将程序另存为nlp_sent_ .py。 在nlp_sent_ .pdf中写一些关键意见 开发一个python程序来标记Bangla数据集。 将程序另存为nlp_tokenizer_ .py。 在nlp_tokenizer_ .pdf中写一些关键观察 开发一个python程序来完成以下任务:(将程序另存为nlp_histogram_ .py。)。 完成后,我们将提供对并行数据集的访问权限,以便您可以执行以下任务。 从并行语料库中提取以下统计信息: 英方 孟加拉边 语料库大小(以词为单位),不包括标点符号 语料库大小(以字符为单位),不包括空格 平均句子长度(以字为


【文件预览】:
NLP-Lab-Assignment-main
----data()
--------eng_to_bang_data.csv(369KB)
--------ben.txt(697KB)
----src()
--------nlp_tokenizer.py(417B)
--------nlp_histogram.py(4KB)
--------datasets.py(525B)
--------nlp_sent.py(429B)
----README.md(2KB)

网友评论