【机器学习/自然语言处理】全唐诗,预处理可直接用于机器学习

时间:2023-05-26 09:00:29
【文件属性】:

文件名称:【机器学习/自然语言处理】全唐诗,预处理可直接用于机器学习

文件大小:5.7MB

文件格式:ZIP

更新时间:2023-05-26 09:00:29

机器学习 自然语言处理 全唐诗

数据来源[郑州大学全唐诗库](http://www16.zzu.edu.cn/qts/),数据预处理去掉了诗歌文本中的诗人名字。 这是因为很多诗歌有多位作者,因此在每句话的后面都注解了作者的名字。但是对于机器学习,或者对于机器来说,无法分辨这些到底是作者名字,还是正式的诗句。


【文件预览】:
tang.csv
tang.md

网友评论