文件名称:【机器学习/自然语言处理】全唐诗,预处理可直接用于机器学习
文件大小:5.7MB
文件格式:ZIP
更新时间:2023-05-26 09:00:29
机器学习 自然语言处理 全唐诗
数据来源[郑州大学全唐诗库](http://www16.zzu.edu.cn/qts/),数据预处理去掉了诗歌文本中的诗人名字。 这是因为很多诗歌有多位作者,因此在每句话的后面都注解了作者的名字。但是对于机器学习,或者对于机器来说,无法分辨这些到底是作者名字,还是正式的诗句。
【文件预览】:
tang.csv
tang.md