文件名称:chat-data:用于NLP用途的Python脚本下载和处理电影脚本数据
文件大小:5KB
文件格式:ZIP
更新时间:2024-05-18 05:28:43
Python
聊天数据 用于nlp用途的Python脚本,用于下载和处理电影脚本数据。 创建此脚本的目的是从imsdb.com下载开放的电影脚本,其目的是使用数据来训练基于nlp的深度学习应用程序以用于教育目的。 尚未完成,到目前为止,它仅下载所有原始脚本,尚未实现对话解析。 即将到来。 ##依赖关系: 需要Python 2.7 需要包装BeautifulSoup sudo pip install BeautifulSoup ##用法: 跑步: python main.py 它会照顾其余的人。 如果要删除所有下载的原始数据和临时文件(不触摸train / val / test目录),请运行: python main.py clean
【文件预览】:
chat-data-master
----.gitignore(721B)
----LICENSE(1KB)
----README.md(732B)
----htmlparser.py(1KB)
----downloader.py(5KB)
----main.py(891B)
----utility.py(576B)