文件名称:character-type-identification:识别电影脚本中的角色原型
文件大小:1.13MB
文件格式:ZIP
更新时间:2024-04-11 11:12:56
Python
字符类型识别 该存储库包含字符类型标识数据集。 有关更多详细信息,请参见论文 。 档案文件 documents.csv-包含来自document_id, set, script_url, script_file_size, script_word_count, script_start, script_end, wiki_url, wiki_title文档元数据。 summaries.csv-包含wikipedia摘要,格式为document_id, set, summary 。 character_labels.csv-包含格式为document_id, set, character_name, character_type的字符类型注释 download_scripts.py-下载完整脚本。 使用数据集 由于许可问题,完整的脚本未包含在此存储库中。 可以通过运行以下命令将它们下载
【文件预览】:
character-type-identification-master
----character_type_id()
--------character_type_id.py(6KB)
----download_scripts.py(2KB)
----turk()
--------transform_data.py(6KB)
--------README.md(101B)
--------layout.html(17KB)
----summaries.csv(2.58MB)
----documents.csv(136KB)
----character_labels.csv(327KB)
----baseline_models()
--------run_benchmark.py(15KB)
--------README.md(117B)
----LICENSE(1KB)
----.gitignore(2KB)
----README.md(1KB)