文件名称:MDA标记
文件大小:53KB
文件格式:ZIP
更新时间:2024-03-09 16:41:29
Python
MDA_OnlineRegisters 用于在线注册MDA分析的补充材料。 流程编写 SOCC 在标记SOCC语料库之前,我们首先选择了包含700个以上单词的所有注释线程,这是使用dataSelection.py将每个线程存储在单独的文件中完成的。 检索线程后,对数据运行了CORE_cleanup.py脚本,以删除各种数据收集工件。 清除后,在数据集上运行Gimple_Wrapper.py以对Gimple标记线程,之后运行Clarke_Wrapper.py来对Clarke标记文件。 此数据集没有遇到任何问题,并且使用postag_counter.py脚本创建频率矩阵对所有特征进行了计数。 核 对于CORE语料库,运行了CORE_cleanup.py脚本以从数据收集步骤中删除所有html标记和其他工件。 在文件上运行了CORE_rename.py,以为每个文件提供正确的前缀并从文
【文件预览】:
MDA-tagging-master
----postag_counter.py(3KB)
----CORE_rename.py(1KB)
----counts.py(853B)
----csv_combine.py(628B)
----Clarke_Wrapper.py(1KB)
----LICENSE(34KB)
----Clarke_Tagger_2018.txt(182KB)
----dataSelection.py(3KB)
----README.md(3KB)
----CORE_cleanup.py(2KB)
----Gimple_Wrapper.py(2KB)
----columnDrop.py(2KB)