文件名称:text-analysis
文件大小:1.93MB
文件格式:ZIP
更新时间:2024-05-25 09:20:06
HTML
用于分析文本的脚本
基于情感,情感,主观性,方向和肤色。
Lexicons使用
使用,使用脚本将这些词典解析并编译为文件:
总字数: 14,852
有感情的词: 4,463(30.0%)
有感情的词: 10,916(73.5%)
带有主观性的单词: 6,886(46.4%)
定向词为2,192(14.8%)
有颜色的单词: 5,404(36.4%)
如何分析文字
下载文本,例如
使用gutenberg_text.py
【文件预览】:
text-analysis-master
----texts()
--------alice_in_wonderland.txt(160KB)
--------the_hobbit.html(517KB)
--------moby_dick.txt(1.2MB)
----data()
--------colors.json(725B)
--------categories.json(330B)
----output()
--------.keep(0B)
----visualization()
--------visualization.pde(3KB)
--------sketch.properties(48B)
----lexicons_external()
--------subjectivity_clues_hltemnlp05()
--------inquirerbasic.csv(2.78MB)
--------NRC-Emotion-Lexicon-v0.92()
--------opinion-lexicon-English()
--------NRC-Colour-Lexicon-v0.92()
----analyze_data.py(3KB)
----get_data.py(2KB)
----compile_lexicons.py(7KB)
----.gitignore(84B)
----README.md(3KB)
----report_data.py(1KB)
----parsers()
--------gutenberg_text.py(3KB)
--------ae_lib_html.py(3KB)
----lexicons()
--------lexicons_compiled.csv(508KB)