flodex:使用NLP分析Tenochtitlan沦陷的两种不同的文字叙述

时间:2024-03-06 06:34:48
【文件属性】:

文件名称:flodex:使用NLP分析Tenochtitlan沦陷的两种不同的文字叙述

文件大小:199KB

文件格式:ZIP

更新时间:2024-03-06 06:34:48

JupyterNotebook

氟dex 使用自然语言处理(NLP)分析泰诺奇蒂特兰沦陷前佛罗伦萨法典(约1560年代)的两种不同的文字叙述。 数据位于.txt文件中,并通过Stanza预训练的英语语言模型进行标记和注释。 然后,将Stanza文档转换为python对象(词典列表),类“ Section”从该对象开始,接受每个转换后的Stanza文档并创建多索引的Pandas数据框。 EDA任务:句子长度,UPOS使用率(%),单词选择,情绪分析(%)


【文件预览】:
flodex-main
----upos.png(43KB)
----share_words.png(37KB)
----README.md(555B)
----flodex.ipynb(169KB)
----sentence_lengths.png(14KB)
----perc_sentiments.png(11KB)

网友评论