文件名称:Conversation_Analysis_Project:理学硕士项目
文件大小:163.76MB
文件格式:ZIP
更新时间:2024-04-20 06:44:28
nlp conversations transcripts msci imperialcollegelondon
硕士项目:对话结构分析+使用播客成绩单的可视化 在此MSci项目中,我们正在研究两种不同视角下的人与人之间的对话结构:通过主题空间的宏观轨迹(由词嵌入的组成部分构建)和一系列微观对话行为。 通过主题空间分析,我们希望构建一个完整的成绩单图形表示形式,以可视化方式讨论主题的演变,并描绘有关给定对话的关键信息。 通过对话分析,我们希望回答“什么使对话有趣?”这一问题。 使用的密钥库:sklearn,torch,gensim,nltk,spacy,scipy,pandas,networkx 使用的关键方法 1)关键字提取 关键字和短语,使用TopicRank的PKE实现。 名词,将spacy POS标记器与en_core_web_sm预训练的统计模型一起使用。 Bigrams和Trigrams,使用NLTK实现的“并置查找器”。 2)主题空间建设 使用GoogleNews-vectors