文件名称:speech-acts-classifier:基于Stanford CoreNLP和Weka的文本语音行为分类器
文件大小:27KB
文件格式:ZIP
更新时间:2024-05-21 06:14:42
Clojure
言语行为分类器 解析自然语言并对句子的进行分类的实验。 当机器试图理解环境中的句子含义(例如聊天会话)时,这尤其重要,在该环境中缺少标点符号是很常见的。 该项目对三种言语行为进行了分类:陈述,问题和表达。 表达是指表达说话者心理状态的言语行为。 例如,“谢谢”,“好”,“大声笑”。 解析和注释是通过库周围的完成的。 分类使用 java库。 在的以下句子特征上训练了随机森林模型: 句子长度 句子中名词的数量(NN,NNS,NNP,NNPS) 如果句子以名词或形容词结尾(NN,NNS,NNP,NNPS,JJ,JJR,JJS) 如果句子以动词开头(VB,VBD,VBG,VBP,VPZ) wh,(如谁,什么)标记(WDT,WRB,WP,WP $)的计数 有关陈述和问题的培训数据已从Answers.com上刮下来,然后手工清理。 表情是手工输入的。 〜200个陈述 〜200个问题 〜
【文件预览】:
speech-acts-classifier-master
----.gitignore(84B)
----README.md(3KB)
----resources()
--------speech-acts-input-all.arff(10KB)
--------answers-input-1.txt(7KB)
--------speech-acts-input.arff(5KB)
--------expressives-input-2.txt(253B)
--------answers-input-2.txt(5KB)
--------questions-input-1.txt(4KB)
--------questions-input-2.txt(4KB)
--------speech-acts-tests.arff(5KB)
--------expressives-input-1.txt(286B)
----project.clj(493B)
----test()
--------speech_acts_classifier()
----LICENSE(11KB)
----src()
--------speech_acts_classifier()
----doc()
--------intro.md(120B)