文件名称:颜色分类leetcode-Factoid-based-Question-Answer-Chatbot:Factoid问答聊天机器人是问答系统的
文件大小:524KB
文件格式:ZIP
更新时间:2024-07-26 17:08:39
系统开源
颜色分类leetcode 回答聊天机器人的事实问题 Factoid 问答聊天机器人是问答系统的简单版本。 它使用信息检索和自然语言处理技术近乎实时地回答用户提出的问题。 Chatbot 能够以 70.16% 的准确率(在斯坦福的 SQuAD 数据集上测量)回答来自各个领域的文章的 Factoid 和 Summarization 问题。 概要 运行机器人: $ python3 P2.py < path_to_article > 例如: $ python3 P2.py dataset/Marvel_Comics.txt 一旦机器人启动并开始运行,它会要求您输入您的问题。 并回答。 方法 这个机器人的架构严格遵循书中描述的架构。 QA系统的主要模块有: 问题处理:在此步骤中,机器人识别其期望的问题类型和答案类型 Passage Retrieval :它使用TF-IDF作为特征生成问题向量和段落向量,计算问题向量和段落向量之间的余弦相似度,返回前3个非常相似的段落。 通过删除停用词和使用 Porter Stemmer 对这一步进行了进一步改进 句子检索:检索段落后,它标记句子并计算问题和句
【文件预览】:
Factoid-based-Question-Answer-Chatbot-master
----testQA.py(3KB)
----.gitignore(1KB)
----DocumentRetrievalModel.py(17KB)
----dataset()
--------Alloy.txt(20KB)
--------Queen_Victoria.txt(35KB)
--------Marvel_Comics.txt(17KB)
--------USB.txt(41KB)
--------Buddhism.txt(76KB)
--------Mammal.txt(20KB)
--------Modern_history.txt(67KB)
--------Anthropology.txt(32KB)
--------Rajasthan.txt(20KB)
--------Windows_8.txt(39KB)
--------New_York_City.txt(91KB)
--------testingData.json(1.17MB)
--------Ataturk.txt(76KB)
----ProcessedQuestion.py(8KB)
----LICENSE(1KB)
----DateExtractor.py(3KB)
----README.md(8KB)
----.idea()
--------misc.xml(208B)
--------workspace.xml(9KB)
--------vcs.xml(180B)
--------bots.iml(398B)
--------modules.xml(260B)
----P2.py(2KB)
----StanfordDataset.py(2KB)