文件名称:retrieval_based_chatbot
文件大小:2.71MB
文件格式:ZIP
更新时间:2024-04-08 01:01:08
Python
所有基于检索的聊天机器人模型的存储库 该项目需要采取的步骤 第一个想法(这需要更多的修订,因为我们对其进行了更多循环): 收集问题/回答对的小型玩具数据集。 对它们运行基于变压器的模型以查找其嵌入 使用余弦相似度为每个查询找到相关的答案。 i = argmax Cos(Emb_question, Emp_answer) over All answers 资料读取器 使用__iter__方法实现阅读器,以获取至少一对(问题,响应) 运行query_example脚本 该脚本读取一个CSV文件,该文件包含4列,模式,主题,主题和模板(来自AIML文件的数据集)。该脚本加载用于句子嵌入的预训练Bert模型。通过创建查询的语句嵌入来使用该模型,然后使用在softmax层中计算出的语义相似性在数据集中找到最接近的匹配项,并返回匹配的响应。 请按照以下步骤运行脚本。 确保您已设置python虚拟环境
【文件预览】:
retrieval_based_chatbot-master
----.gitignore(2KB)
----requirements.txt(74B)
----data()
--------AIML_QAdataset.csv(4.92MB)
--------subset_AIML_QAdataset_old.csv(36KB)
--------AIML_QAdataset_newer.csv(2.97MB)
--------AIML_QAdataset_simple.csv(154KB)
--------AIML_QAdataset_old.csv(5.43MB)
--------subset_AIML_QAdataset.csv(30KB)
--------AIML_QAdataset_simple_subset.csv(47KB)
----src()
--------pickled_embeddings()
--------chatbot()
----utils_programr()
--------aiml_generator()
--------corpus_creator()
--------csv_tools()
--------pattern_lister()
--------rdf_tools()
--------test_creator()
--------data_creators()
--------README.md(106B)
--------braintree_viewer()
--------test_runner()
--------rdf_lister()
--------botflow()
----utils()
--------test_csv_to_aiml.sh(63B)
--------test.csv(184B)
--------test.aiml(2KB)
--------README.md(816B)
--------csv_to_aiml.py(2KB)
--------test_both_ways.sh(107B)
--------test_aiml_to_csv.sh(63B)
--------README.txt(816B)
--------aiml_to_csv.py(9KB)
--------test2.csv(741B)
----README.md(1KB)