文件名称:fountain:会话系统的自然语言数据增强工具
文件大小:401KB
文件格式:ZIP
更新时间:2024-06-03 06:36:31
natural-language chatbot nlu data-generator conversational-ai
喷泉 Fountain是一种自然语言数据增强工具,可帮助开发人员创建和扩展针对机器学习算法的特定领域聊天机器人培训数据集。 概述。 为了构建更好的AI助手,我们需要更多数据,仅靠更好的模型是不够的。 大多数NLU系统要求输入成千上万的将来用户可能会使用的查询,并注释每个可以识别用户意图的句子段。 通常这是一个繁琐而繁琐的手动过程。 Fountain旨在帮助开发人员简化此过程,并生成大量的培训示例,以简化培训和构建强大的聊天机器人系统的过程。 该工具旨在简化针对不同意图引擎(亚马逊的Alexa,谷歌的API.ai,Facebook的Wit,微软的Luis)构建相同数据集的过程。 目前,该工具会生成与RasaNLU格式兼容的训练数据集。 入门 安装 您可以通过以下方式安装软件包: $ pip install git+git://github.com/tzano/fountain.git
【文件预览】:
fountain-master
----fountain()
--------data_generator.py(9KB)
--------core()
--------__init__.py(86B)
--------data()
--------resources()
--------format()
----requirements.txt(152B)
----Pipfile.lock(17KB)
----.travis.yml(116B)
----tox.ini(199B)
----LICENSE(1KB)
----setup.cfg(451B)
----setup.py(1KB)
----README.md(6KB)
----Pipfile(395B)
----docs()
--------authors.rst(0B)
--------.gitignore(43B)
----tests()
--------test_utterance.py(831B)
--------__init__.py(0B)
--------test_data_generator.py(3KB)
--------test_slot.py(305B)
--------sample.yaml(530B)
----.gitignore(1KB)
----labs()
--------utterances_template_builtin.yaml(71B)
--------generate_utterances.py(990B)
--------__ini__.py(0B)
--------utterances_template.yaml(135B)