聊天机器人:这是使用Transformer神经网络架构和Reddit Comments数据集制作的聊天机器人

时间:2024-03-13 04:19:12
【文件属性】:

文件名称:聊天机器人:这是使用Transformer神经网络架构和Reddit Comments数据集制作的聊天机器人

文件大小:681KB

文件格式:ZIP

更新时间:2024-03-13 04:19:12

Python

聊天机器人 这是使用Transformer神经网络架构和Reddit Comments数据集制作的聊天机器人 您可以通过从此处下载数据集后执行一些预处理来训练自己的模型和令牌生成器: : 这是16000个vocab大小的标记器和仅仅一个月的数据的结果,当仅训练20个纪元时,该数据就更少了,但是,结果仍然令人满意,但是更多的数据和100,000的vocab大小会产生更好的结果。 此外,这些数据还具有次要信息,因此可以制作出具有特定类型的聊天机器人,例如科幻,喜剧甚至量子物理学。 请注意,仅使用来自特定子Reddit的数据进行培训将导致像聊天机器人这样的人性化,这是该子Reddit主题中的专家。 如果您想使用16000 vocab大小标记器和1个月的数据尝试训练20个模型的模型,请从此处下载权重: ://drive.google.com/file/d/1CUBEImjsBrVzby


【文件预览】:
Chat-bot-master
----transformer_reddit_tokenizer2.pickle(6.53MB)
----Reddit_Transformer_ChatBot.py(13KB)
----README.md(1KB)

网友评论