nlpcda:一键中文数据增强包; NLP数据增强,bert数据增强,EDA:pip install nlpcda

时间:2024-02-24 12:01:08
【文件属性】:

文件名称:nlpcda:一键中文数据增强包; NLP数据增强,bert数据增强,EDA:pip install nlpcda

文件大小:528KB

文件格式:ZIP

更新时间:2024-02-24 12:01:08

nlp data-augmentation chinese-data-augmentation nlpcda chinese-eda

NLP中文数据增强一键中文数据增强工具 使用: pip install nlpcda 开源不易,欢迎star :glowing_star: pypi: ://pypi.org/project/nlpcda/ 介绍 一键中文数据增强工具,支持: 经过细节特殊处理,比如不改变年月日数字,尽量保证不改变原文语义。即使改变也能被猜出来、能被猜出来、能被踩出来、能被菜粗来、被菜粗、能菜粗来 计划中的未来内容 增加多线程操作,一键操作 随机噪声注入?随机插入一些字符,太简单实现了。 利用pingyin? 基于Word2Vec,BERT等词向量的词组近距离的替换,MASK替换替换??但是无法控制它生成,以及缺点MASK位置。


【文件预览】:
nlpcda-master
----MANIFEST.in(64B)
----.ignore(28B)
----nlpts.egg-info()
--------PKG-INFO(301B)
--------requires.txt(6B)
--------SOURCES.txt(195B)
--------top_level.txt(6B)
--------dependency_links.txt(1B)
----LICENSE(11KB)
----requirements.txt(62B)
----update.sh(41B)
----setup.py(757B)
----nlpcda.egg-info()
--------PKG-INFO(18KB)
--------requires.txt(33B)
--------SOURCES.txt(760B)
--------top_level.txt(7B)
--------dependency_links.txt(1B)
----README.md(15KB)
----nlpcda()
--------example.py(3KB)
--------tools()
--------data()
--------__init__.py(998B)
--------config.py(446B)

网友评论