公司名/机构名语料库(Company-Names-Corpus)

时间:2022-10-26 13:55:57



向AI转型的程序员都关注了这个号????????????

机器学习AI算法工程   公众号:datayx


公司名语料库(Company-Names-Corpus)

数据大小:480万。

语料来源:多个词典汇总。

数据清洗:已清洗,但仍存有大量badcase。


机构名语料库(Organization-Names-Corpus)

数据大小:110万。

语料来源:多个词典汇总。

数据清洗:已清洗,但仍存有大量badcase。



公司简称、品牌词等(Company-Shorter-Form)

数据大小:28万。

语料来源:多个词典汇总。

数据清洗:已清洗,但仍存有大量badcase。