AI汉字数据集

时间:2021-08-23 05:28:43
【文件属性】:

文件名称:AI汉字数据集

文件大小:214.1MB

文件格式:GZ

更新时间:2021-08-23 05:28:43

汉字 单字 汉字数据 汉字数据集 汉字数据库

此数据集是3755个常用的汉字。第个汉字包含20种不同的样式。 20种同一汉字放在一个文件夹内,文件夹名称以数字命名。 测试集每个汉字包含6种字体。 百分百好用的数据,象征收5积分。 文件有358M不能够一起上传,test放到了百度云上,在说明文件中可以找到下载地址。 如何通过文件夹名称找到相应编码: 1、从chinese_labels读取 p42 sI42 V\u4e4d 其中: 42是train或test对应的文件夹名称 \u4e4d是Unicode码,注带有\ 2、从汉字Unicode互转得到转换的URL地址 把\u4e4d复制到转换框中->单击Unicode转中文汉字


网友评论

  • 亲测可用 谢谢!
  • 我想问一下,这个数据集怎么用?着急用,希望能得到回复