language-detection:语言检测

时间:2024-07-13 21:38:22
【文件属性】:

文件名称:language-detection:语言检测

文件大小:1.3MB

文件格式:ZIP

更新时间:2024-07-13 21:38:22

Python

语言检测 用python编写的语言检测程序 分类器 朴素贝叶斯分类器。 特征 特征是文本中的二元组。 模型 使用 n-gram 包的预训练模型 用法 python src/language_detector.py test/test.txt 语言支持 70 个内置语言配置文件 南非荷兰语 阿拉贡人 ar 阿拉伯语 阿斯图里亚斯 是白俄罗斯人 br 布列塔尼 加泰罗尼亚语 bg 保加利亚语 孟加拉语 cs 捷克语 威尔士语 丹麦语 德国人 el 希腊语 zh 英语 es 西班牙语 和爱沙尼亚语 欧盟巴斯克语 波斯语 芬兰语 fr 法语 ga 爱尔兰语 加利西亚语 古吉拉特语 他希伯来语 你好印地语 hr 克罗地亚语 海天 胡匈牙利语 id 印度尼西亚语 是冰岛语 意大利语 日本人 公里 高棉语 卡纳达语 ko 韩文 立陶宛语 lv 拉脱维亚语 mk 马其顿语 毫升马拉雅拉姆语 马拉地语先生


【文件预览】:
language-detection-master
----test()
--------test.txt(930B)
----languages()
--------cy(56KB)
--------et(69KB)
--------mr(36KB)
--------tl(19KB)
--------nl(24KB)
--------th(50KB)
--------ro(61KB)
--------eu(53KB)
--------zh-TW(27KB)
--------sk(30KB)
--------an(48KB)
--------ar(34KB)
--------be(84KB)
--------sl(63KB)
--------ne(33KB)
--------is(76KB)
--------te(39KB)
--------he(35KB)
--------kn(39KB)
--------ko(300KB)
--------ast(58KB)
--------bg(33KB)
--------hi(35KB)
--------ca(67KB)
--------gl(56KB)
--------de(27KB)
--------el(34KB)
--------en(27KB)
--------bn(40KB)
--------sq(23KB)
--------fr(26KB)
--------ga(55KB)
--------br(57KB)
--------hr(25KB)
--------ml(39KB)
--------so(16KB)
--------ru(37KB)
--------oc(50KB)
--------tr(28KB)
--------ta(32KB)
--------pt(24KB)
--------fa(28KB)
--------no(25KB)
--------pa(29KB)
--------lt(66KB)
--------sr(70KB)
--------ja(25KB)
--------sv(27KB)
--------yi(58KB)
--------cs(32KB)
--------mk(29KB)
--------km(145KB)
--------lv(73KB)
--------zh-CN(27KB)
--------gu(21KB)
--------uk(33KB)
--------ht(38KB)
--------it(22KB)
--------es(25KB)
--------da(25KB)
--------vi(66KB)
--------sw(17KB)
--------fi(25KB)
--------mt(58KB)
--------af(21KB)
--------id(21KB)
--------ms(51KB)
--------pl(30KB)
--------ur(28KB)
--------hu(31KB)
----src()
--------language_detector.py(1KB)
----README.md(1KB)

网友评论