文件名称:translation-olympics:百度,必应,谷歌,搜狗和Yandex的汉英和汉英翻译质量的定量比较
文件大小:142KB
文件格式:ZIP
更新时间:2024-06-04 14:42:55
Python
翻译奥运 该存储库正在非常积极的开发中。 随着实验的进行,期望经常更新。 这是一组脚本,用于定量评估和比较百度,必应,谷歌,搜狗和Yandex Translate的质量。 该代码是用Python 3(不支持Python 2)编写的,并且依赖于Selenium的Python绑定来抓取翻译数据。 测试将使用Datum英汉平行语料库的子集进行,该子集可在2017年WMT会议上使用。 内容:-到目前为止的结果-实验步骤-实验完成后-当前状态和初步发现-后续步骤 剧透警报:到目前为止的结果 我尚未分析网站的中英文翻译质量,但是Bing和Sogou似乎是最好的中英文翻译网站。 Bing的中值翻译质量最高,并且方差和IQR令人满意,这表明其翻译非常可靠并且通常相当不错。 搜狗的中位数相当高,方差最低,第25个百分位数也最高,这意味着其翻译非常一致,通常非常好,而且几乎从不差。 Bing的平均
【文件预览】:
translation-olympics-master
----baidu.png(16KB)
----olympics.py(15KB)
----yandex.png(16KB)
----bing.png(18KB)
----results.txt(2KB)
----README.md(5KB)
----newChinese.txt(16KB)
----boxplot.png(19KB)
----sogou.png(17KB)
----google.png(16KB)
----bleu.py(2KB)
----05-29EngOut.txt(89KB)
----newEnglish.txt(17KB)
----05-29ChiOut.txt(78KB)