文件名称:domain-adaptation-data
文件大小:11KB
文件格式:ZIP
更新时间:2024-06-02 10:02:50
这些数据来自OPUS( )。 来自5个域的数据: 法律(JRC-Acquis),医疗(EMEA),IT(GNOME,KDE,PHP,Ubuntu和OpenOffice),可兰经(Tanzil)和字幕(OpenSubtitles)。 如果您使用任何数据,请引用OPUS,也请链接到单个数据源: 作品: @InProceedings{TIEDEMANN12.463, author = {J\"org Tiedemann}, title = {Parallel Data, Tools and Interfaces in OPUS}, booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)}, year = {20
【文件预览】:
domain-adaptation-data-master
----koran-dev.de.tgz(130B)
----subtitles-dev.de.tgz(130B)
----subtitles-train.en.tgz(134B)
----acquis-train.de.tgz(133B)
----it-dev.de.tgz(130B)
----emea-test.de.tgz(130B)
----koran-test.de.tgz(130B)
----koran-train.de.tgz(133B)
----koran-train.en.tgz(133B)
----acquis-test.de.tgz(130B)
----subtitles-test.de.tgz(130B)
----emea-train.de.tgz(133B)
----acquis-dev.de.tgz(130B)
----koran-dev.en.tgz(130B)
----subtitles-train.de.tgz(134B)
----emea-dev.en.tgz(130B)
----acquis-dev.en.tgz(130B)
----it-train.en.tgz(132B)
----emea-train.en.tgz(133B)
----README.md(4KB)
----subtitles-test.en.tgz(130B)
----it-train.de.tgz(132B)
----it-test.de.tgz(130B)
----koran-test.en.tgz(130B)
----acquis-test.en.tgz(130B)
----.gitattributes(41B)
----it-dev.en.tgz(130B)
----it-test.en.tgz(130B)
----acquis-train.en.tgz(133B)
----emea-dev.de.tgz(130B)
----emea-test.en.tgz(130B)
----subtitles-dev.en.tgz(130B)