文件名称:文本分析项目
文件大小:148KB
文件格式:ZIP
更新时间:2024-03-16 17:36:10
Python
德语句子的自动复杂度评估 团队成员 里奥·阮·拉乌尔·贝格·康拉德·斯特劳布·蒂尔·诺彻 邮件地址 现有代码片段 利用的图书馆 运行代码(稍后将设置主入口点) 下载数据集: python download_data.py 项目状态 数据分析 我们的主要数据源是TextComplexityDE 19数据集( ),其中包含1000个德语句子,由外语学习者在7点Likert量表上标记为A级和B级,其中1表示低复杂度,高可读性句子,而7则相反。 其中900个句子来自23篇德国Wikipedia文章,其余100则来自Leichte Sprache。 数据集中的每个句子至少由5个人标记,数据集中提供了它们的平均评分。 除了复杂性/可读性之外,还收集了句子的可理解性和词汇难度得分。 图:饼图显示(四舍五入的)评级分布。 评级不是平均分配的,因为平均没有句子收到7,而很少有人得到6。在句子的
【文件预览】:
text-analytics-project-master
----.example.env(26B)
----.github()
--------workflows()
----src()
--------utils()
--------main.py(4KB)
--------data()
--------exploration.py(23KB)
----.vscode()
--------extensions.json(158B)
--------settings.json(2KB)
----requirements.txt(296B)
----Pipfile.lock(105KB)
----.idea()
--------misc.xml(292B)
--------workspace.xml(3KB)
--------inspectionProfiles()
--------modules.xml(296B)
--------text-analytics-project.iml(474B)
--------vcs.xml(180B)
----.isort.cfg(52B)
----LICENSE(1KB)
----README.md(8KB)
----Pipfile(817B)
----htmlcov()
--------jquery.ba-throttle-debounce.min.js(731B)
--------index.html(3KB)
--------jquery.hotkeys.js(3KB)
--------keybd_closed.png(112B)
--------tests_sample_test_py.html(6KB)
--------status.json(543B)
--------jquery.min.js(94KB)
--------jquery.tablesorter.min.js(12KB)
--------jquery.isonscreen.js(1KB)
--------coverage_html.js(18KB)
--------_venv_lib_python3_7_site-packages__virtualenv_py.html(35KB)
--------keybd_open.png(112B)
--------style.css(11KB)
----.pre-commit-config.yaml(952B)
----tests()
--------sample_test.py(310B)
--------__init__.py(0B)
----.gitignore(413B)