SpaCy语法项目

时间:2024-03-10 08:09:48
【文件属性】:

文件名称:SpaCy语法项目

文件大小:40KB

文件格式:ZIP

更新时间:2024-03-10 08:09:48

Python

SpaCy语法项目 这个想法是用Python 3编写一个可以通过以下命令执行的程序: python program.py text_file (其中text_file是法语的纯文本文件,以utf-8编码),并使用spaCy解析文本,并生成一个名为“动词”的文件,其中包含针对该文本文件中观察到的每个言语引理的一行,其内容如下:信息 : 文本文件中言语引理的出现次数(原始频率) 言词引理本身(动词的不定式形式) 动词补语类型的舍入百分比。 考虑以下UD v2依赖性类型:“ obj”,“ iobj”,“ obl”,“ ccomp”和“ xcomp”。 示例:如果动词“ to say”在语料库中被观察到20次,并且补语类型为“ obj” 12次,则该动词的依赖类型“ obj”的百分比为60。请使用fr_sequoia-ud-目录中包含的dev.txt文件作为示例输入文件。 在输出文件中,


【文件预览】:
syntax-project-with-SpaCy-master
----fr_sequoia-ud-dev.txt(53KB)
----result1.txt(29KB)
----syntax.JPG(21KB)
----README.md(2KB)
----Syntax_work.py(3KB)

网友评论