文件名称:nlp-course:自动文字处理课程
文件大小:12.11MB
文件格式:ZIP
更新时间:2024-06-05 15:29:44
JupyterNotebook
自动文字处理 埃梅里亚诺夫·安东(Emelyanov Anton) 电子邮件: 电报:@king_menin 讲课 实践 在家工作 第1课(4月21日) 简介:自动文字处理的问题及其解决的基本方法。 标记化,形态分析。 序列标记 正则表达式,去词性化,POS标记,形态分析。 从模板生成文本。 从文本中提取电话号码。 第2课(4月28日) 专题建模 专题建模和集合可视化的应用。 分类。 馆藏主题分析 第3课(5月12日) 分布式语义。 研究构建词向量的方法。 应用词嵌入。 会议4(5月26日) 神经网络。 使用神经网络对文本进行分类和生成。 检索命名实体。 4月21日 本课程的数据在以下文件夹中: 第1 : 第2课: , 练习,作业: 所需的Python库: nltk; 安装nltk之后,您需要从Python3命令行调用命令 import n
【文件预览】:
nlp-course-master
----sem 1()
--------sem1.ipynb(62KB)
--------positive.txt(664KB)
--------negative.txt(623KB)
--------sem1 solved.ipynb(61KB)
----lecture 5. distibutive semantic()
--------distributive semantic.pdf(1.49MB)
----lecture 2. morphology()
--------morphology.pdf(986KB)
----hw2()
--------hw2.ipynb(15KB)
----README.md(8KB)
----hw1()
--------hw1.ipynb(14KB)
----lecture 3. topic modeling()
--------topic modeling.pdf(1.04MB)
----lecture 4. classification()
--------classification.pdf(1.24MB)
----sem 2()
--------news.csv(12.73MB)
--------classification.ipynb(47KB)
--------topic_modeling.ipynb(2.52MB)
--------stopwords.txt(1KB)
----sem 4()
--------4_RU_FNN_CNN.ipynb(132KB)
--------5_LM.ipynb(28KB)
----hw3-4()
--------hw3-4.ipynb(9KB)
----sem 3()
--------.ipynb_checkpoints()
--------ds.ipynb(195KB)
----lecture 1. intro to nlp()
--------intro.pdf(1.16MB)
----lecture 6. neural networks in nlp()
--------neural networks on nlp.pdf(2.04MB)