文件名称:NLP:适合所有人的自然语言处理
文件大小:67.54MB
文件格式:ZIP
更新时间:2024-06-16 20:50:05
nlp data-science natural-language-processing tutorial binder
适合所有人的自然语言处理 Data For Science的在线系列网络研讨会的代码和幻灯片: : 。 在活页夹中运行代码: 在线社交平台的兴起导致以博客,帖子,推文,维基页面等形式出现的文字激增。 大量的新数据为探索多种形式的自然语言提供了独特的机会,既可以作为自动从书面文本中提取信息的方式,也可以作为人为产生看起来自然的文本的方式。 在本课程中,我们从头开始向观众介绍自然语言处理。 通过仅使用普通Python和numpy的编码示例来介绍和解释每个概念。 通过这种方式,与会人员不仅可以学习如何使用特定的NLP库,还可以深入了解底层的概念和技术。 日程 1.文字表示 代表单词和数字 使用一键编码 实施词袋 应用停用词 了解TF / IDF 了解词干 2.主题建模 在文档中查找主题 执行显式语义分析 了解文档聚类 实施潜在语义分析 实现非负矩阵分解 3.情绪分析 量化言语和情感 使
【文件预览】:
NLP-master
----2. Topic Modeling.ipynb(525KB)
----data()
--------Apple-Twitter-Sentiment-DFE.csv(799KB)
--------positive-words.txt(22KB)
--------negative-words.txt(45KB)
--------googlebooks-eng-all-1gram-20120701-a.gz(3.79MB)
--------polyglot-en.pkl(26.05MB)
--------vader_lexicon.txt(417KB)
--------mary.pickle(621B)
--------table_langs.dat(2KB)
--------D4Sci_logo_full.png(71KB)
--------text8.gz(31.66MB)
--------questions-words.txt(590KB)
--------nltk_stopwords.txt(936B)
--------D4Sci_logo_ball.png(45KB)
----1. Text Representation.ipynb(240KB)
----d4sci.mplstyle(997B)
----LICENSE(1KB)
----4. Applications.ipynb(4.87MB)
----3. Sentiment Analysis.ipynb(22KB)
----requirements.txt(90B)
----.gitignore(1KB)
----README.md(2KB)
----slides()
--------NLP.pdf(5.19MB)