NLP--项目:NLP-工作簿和示例代码

时间:2024-03-07 18:14:21
【文件属性】:

文件名称:NLP--项目:NLP-工作簿和示例代码

文件大小:6.64MB

文件格式:ZIP

更新时间:2024-03-07 18:14:21

JupyterNotebook

NLP项目-Quora问题分类 1.使用python操作文本,文件和pdf 2.使用NLP进行文本格式化-python 3.使用NLP进行Quora问题分类-神经网络 深度学习,文本挖掘,自然语言处理。 使用Spacy和NLTK进行文本数据预处理(计数向量化,标记化,词干和词法化)。 使用LDA和NMF深度学习库执行主题建模和主题标记。 使用gridSearch来查找具有优化参数值(n个分量,学习衰减,学习偏移和max-iter)的最佳LDA模型。在标记最好的LDA模型输出数据集上实施有监督的学习(对数似然评分:-2823614.416,模型困惑:3469.486)。 LinearSVC模型的分类精度为0.856。 4.火腿和垃圾邮件分类


【文件预览】:
NLP---Projects-master
----NLP-master-code()
--------01 - Decision making.ipynb(32KB)
--------Manipulating text files.ipynb(26KB)
--------Text classification session 1.ipynb(34KB)
--------Time Series and Autoregressive Integrated Moving Average (ARIMA) models.ipynb(527KB)
--------master_data()
--------Topic modelling using NMF (Part B).ipynb(61KB)
--------Tokenisation, named entity recognition, noun chunks and visualisation.ipynb(46KB)
--------Machine learning training and testing using scikit-learn.ipynb(41KB)
--------Loading and cleaning data.ipynb(83KB)
--------Stemming.ipynb(5KB)
--------Working with pdf files.ipynb(115KB)
--------Topic modelling using LDA (Part A).ipynb(504KB)
--------README.md(206B)
--------Text feature extraction using TFIDF.ipynb(29KB)
--------Lemmatisation and POS tagging.ipynb(44KB)
--------Simple example of text feature extraction concept.ipynb(11KB)
--------Rule and phrase matching.ipynb(29KB)
--------readme.md(1B)
--------Regular Expressions.ipynb(30KB)
--------Formatting strings.ipynb(10KB)
--------Numbers, text and dates.ipynb(32KB)
----NLP-Basics()
--------NLP_CA1_L00150833_shyam_krishnan.ipynb(78KB)
--------README.md(1B)
--------Project-Gutenberg.txt(397KB)
----practice-test-1()
--------Test 1.ipynb(13KB)
--------OnePage.txt(562B)
--------nlp_environment.yml(228B)
--------A_Midsummer_Night.pdf(249KB)
----README.md(846B)
----NLP-Quora-Neural-Network()
--------AI2_CA2_Q2_L00150833_shyam-krishnan.ipynb(39KB)
--------AI2_CA2_Q1_L00150833_shyam-krishnan.ipynb(138KB)
--------quora_supervised.csv(14.09MB)
--------readme.md(273B)

网友评论