【文件属性】:
文件名称:nlp:此存储库记录了我的NLP旅程
文件大小:2.18MB
文件格式:ZIP
更新时间:2021-02-03 15:19:27
nlp data-science machine-learning ai deep-learning
NLP-教程
存储库,以显示NLP如何解决实际问题。 包括源代码,数据集和NLP的最新技术
数据扩充
一般
文字预处理
部分
小节
描述
故事
代币化
子词标记化
代币化
词标记化
代币化
句子标记化
词性
合法化
抽干
停用词
词组识别
拼写检查
基于词典
Peter Norvig算法
基于词典
符咒
机器翻译
统计机器翻译
机器翻译
注意
字符串匹配
模糊的
文字表示
部分
小节
研究实验室
故事
资源
传统方法
词袋(BoW)
潜在语义分析(LSA)和潜在狄利克雷分配(LDA)
角色等级
字符嵌入
纽约大学
词级
负采样和分层Softmax
Word2Vec,GloVe,fastText
上下文化词向量(CoVe)
销售队伍
拼写遗忘(单词)嵌入
脸书
语言模型(ELMo)的嵌入
AI2
上下文字符串嵌入
Zalando研究
句子等级
跳过思路
推断
快速思考
谷歌
通用句(GenSen)
变压器的双向编码器表示(BERT)
谷歌
生成式预训练(GPT)
开放AI
自治神经网络(SGNN)
谷歌
多任务深度神经网络(MT-DNN)
微软
生成式预
【文件预览】:
nlp-master
----aion()
--------helper()
--------embeddings()
--------util()
----README.md(24KB)
----sample()
--------nlp-skip_thoughts.ipynb(44KB)
--------nlp-text_summarization_extractive.ipynb(19KB)
--------nlp-word_mover_distance.ipynb(11KB)
--------nlp-stop_words.ipynb(14KB)
--------nlp_lemmatization.ipynb(7KB)
--------nlp-model_interpretation.ipynb(7.14MB)
--------nlp-embeddings-sentence-infersent.ipynb(6KB)
--------nlp-lsa_lda.ipynb(11KB)
--------nlp-part_of_speech.ipynb(9KB)
--------nlp-3_basic_distance_measurement_in_text_mining.ipynb(17KB)
--------nlp-sentence_tokenization.ipynb(11KB)
--------nlp-bag_of_words.ipynb(17KB)
--------nlp-stemming.ipynb(7KB)
--------nlp-embeddings-word-cove.ipynb(6KB)
--------embeddings()
--------util()
--------nlp-model_interpretation_anchor.ipynb(2.79MB)
--------nlp-model_interpretation-201808.ipynb(387KB)
--------nlp-character_embedding.ipynb(27KB)
--------nlp-named_entity_recognition.ipynb(10KB)
--------nlp-model_interpretation_shap.ipynb(392KB)
--------resources()
--------preprocessing()
--------nlp-word_embedding.ipynb(37KB)
--------nlp-word_tokenization.ipynb(13KB)
--------nlp-embeddings-sentence-elmo.ipynb(25KB)
--------nlp-distance-edit_distance.ipynb(1KB)
----.gitignore(5B)