nlp:此存储库记录了我的NLP旅程

时间:2024-02-24 09:06:07
【文件属性】:

文件名称:nlp:此存储库记录了我的NLP旅程

文件大小:2.18MB

文件格式:ZIP

更新时间:2024-02-24 09:06:07

nlp data-science machine-learning ai deep-learning

NLP-教程 存储库,以显示NLP如何解决实际问题。 包括源代码,数据集和NLP的最新技术 数据扩充 一般 文字预处理 部分 小节 描述 故事 代币化 子词标记化 代币化 词标记化 代币化 句子标记化 词性 合法化 抽干 停用词 词组识别 拼写检查 基于词典 Peter Norvig算法 基于词典 符咒 机器翻译 统计机器翻译 机器翻译 注意 字符串匹配 模糊的 文字表示 部分 小节 研究实验室 故事 资源 传统方法 词袋(BoW) 潜在语义分析(LSA)和潜在狄利克雷分配(LDA) 角色等级 字符嵌入 纽约大学 词级 负采样和分层Softmax Word2Vec,GloVe,fastText 上下文化词向量(CoVe) 销售队伍 拼写遗忘(单词)嵌入 脸书 语言模型(ELMo)的嵌入 AI2 上下文字符串嵌入 Zalando研究 句子等级 跳过思路 推断 快速思考 谷歌 通用句(GenSen) 变压器的双向编码器表示(BERT) 谷歌 生成式预训练(GPT) 开放AI 自治神经网络(SGNN) 谷歌 多任务深度神经网络(MT-DNN) 微软 生成式预


【文件预览】:
nlp-master
----aion()
--------helper()
--------embeddings()
--------util()
----README.md(24KB)
----sample()
--------nlp-skip_thoughts.ipynb(44KB)
--------nlp-text_summarization_extractive.ipynb(19KB)
--------nlp-word_mover_distance.ipynb(11KB)
--------nlp-stop_words.ipynb(14KB)
--------nlp_lemmatization.ipynb(7KB)
--------nlp-model_interpretation.ipynb(7.14MB)
--------nlp-embeddings-sentence-infersent.ipynb(6KB)
--------nlp-lsa_lda.ipynb(11KB)
--------nlp-part_of_speech.ipynb(9KB)
--------nlp-3_basic_distance_measurement_in_text_mining.ipynb(17KB)
--------nlp-sentence_tokenization.ipynb(11KB)
--------nlp-bag_of_words.ipynb(17KB)
--------nlp-stemming.ipynb(7KB)
--------nlp-embeddings-word-cove.ipynb(6KB)
--------embeddings()
--------util()
--------nlp-model_interpretation_anchor.ipynb(2.79MB)
--------nlp-model_interpretation-201808.ipynb(387KB)
--------nlp-character_embedding.ipynb(27KB)
--------nlp-named_entity_recognition.ipynb(10KB)
--------nlp-model_interpretation_shap.ipynb(392KB)
--------resources()
--------preprocessing()
--------nlp-word_embedding.ipynb(37KB)
--------nlp-word_tokenization.ipynb(13KB)
--------nlp-embeddings-sentence-elmo.ipynb(25KB)
--------nlp-distance-edit_distance.ipynb(1KB)
----.gitignore(5B)

网友评论