文件名称:nlp::input_latin_uppercase:用于自然语言处理的深度学习
文件大小:3.04MB
文件格式:ZIP
更新时间:2024-03-05 10:04:28
JupyterNotebook
自然语言处理 OrganizarCódigocomo 发布链接: 指数 理论 :hammer_and_wrench: :input_latin_letters: :crystal_ball: 楷模 :school: :chart_decreasing: :straight_ruler: 应用领域 :crystal_ball: :question_mark: :Japanese_reserved_button: :clipboard: :robot_face: 理论 :hammer_and_wrench: 管道 预处理 标记化:将文本分为句子,将句子分为单词。 小写:通常在令牌化中完成 删除标点符号:删除像. , , , : 。 通常在令牌化中完成 去除停用词:删除诸如and , the , him 。 做过去。 词法化:动词到词根形式: organizes , will organize organizing → organize这更好。 词干:名词的根源形式: democratic , democratization → democracy 。 这样更快
【文件预览】:
nlp-master
----img()
--------translation.png(116KB)
--------chatbot1.png(100KB)
--------ngrams.png(33KB)
--------logo()
--------chatbot3.png(203KB)
--------chatbot2.png(141KB)
--------transfer.png(52KB)
--------Long_Range_Arena.png(74KB)
--------nlp_vs_nlu.png(44KB)
--------qrnn.png(83KB)
--------decoder.png(23KB)
--------bpe_tokenization.png(406KB)
--------chatbot5.gif(15KB)
--------models2.jpeg(283KB)
--------chatbot0.png(120KB)
--------tokenization.png(572KB)
--------efficient_transformers.jpeg(87KB)
--------models.jpg(136KB)
--------encoder.png(25KB)
--------word2vec.png(284KB)
--------chatbot4.png(79KB)
--------summarization.png(118KB)
----tokenizers.md(5KB)
----README.md(29KB)
----notebooks()
--------textGeneration.ipynb(7KB)
----efficient_transformers.md(5KB)