文件名称:NLTKBasics:NLTK模块的基础知识,用于文本识别等
文件大小:81KB
文件格式:ZIP
更新时间:2024-03-23 10:22:25
JupyterNotebook
NLTKBasics NLTK模块的基础知识,用于文本识别等 模块1 文字识别1 导入nltk并下载软件包 导入所有nltk书籍 导入流行的nltk.corpus和 打印不同类别的单词 打印来自不同语料库的文件ID 美国国家语料库 下载MASC-3.0.0 zip文件 Twitter数据\ MASC-3.0.0 \ data \ writed \ twitter将tweets1文本文件复制到jupyter笔记本工作目录 文字识别2 导入nltk并读取twitter1.txt文件 创建和抽象对象并执行nltk操作 条件频率分布:-TextRecognition3 导入图书数据集 创建频率分布 前50个分配的图 导入条件频率分布 前20个字的3个字母词的频率分布图 词汇资源:元数据(Lexicons):-TextRecognition4(停止词)cmudict:发音wordnet
【文件预览】:
NLTKBasics-main
----.ipynb_checkpoints()
--------TextRecognition3-checkpoint.ipynb(72B)
--------TextRecognition1-checkpoint.ipynb(7KB)
--------TextRecognition4-checkpoint.ipynb(8KB)
--------TextRecognition2-checkpoint.ipynb(23KB)
----tweets1.txt(63KB)
----Module 1()
--------TextRecognition2.ipynb(23KB)
--------TextRecognition4.ipynb(8KB)
--------TextRecognition3.ipynb(48KB)
--------TextRecognition1.ipynb(7KB)
----Notes.txt(1KB)
----README.md(1KB)
----.gitignore(11B)