文件名称:NLP_Transform21:演示文稿的材料,TRANSFORM 2021会议
文件大小:4.44MB
文件格式:ZIP
更新时间:2024-05-08 22:14:34
JupyterNotebook
NLP_Transform21 在此Jupyter笔记本中,我们将探讨NLP(自然语言处理)的不同方面。 通过API请求,我们将使用由NPD(挪威石油局)发布的油井报告摘要。 在继续进行NLP处理之前,我们将经历文本清理和格式化的不同阶段:标记化,词形化和最终主题建模。 请在此处签出笔记本: /notebooks/NLP_transform21_v01_work.ipynb 会议链接: 在此笔记本中,我们将执行以下步骤: 通过API获取对NPD井眼表的请求,我们感兴趣: 具有坐标(带有坐标)的Kong,以及 带有报告摘要的井(带有历史记录) 使用Pandas数据框进行重新格式化-将具有坐标的数据框与具有报告摘要的数据框合并 在地图上可视化以进行质量控制并评估数据在地理上的分布方式(北海,挪威海,巴伦支) 清理摘要(除去标签等) NLP的预处理(删除停用词,标记化,词形化)
【文件预览】:
NLP_Transform21-master
----.gitignore(264B)
----images()
--------well_map_with_popup.jpg(681KB)
--------POS_online_example.jpg(159KB)
--------topic_modeling_pyLDAvis.jpg(507KB)
--------wordcloud_well_1_2-1.jpg(910KB)
--------wells_with_report_summary.png(258KB)
----requirements.txt(94B)
----LICENSE(1KB)
----notebooks()
--------NLP_transform21_v01_work.ipynb(7.75MB)
--------term_dict.csv(37KB)
----README.md(2KB)