unstructured_data_university_towns

时间:2024-05-22 11:35:49
【文件属性】:

文件名称:unstructured_data_university_towns

文件大小:13KB

文件格式:ZIP

更新时间:2024-05-22 11:35:49

JupyterNotebook

unstructured_data_university_towns 此代码从非结构化的university_towns.txt数据集中返回城镇及其所在州的数据框。 最终清除的dataFrame的格式为: DataFrame([[“”密执安“,”安娜堡“],[”密执安“,”伊普西兰蒂“]],列= [”状态“,” RegionName“])) 以下清洗是通过代码执行的: a)对于“状态”,它从“ [”到末尾删除字符。 b)对于“ RegionName”,如果适用,它将从“()到末尾的每个字符删除。 数据集:“ university_towns.txt” 数据集来源: : analysis.ipynb:Jupiter笔记本,它导入原始的非结构化数据集,执行数据的清理和结构化


【文件预览】:
unstructured_data_university_towns-master
----analysis.ipynb(25KB)
----university_towns.txt(26KB)
----README.md(781B)

网友评论