【文件属性】:
文件名称:matlab中云滴代码-Kaggle-Survey:2020Kaggle数据集分析
文件大小:12.42MB
文件格式:ZIP
更新时间:2021-06-02 13:42:38
系统开源
matlab中云滴代码2020
年
Kaggle
机器学习和数据科学调查
语境
这个存储库中的代码是我为了从
Kaggle
的
.
此外,为了查看原始的
Kaggle
Notebook,请遵循此
。
数据预处理
调查数据具有特定的结构,可以方便地清理和更改数据框的某些属性。
一些问题:
列名很冗长,它们不是描述性的。
列名已通过将“
Part
”和“_”替换为“.”,将“OTHER”替换为“0”来更改:
#
Formating
the
columns
for
comfortable
access
column_dict
=
{}
#
Getting
the
dictionary
needed
to
change
the
column
names
for
col
in
res
.
columns
:
n_col
=
col
.
replace
(
'_Part_'
,
'.'
)
n_col
=
n_col
.
replace
(
'_'
,
'.'
)
n_col
=
n_col
.
replace
(
'OTHER'
,
'0'
)
column_dict
[
col
]
=
n_c
【文件预览】:
Kaggle-Survey-main
----utilities.py(2KB)
----img()
--------ide-age.png(12KB)
--------Countries.png(48KB)
--------python-alter.png(7KB)
--------tpu-setup.png(14KB)
--------role-vs-degree.png(117KB)
--------degree-percentages.png(7KB)
--------ide-break.png(12KB)
--------python-usage.png(9KB)
--------student-vs-role.png(18KB)
--------tpu-usage.png(7KB)
----survery2019()
--------survey_schema.csv(6KB)
--------multiple_choice_responses.csv(20.33MB)
--------other_text_responses.csv(862KB)
--------questions_only.csv(4KB)
----kaggle_survey_2020_answer_choices.pdf(111KB)
----survey2017()
--------RespondentTypeREADME.txt(1KB)
--------schema.csv(41KB)
--------multipleChoiceResponses.csv(23.72MB)
--------conversionRates.csv(2KB)
--------freeformResponses.csv(4.1MB)
----kaggle_survey_2020_responses.csv(24.25MB)
----kaggle-ds-surveys.ipynb(1.08MB)
----.ipynb_checkpoints()
--------kaggle-ds-surveys-checkpoint.ipynb(934KB)
--------kaggle_survey_2020_answer_choices-checkpoint.pdf(111KB)
----README.md(20KB)
----survey2018()
--------freeFormResponses.csv(1.3MB)
--------multipleChoiceResponses.csv(39.28MB)
--------SurveySchema.csv(8KB)