《七周数据分析师》第七周:Python学习笔记

时间:2022-03-26 00:31:34

Python作用:

1.利用Python写脚本

2.excel可视化有性能瓶颈,需要Python来实现。

第七周所有环节:

  • Python的数据科学环境
  • Python基础
  • Numpy和Pandas
  • 数据可视化
  • 数据分析案例
  • 数据分析平台(轻量级BI)

3.Numpy和pandas

1.Python groupby

mysql不支持分组排序

《七周数据分析师》第七周:Python学习笔记

2.concat和merge

concat是强行耦合

merge,是有共同名,优先表进行耦合

3.多重索引《七周数据分析师》第七周:Python学习笔记

4.文本函数

《七周数据分析师》第七周:Python学习笔记

《七周数据分析师》第七周:Python学习笔记

填充空值,None需要用np.nan,c语言形式的控制

pd.dropna()去除所有还有空值的行

《七周数据分析师》第七周:Python学习笔记

5.Python pandas apply

《七周数据分析师》第七周:Python学习笔记

《七周数据分析师》第七周:Python学习笔记

《七周数据分析师》第七周:Python学习笔记

《七周数据分析师》第七周:Python学习笔记

6.聚合 apply

《七周数据分析师》第七周:Python学习笔记

7。pandas数据透视

《七周数据分析师》第七周:Python学习笔记

《七周数据分析师》第七周:Python学习笔记

输出结果《七周数据分析师》第七周:Python学习笔记

7.python连接数据库

import pymysql
import pandas as pd
from sqlalchemy import create_engine

conn=pymysql.connect(
host='localhost',
user='root',
password='123456',
db='data_kejilie',
port=3306,
charset='utf8'
)

def reader(query,db):
sql=query
engine=create_engine('mysql+pymysql://root:123456@localhost/{0}?charset=utf8').format(db))
df=pd.read_sql(sql,engine)
return df

cur.execute('select * from article_link ')

cur.close()
conn.commit()