Python作用:
1.利用Python写脚本
2.excel可视化有性能瓶颈,需要Python来实现。
第七周所有环节:
- Python的数据科学环境
- Python基础
- Numpy和Pandas
- 数据可视化
- 数据分析案例
- 数据分析平台(轻量级BI)
3.Numpy和pandas
1.Python groupby
mysql不支持分组排序
2.concat和merge
concat是强行耦合
merge,是有共同名,优先表进行耦合
3.多重索引
4.文本函数
填充空值,None需要用np.nan,c语言形式的控制
pd.dropna()去除所有还有空值的行
5.Python pandas apply
6.聚合 apply
7。pandas数据透视
输出结果
7.python连接数据库
import pymysql
import pandas as pd
from sqlalchemy import create_engine
conn=pymysql.connect(
host='localhost',
user='root',
password='123456',
db='data_kejilie',
port=3306,
charset='utf8'
)
def reader(query,db):
sql=query
engine=create_engine('mysql+pymysql://root:123456@localhost/{0}?charset=utf8').format(db))
df=pd.read_sql(sql,engine)
return df
cur.execute('select * from article_link ')
cur.close()
conn.commit()