• Python+pandas 特殊时间序列的生成

    时间:2024-03-31 16:33:30

    一、 date_range()函数date_range()函数是pandas库的函数,顾名思义,该函数应该能生成指定区间的时间序列。举例:1、 使用“开始时间”和“结束时间” 生成2020-01-01至2020-01-07的7个日期【脚本】 print(pd.date_range(‘20200101...

  • pandas 箱型图(boxplot)详解

    时间:2024-03-29 15:51:11

    首先看一段例子:import pandas as pdfrom pandas import DataFrame,Seriesdf = DataFrame(np.random.randn(10, 2), columns=['Col1', 'Col2'])boxplot=df.boxplot()  ...

  • Python 每日一记34>>>pandas多条件筛选,写多sheet的excel

    时间:2024-03-29 13:13:15

    在今天的工作中,又遇到了一些小问题。都是关于pandas操作excel的。一是多条件筛选数据,二是将数据写入excel,但是要保存在同一个工作簿的多个sheet。先上一个完整代码源数据是这样的:得到的结果是:我在做的是,得到不同级距(门槛)下‘人数’,‘占比’,‘达到级距会员客单’,‘会员客单’,并...

  • 【Python】pandas的describe()参数

    时间:2024-03-29 13:06:33

    Pandas提供describe方法,可以查看各列的计数、均值、最大最小值等,功能强大。下面介绍一种可根据自身要求,添加各个特征的其他描述的方法。统计值变量说明:   count:数量统计,此列共有多少有效值   mean:均值                                    ...

  • 数据分析之Pandas(六)文件读取与存储

    时间:2024-03-29 12:59:32

    文件读取与存储我们的数据大部分存在于文件当中,所以pandas会支持复杂的IO操作,pandas的API支持众多的文件格式,如CSV、SQL、XLS、JSON、HDF5。注:最常用的HDF5和CSV文件文件读取与存储CSV读取与存储pd.read_csv()usecols参数用于选择部分列,而不是全...

  • python pandas 读取列名以及index

    时间:2024-03-29 12:57:01

    读取df的列名[col for col in df]df.columns.values返回一个array,用tolist()返回一个listdf.columns返回一个index,用tolist()返回一个listlist(df)读取indexdf.index.tolist()...

  • pandas 给没有列名的dataframe添加列名

    时间:2024-03-29 10:09:36

    今天处理的文件发现没有列名源文件是一个txt文件,用的read_csv方法读取,现在添加一个参数,header=None即可发现列名为1-n接着使用df2.columns = [列名的列表]即可 ...

  • Python—实训day9—使用pandas进行数据预处理

    时间:2024-03-28 19:35:16

    1合并数据1.1堆叠合并数据1.1.1横向堆叠(行对齐,左右拼接)横向堆叠,即将两个表在X轴向拼接在一起,可以使用concat函数完成,concat函数的基本语法如下。pandas.concat(objs, axis=0, join='outer', join_axes=None, ignore_i...

  • Python操作Mysql数据库入门——数据导入pandas(数据分析准备)

    时间:2024-03-27 22:28:13

    前言上一篇写到了mysql与python的简单交互还讲到了一些基础的面向对象设计这两天探索了一下,发现如果是用pandas做数据分析简单的几行代码即可将mysql的数据导入pandas进行分析环境Python 3.XIDE : juyter notebook使用Python连接数据库 导入表中所有数...

  • 数据分析笔记--numpy和pandas的数据合并

    时间:2024-03-27 22:27:25

    import pandas as pdimport numpy as np1.numpy的数据合并(concatenate,将两个ndarray合并为一个ndarray)默认是进行列合并,通过指定axis=1可以对行进行合并2.Series的数据合并(concat)1.当各个表的索引值没有重复的情况...

  • 数据分析之Pandas(四)DataFrame运算

    时间:2024-03-27 22:26:37

    本章内容算术运算逻辑运算统计运算累计统计函数自定义运算第一节 算术运算add(other)比如进行数学运算加上具体的一个数字sub(other)如果想要得到每天的涨跌大小?求出每天 close- open价格差第二节 逻辑运算逻辑运算符号<、 >、|、 &逻辑运算类型:>,...

  • pandas中DataFrame和Series对象的排序方法的说明

    时间:2024-03-27 21:11:08

           pandas中的DataFrame是我们在数据分析时最常用到的一类数据结构,而在数据分析时,对数据进行排序也是经常用的一种操作,因此,本文将针对DataFrame的排序问题进行一个详细的说明。       对DataFrame对象排序可以分为对索引排序和对值排序。首先看对索引进行排序,...

  • python 读取oracle数据 转成pandas dataframe数据格式

    时间:2024-03-27 11:45:06

    1.import cx-Oracle,sqlalchemy,matplotlib2.下载 oracle_instance_win_XXX.zip3.将压缩包里的dll文件解压到python安装路径下site-package文件夹下4.# 导入包import osfrom sqlalchemy imp...

  • 利用pandas将mysql查询出得结果写入到excel文件

    时间:2024-03-27 11:02:04

    #!/usr/bin/env python3import pandas as pdimport pymysql#返回SQL结果的函数def getrel(sql):    conn =  pymysql.connect(host='localhost',user='root',password='1...

  • Pandas之将保存的数据写入到Excel的多个sheet

    时间:2024-03-27 11:01:38

    工作之中一个excel内会有多个sheet。但是将两组数据先后保存到一个excel内会发现只有后一组保存的数据,因为前一组的数据被后写入的数据覆盖了。如:这是两组数据,df1与df2,我们分别使用to_excel将这两组数据保存到同一个excel内。这里我们将sheet_name这个参数改成不同的但...

  • 开启机器学习的第一课:用Pandas进行数据分析

    时间:2024-03-27 10:07:21

    翻译 | AI科技大本营参与 | 林椿眄本课程的目的并不是要开发一门全新的机器学习或数据分析的综合入门课程,也不是想借此来取代基础教育、在线/离线课程或一些专业和书籍。我们推出本系列文章是为了让初学者快速地回顾一些基础知识,并帮助你找到进一步学习的方向。 首先用简短通俗的语言回顾数学和机器学习的基础...

  • Windows系统下 Python3.8.2安装 numpy、pandas、matplotlib库

    时间:2024-03-26 21:51:17

    本人安装Python自动化办公库时,需要numpy、pandas、matplotlib库,但是cmd窗口下输入pip install 命令时安装工具包总是报错无法通过,具体错误如下。解决方法:在官网上下载安装包到电脑上,在使用下载好的库文件进行安装。python库的官网:https://www.lf...

  • Numpy,matplotlib和pandas库整理

    时间:2024-03-26 21:49:17

    一、Numpy库    为了方便科学计算,Numpy库定义了一些属性和方法以便于对一维数据,二位数据和高维数据的处理。为了满足科学计算的需求,Numpy定义了一个多维数组对象——ndarray。Ndarray由实际数据和描述这些数据的元数据(如数据维度、数据类型)构成,ndarray一般要求所有元素...

  • Windows7系统下Python及Pandas等数据分析工具包安装

    时间:2024-03-26 18:04:52

    1.系统及Python版本本人的电脑安装的是64位windows7旗舰版,选择安装的是64位的Python3.5,之所以选择64位的Python是考虑到32位的Python能够支配的内存只有2G,当数据集过大时会爆内存,因此建议尽可能安装64位的Python,至于Python的版本则见仁见智,如果要...

  • Python 数据分析模块pandas 如何创建DataFrame

    时间:2024-03-25 18:27:50

    以下用两种方式分别创建DataFrame。 import pandas as pd#原始数据存储在列表中names = ['Alice','Deric','Amanda','Petter']ages = ['34','24','33','35']incomes = ['50000','65000',...