有时候我们的数据是按某个频率收集的,比如每日、每月、每15分钟,那么我们怎么产生对应频率的索引呢?pandas中的date_range可用于生成指定长度的datetimeindex。
我们先看一下怎么生成日期范围:pd.date_range(startdate,enddate)
1.生成指定开始日期和结束日期的时间范围:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
in : import pandas as pd
index = pd.date_range( '4/1/2019' , '5/1/2019' )
print (index)
out:
datetimeindex([ '2019-04-01' , '2019-04-02' , '2019-04-03' , '2019-04-04' ,
'2019-04-05' , '2019-04-06' , '2019-04-07' , '2019-04-08' ,
'2019-04-09' , '2019-04-10' , '2019-04-11' , '2019-04-12' ,
'2019-04-13' , '2019-04-14' , '2019-04-15' , '2019-04-16' ,
'2019-04-17' , '2019-04-18' , '2019-04-19' , '2019-04-20' ,
'2019-04-21' , '2019-04-22' , '2019-04-23' , '2019-04-24' ,
'2019-04-25' , '2019-04-26' , '2019-04-27' , '2019-04-28' ,
'2019-04-29' , '2019-04-30' , '2019-05-01' ],
dtype = 'datetime64[ns]' , freq = 'd' )
|
也可以只指定开始日期或结束日期,但这时必须要输入一个时间长度,并且指定输入的是开始时间还是结束时间,如果不指定默认是开始时间。
date_range(startdate/enddate,periods)
1
2
3
4
5
6
7
8
9
10
|
in : print (pd.date_range(start = '4/1/2019' ,periods = 10 ))
out:datetimeindex([ '2019-04-01' , '2019-04-02' , '2019-04-03' , '2019-04-04' ,
'2019-04-05' , '2019-04-06' , '2019-04-07' , '2019-04-08' ,
'2019-04-09' , '2019-04-10' ],
dtype = 'datetime64[ns]' , freq = 'd' )
in : print (pd.date_range(start = '5/1/2019' ,periods = 10 ))
out:datetimeindex([ '2019-05-01' , '2019-05-02' , '2019-05-03' , '2019-05-04' ,
'2019-05-05' , '2019-05-06' , '2019-05-07' , '2019-05-08' ,
'2019-05-09' , '2019-05-10' ],
dtype = 'datetime64[ns]' , freq = 'd' )
|
现在我们已经知道怎么生成日期范围了,但是上面我们生成的日期的时间间隔都是天,接下来告诉大家怎么生成其他时间频率的日期范围。
要生成按某个频率计算的日期范围,只需要在date_range后加上freq就可以了。比如,生成每小时间隔的时间:
1
2
3
4
5
6
7
|
in : print (pd.date_range(start = '5/1/2019' ,periods = 10 ,freq = 'h' ))
out:datetimeindex([ '2019-05-01 00:00:00' , '2019-05-01 01:00:00' ,
'2019-05-01 02:00:00' , '2019-05-01 03:00:00' ,
'2019-05-01 04:00:00' , '2019-05-01 05:00:00' ,
'2019-05-01 06:00:00' , '2019-05-01 07:00:00' ,
'2019-05-01 08:00:00' , '2019-05-01 09:00:00' ],
dtype = 'datetime64[ns]' , freq = 'h' )
|
生成时间间隔为3个小时的时间:
1
2
3
4
5
6
7
|
in : print (pd.date_range(start = '5/1/2019' ,periods = 10 ,freq = '3h' ))
out:datetimeindex([ '2019-05-01 00:00:00' , '2019-05-01 01:00:00' ,
'2019-05-01 02:00:00' , '2019-05-01 03:00:00' ,
'2019-05-01 04:00:00' , '2019-05-01 05:00:00' ,
'2019-05-01 06:00:00' , '2019-05-01 07:00:00' ,
'2019-05-01 08:00:00' , '2019-05-01 09:00:00' ],
dtype = 'datetime64[ns]' , freq = 'h' )
|
生成时间间隔为1小时30分的时间:
1
2
3
4
5
6
7
|
in : print (pd.date_range(start = '5/1/2019' ,periods = 10 ,freq = '1h30min' ))
out:datetimeindex([ '2019-05-01 00:00:00' , '2019-05-01 01:30:00' ,
'2019-05-01 03:00:00' , '2019-05-01 04:30:00' ,
'2019-05-01 06:00:00' , '2019-05-01 07:30:00' ,
'2019-05-01 09:00:00' , '2019-05-01 10:30:00' ,
'2019-05-01 12:00:00' , '2019-05-01 13:30:00' ],
dtype = 'datetime64[ns]' , freq = '90t' )
|
python还可以生成其他不规则频率的时间,比如每月的第一个工作日,每月的第一个日历日等
生成每月的第一个工作日:
1
2
3
4
5
|
in : print (pd.date_range(start = '1/1/2019' ,periods = 12 ,freq = 'bms' ))
out:datetimeindex([ '2019-01-01' , '2019-02-01' , '2019-03-01' , '2019-04-01' ,
'2019-05-01' , '2019-06-03' , '2019-07-01' , '2019-08-01' ,
'2019-09-02' , '2019-10-01' , '2019-11-01' , '2019-12-02' ],
dtype = 'datetime64[ns]' , freq = 'bms' )
|
生成每月的第一个日历日:
1
2
3
4
5
|
in : print (pd.date_range(start = '1/1/2019' ,periods = 12 ,freq = 'ms' ))
out:datetimeindex([ '2019-01-01' , '2019-02-01' , '2019-03-01' , '2019-04-01' ,
'2019-05-01' , '2019-06-01' , '2019-07-01' , '2019-08-01' ,
'2019-09-01' , '2019-10-01' , '2019-11-01' , '2019-12-01' ],
dtype = 'datetime64[ns]' , freq = 'ms' )
|
有一种很实用的频率类,为“wom”,即每月的几个星期几。比如每月的第三个星期五。如果我们每月的第三个星期五发工资,这样就可以很方便的知道今年每个月的工资日了。
1
2
3
4
5
|
in : print (pd.date_range(start = '1/1/2019' ,periods = 12 ,freq = 'wom-3fri' ))
out:datetimeindex([ '2019-01-18' , '2019-02-15' , '2019-03-15' , '2019-04-19' ,
'2019-05-17' , '2019-06-21' , '2019-07-19' , '2019-08-16' ,
'2019-09-20' , '2019-10-18' , '2019-11-15' , '2019-12-20' ],
dtype = 'datetime64[ns]' , freq = 'wom-3fri' )
|
下面是python可使用的时间序列的基础频率表:
别名 | 偏移量类型 | 说明 |
---|---|---|
d | day | 每日历日 |
b | businessday | 每工作日 |
h | hour | 每小时 |
t或min | minute | 每分钟 |
s | second | 每秒 |
l或ms | milli | 每毫秒 |
u | micro | 每微秒 |
m | monthend | 每月最后一个日历日 |
bm | businessmonthend | 每月最后一个工作日 |
ms | monthbegin | 每月第一个日历日 |
bms | businessmonthbegin | 每月第一个工作日 |
w-mon、w-tue | week | 每周的星期几 |
wom-1mon、wom-2mon | weekofmonth | 每月第几周的星期几 |
q-jan、q-feb | quarterend | 每个季度对应的该月份的最后一个日历日 |
bq-jan、bq-feb | businessquarterend | 每个季度对应的该月份的最后一个工作日 |
qs-jan、qs-feb | quarterbegin | 每个季度对应的该月份的第一个日历日 |
bqs-jan、bqs-feb | quarterbegin | 每个季度对应的该月份的第一个工作日 |
a-jan、b-feb | yearend | 每年指定月份的最后一个日历日 |
ba-jan、ba-feb | businessyearend | 每年指定月份的最后一个工作日 |
as-jan、as-feb | yearbegin | 每年指定月份的第一个日历日 |
bas-jan、bas-feb | businessyearbegin | 每年指定月份的第一个工作日 |
以上所述是小编给大家介绍的python时间序列按频率生成日期的方法详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持!
原文链接:https://blog.csdn.net/weixin_43342981/article/details/90144285