日期转换在大熊猫CSV阅读(Date conversion in pandas csv reader

2019-10-17 20:11发布

from StringIO import StringIO
import datetime as dt
import pandas as pd

def addtime(temp):
    temp = (temp) + (dt.timedelta(hours  =16))
    return(temp)

data = """\
    '12-31-2012',5100, 5200
    '01/1/2013',5300,5400"""

tdata = pd.read_csv(StringIO(data),
    names =    ['date', 'field1', 'field'], index_col = None,
    parse_dates =['date'], header= None)

print tdata

old_date = tdata.ix[0,'date']
print 'old date =',old_date
new_date = addtime(old_date)
print 'new date =',new_date

#                 date  field1  field
#0  2012-12-31 00:00:00    5100   5200
#1  2013-01-01 00:00:00    5300   5400
#old date = 2012-12-31 00:00:00
#new date = 2012-12-31 16:00:00

我想16小时添加到每个日期作为熊猫CSV阅读器的一部分。 但我无法弄清楚如何添加一个可行的“parse_dates =”。 样本代码正确地执行操作,只是没有以期望的方式。 帮助将不胜感激。

Answer 1:

使用date_parser参数。 通常情况下,默认为dateutil.parser.parse ,但你可以指定一个自定义函数(如addtime ,下同),不仅解析日期字符串也增添了timedelta为好。

from StringIO import StringIO
import datetime as dt
import pandas as pd
import dateutil.parser as parser

def addtime(temp):
    temp = parser.parse(temp) + dt.timedelta(hours=16)
    return temp

data = """\
    '12-31-2012',5100, 5200
    '01/1/2013',5300,5400"""

tdata = pd.read_csv(StringIO(data),
    names = ['date', 'field1', 'field'], index_col = None,
    parse_dates =['date'], header= None, date_parser=addtime)

print tdata

产量

                  date  field1  field
0  2012-12-31 16:00:00    5100   5200
1  2013-01-01 16:00:00    5300   5400


文章来源: Date conversion in pandas csv reader