读XLS,将所有日期,正确的格式, - >写入CSV(read xls, convert al

2019-10-21 23:56发布

我读的Excel文件,写出来为csv。 一对夫妇一列含有被格式化为在Excel浮点数日期。 所有这些领域需要得到转化为正确的日期时间(DD / MM / YY)之前,我写信给CSV。 我发现了如何在一般工程的一些好文章,但挣扎着爬,在一次工作中打开表中的所有行。 (新手在Python)

代码看起来像下面的现在:

wb = xlrd.open_workbook(args.inname)
    xl_sheet = wb.sheet_by_index(0)
    print args.inname
    print ('Retrieved worksheet: %s' % xl_sheet.name)
    print outname

    # TODO: Convert xldate.datetime from the date fileds to propper datetime

    output = open(outname, 'wb')
    wr = csv.writer(output, quoting=csv.QUOTE_ALL)

    for rownum in xrange(wb.sheet_by_index(0).nrows):
        wr.writerow(wb.sheet_by_index(0).row_values(rownum))

    output.close()

我敢肯定,我必须要改变了“ROWNUM ......”行,但我挣扎做。 我试了几个选项,都失败了。

谢谢

Answer 1:

你必须要经过该行你写之前出文件,转换值。 你说得对,以确定它是附近for rownum行:

# You need to know which columns are dates before hand
# you can't get this from the "type" of the cell as they 
# are just like any other number

date_cols = [5,16,23]

... # Your existing setup code here #

# write the header row (in response to OP comment)
headerrow = wb.sheet_by_index(0).row_values(0)
wr.writerow(headerrow)

# convert and write the data rows (note range now starts from 1, not 0)
for rownum in xrange(1,wb.sheet_by_index(0).nrows):
    # Get the cell values and then convert the relevant ones before writing
    cell_values = wb.sheet_by_index(0).row_values(rownum)
    for col in date_cols:
        cell_values[col] = excel_time_to_string(cell_values[col])

    wr.writerow(cell_values)

究竟什么你把你的excel_time_to_string()函数是由你-通过@MarkRansom答案有一个合理的方法-或者你可以使用xlrd概括自己的包版本在这个答案。

例如:

def excel_time_to_string(xltimeinput):
    return str(xlrd.xldate.xldate_as_datetime(xltimeinput, wb.datemode))

*编辑*

为了响应尝试后,请求帮助的意见。 这里有一个更防错版excel_time_to_string()

def excel_time_to_string(xltimeinput):
    try:
        retVal = xlrd.xldate.xldate_as_datetime(xltimeinput, wb.datemode)
    except ValueError:
        print('You passed in an argument in that can not be translated to a datetime.')
        print('Will return original value and carry on')
        retVal = xltimeinput

    return retVal


Answer 2:

从Excel到Python的转换非常简单:

>>> excel_time = 42054.441953
>>> datetime.datetime(1899,12,30) + datetime.timedelta(days=excel_time)
datetime.datetime(2015, 2, 19, 10, 36, 24, 739200)

或做完全转化为字符串:

def excel_time_to_string(excel_time, fmt='%Y-%m-%d %H:%M:%S'):
    dt = datetime.datetime(1899,12,30) + datetime.timedelta(days=excel_time)
    return dt.strftime(fmt)

>>> excel_time_to_string(42054.441953)
'2015-02-19 10:36:24'
>>> excel_time_to_string(42054.441953, '%d/%m/%y')
'19/02/15'


文章来源: read xls, convert all dates into proper format, -> write to csv