由于在
Pandas中经常要
处理到时间序列
数据,需要把一些object或者是字符、整型等某列进行转换为
pandas可识别的datetime时间类型
数据,方便时间的运算等
操作。基于前两篇文章的基础:
一文速学-
Pandas中DataFrame转换为时间格式
数据与
处理一文速学-
Pandas处理时间序列
数据操作详解 在这两篇文章中基本把
pandas操作时间类型
数据的一些常规
操作都有提及和展示,作为重要相关函数to_datetime(),该函数参数值得单独拿出来讲一讲,可以省去很多转换之后的BUG错误。基本语法:
Pandas基础
Pandas是基于Numpy的库,但功能更加强大,Numpy专注于数值型数据的操作,而Pandas对数值型,字符串型等多种格式的表格数据都有很好的支持。
1.数据结构(Series,DataFrame,Panel)
2.索引操作
3.数据运算
4.层次化索引
5.可视化(暂时忽略)
6.示例1
7.外部数据的读取与存储(csv,txt,json,excel,数据库,web数据)
8.示例2
9.数据清洗与整理
10.示例3
11.数据分组与聚合
12.示例4
13.时间序列
数据结构
# Pandas 采用了很多Numpy的代码风格,但Pandas是用来处理表
提取
日期中的信息(输出为int类型)
# 提取
日期中的年/月/日/小时/分钟
df2['year'] = pd.to_datetime(df2['comment_Date']).dt.year
df2['ye