py数据导入&日期处理&dataframe作图

导入数据:

import pandas as pd
import numpy as np
data=pd.read_excel("/Users/liuyali/Desktop/饿了么流量分析-离线数据下载5-10月格式已经调整.xls")
print(data)


分组求和:使用data.groupby函数

单个
t=data.groupby(data['日期'])['总曝光人数'].sum()

data=df.groupby('A')
data.agg({'B':'mean','C':'sum'})
df.groupby('A').apply(np.mean)

对多列求和,放在dataframe里
df.groupby(['A','B']).mean()


as_index=False


dataframe 
横坐标指定:
纵坐标指定:
在 Python 中使用 Pandas 和 Matplotlib 库,您可以按如下步骤将 DataFrame 的两列数据提取出来,制作线性图:
1.导入所需的库:
import pandas as pd
import matplotlib.pyplot as plt
2.读取数据并创建 DataFrame:
假设数据文件名为 "data.csv",其中包含两列数据 "x" 和 "y",您可以使用以下代码读取数据并创建 DataFrame:
df = pd.read_csv("data.csv")
3.提取所需的两列数据:
假设您要提取的两列数据分别为 "x" 和 "y",您可以使用以下代码将它们提取出来:
x = df["x"]
y = df["y"]
4.绘制线性图:
使用以下代码,您可以使用提取的数据绘制线性图:
plt.plot(x, y, 'o')
plt.xlabel('x')
plt.ylabel('y')
plt.title('Linear Plot')
plt.show()
这将绘制一个以 "x" 为横坐标,"y" 为纵坐标的线性图。如果您要更改线条的颜色或样式,可以在 plot() 方法的第三个参数中指定。例如,plt.plot(x, y, 'r--') 将绘制红色虚线的线性图。

plt.plot(t['date_column'],t['总曝光人数'])


日期作为横坐标要变化下
data['date_column']=pd.to_datetime(data['日期'],format='%Y%m%d')

要将 DataFrame 的日期数据作为横坐标,需要先确保日期数据已被正确解析为 pandas 中的日期时间对象。可以通过下面的方式将字符串格式的日期时间数据解析为 pandas 的日期时间对象:

import pandas as pd

# 假设日期字符串的格式为 "%Y-%m-%d %H:%M:%S"
df['date_column'] = pd.to_datetime(df['date_column'], format='%Y-%m-%d %H:%M:%S')

import matplotlib.pyplot as plt

plt.plot(df['date_column'], df['data_column'])
plt.xlabel('Date')
plt.ylabel('Data')
plt.show()



python中时间日期格式化符号:

  • %y 两位数的年份表示(00-99)
  • %Y 四位数的年份表示(000-9999)
  • %m 月份(01-12)
  • %d 月内中的一天(0-31)
  • %H 24小时制小时数(0-23)
  • %I 12小时制小时数(01-12)
  • %M 分钟数(00-59)
  • %S 秒(00-59)
  • %a 本地简化星期名称
  • %A 本地完整星期名称
  • %b 本地简化的月份名称
  • %B 本地完整的月份名称
  • %c 本地相应的日期表示和时间表示
  • %j 年内的一天(001-366)
  • %p 本地A.M.或P.M.的等价符
  • %U 一年中的星期数(00-53)星期天为星期的开始
  • %w 星期(0-6),星期天为星期的开始
  • %W 一年中的星期数(00-53)星期一为星期的开始
  • %x 本地相应的日期表示
  • %X 本地相应的时间表示
  • %Z 当前时区的名称
  • %% %号本身

关注公众号「水沐教育科技」,在手机上阅读所有教程,随时随地都能学习。内含一款搜索神器,免费下载全网书籍和视频。

公众号二维码
微信扫码关注公众号

微信交流群 关注微信公众号,加入官方交流群。内含一款搜索神器,免费下载全网书籍和视频。