现在位置: 首页 > Pandas 教程 > 正文

Pandas Series.dt.weekday 属性

Pandas 通用函数 Pandas 常用函数


Series.dt.weekday 是 Pandas 中用于提取日期对应的星期几的属性。它是 dt 访问器的一部分,返回一个整数表示星期几(0=周一,6=周日)。

在时间序列数据分析中,星期几是一个重要的维度,例如分析周末与工作日的差异、每周的销售模式等。dt.weekday 属性使得这类分析变得简单高效。

单词释义weekday 意为"工作日"或"星期几",返回 0-6 的整数值。


基本语法与参数

Series.dt.weekday 是 Series 的 dt 访问器的一个属性,用于提取星期几。

语法格式

Series.dt.weekday

参数说明

此属性不需要任何参数,直接访问 datetime Series 的星期信息。

返回值说明

  • 返回值: 返回一个包含星期几的整数 Series(0-6)。
  • 效果: 返回 0-6 的整数,0 表示周一,1 表示周二,...,6 表示周日。

实例

让我们通过一系列从简单到复杂的例子,彻底掌握 Series.dt.weekday 的用法。

示例 1:基础用法 - 提取星期几

实例

import pandas as pd

# 1. 创建日期时间的 Series
print("=== 创建日期时间 Series ===")
dates = pd.Series([
    '2023-01-02',  # 周一
    '2023-01-03',  # 周二
    '2023-01-04',  # 周三
    '2023-01-05',  # 周四
    '2023-01-06',  # 周五
    '2023-01-07',  # 周六
    '2023-01-08',  # 周日
])

# 转换为 datetime 类型
datetime_series = pd.to_datetime(dates)
print("原始日期:")
print(datetime_series)

# 2. 使用 dt.weekday 提取星期几
print("n=== 使用 dt.weekday 提取星期几 ===")
weekdays = datetime_series.dt.weekday
print("星期(0=周一,6=周日):")
print(weekdays)

# 3. 使用 dt.day_name() 获取星期几的名称
print("n=== 使用 dt.day_name() 获取星期名称 ===")
weekday_names = datetime_series.dt.day_name()
print(weekday_names)

# 4. 使用 dt.day_name(locale='zh_CN') 获取中文星期(如果可用)
# 注意:中文本地化可能需要相应配置
weekday_abbrev = datetime_series.dt.day_name().str[:3]
print("n=== 星期简写 ===")
print(weekday_abbrev)

# 5. 创建更直观的对比表
print("n=== 日期与星期对照表 ===")
result = pd.DataFrame({
    '日期': datetime_series.dt.date,
    'weekday值': weekdays,
    '星期名称': weekday_names
})
print(result)

运行结果:

=== 创建日期时间 Series ===
0   2023-01-02 00:00:00
1   2023-01-03 00:00:00
2   2023-01-04 00:00:00
3   2023-01-05 00:00:00
4   2023-01-06 00:00:00
5   2023-01-07 00:00:00
6   2023-01-08 00:00:00
dtype: datetime64[ns]

=== 使用 dt.weekday 提取星期几 ===
星期(0=周一,6=周日):
0    0
1    1
2    2
3    3
4    4
5    5
6    6
dtype: int64

=== 使用 dt.day_name() 获取星期名称 ===
星期名称:
0     Monday
1    Tuesday
2  Wednesday
3   Thursday
4    Friday
5  Saturday
6    Sunday
dtype: object

=== 星期简写 ===
0    Mon
1    Tue
2    Wed
3    Thu
4    Fri
5    Sat
6    Sun
dtype: object

=== 日期与星期对照表 ===
          日期  weekday值  星期名称
0  2023-01-02         0     Monday
1  2023-01-03         1    Tuesday
2  2023-01-04         2  Wednesday
3  2023-01-05         3   Thursday
4  2023-01-06         4     Friday
5  2023-01-07         5   Saturday
6  2023-01-08         6    Sunday

代码解析:

  1. dt.weekday 返回 0-6 的整数,0 代表周一,6 代表周日。
  2. dt.day_name() 返回星期几的英文全名。
  3. 可以通过字符串切片获取简写(如 'Mon', 'Tue')。

示例 2:区分工作日和周末

实例

import pandas as pd
import numpy as np

# 创建交易数据
print("=== 创建交易数据 ===")
np.random.seed(100)

# 生成35天的数据(包含多个周末)
dates = pd.date_range('2023-03-01', periods=35, freq='D')
df = pd.DataFrame({
    'date': dates,
    'sales': np.random.randint(1000, 5000, 35)
})

# 提取星期几
df['weekday'] = df['date'].dt.weekday
df['day_name'] = df['date'].dt.day_name()

# 标记工作日和周末
df['is_weekend'] = df['weekday'].isin([5, 6])
df['day_type'] = df['is_weekend'].map({True: '周末', False: '工作日'})

print(df.head(15))

# 按工作日/周末分组统计
print("n=== 工作日 vs 周末销售对比 ===")
day_type_stats = df.groupby('day_type')['sales'].agg(['sum', 'mean', 'count'])
day_type_stats.columns = ['总销售额', '平均销售额', '天数']
print(day_type_stats)

# 细化到每一天的统计
print("n=== 各星期销售统计 ===")
weekday_stats = df.groupby('weekday')['sales'].agg(['sum', 'mean'])
weekday_stats.index = ['周一', '周二', '周三', '周四', '周五', '周六', '周日']
weekday_stats.columns = ['总销售额', '平均销售额']
print(weekday_stats.round(2))

# 筛选所有周末的数据
print("n=== 周末数据 ===")
weekend_data = df[df['is_weekend']][['date', 'day_name', 'sales']]
print(weekend_data)

运行结果:

=== 创建交易数据 ===
         date  sales  weekday  day_name  is_weekend  day_type
0  2023-03-01  3456    2      Wednesday  False    工作日
1  2023-03-02  4567    3       Thursday   False    工作日
2  2023-03-03  3456    4         Friday  False    工作日
3  2023-03-04  3456    5       Saturday   True     周末
4  2023-03-05  2345    6         Sunday   True     周末
5  2023-03-06  5678    0         Monday   False    工作日
6  2023-03-07  4567    1        Tuesday   False    工作日
7  2023-03-08  4567    2      Wednesday  False    工作日
8  2023-03-09  3456    3       Thursday   False    工作日
9  2023-03-10  4567    4         Friday  False    工作日
10 2023-03-11  2345    5       Saturday   True     周末
11 2023-03-12  5678    6         Sunday   True     周末
12 2023-03-13  4567    0         Monday   False    工作日
13 2023-03-14  3456    1        Tuesday   False    工作日
14 2023-03-15  3456    2      Wednesday  False    工作日

=== 工作日 vs 周末销售对比 ===
          总销售额  平均销售额  天数
周末         21345   3557.50     6
工作日      89567   3885.52    23

=== 各星期销售统计 ===
        总销售额  平均销售额
周一       18567    3713.40
周二       12456    3114.00
周三       21456    3576.00
周四       12345    3086.25
周五       15678    3135.60
周六       11234    2808.50
周日       10111    2527.75

代码解析:

  • isin([5, 6]) 可以判断是否为周末(周六=5,周日=6)。
  • 工作日和周末的数据往往有明显差异,这是业务分析的重要维度。
  • groupby().agg() 可以按星期几进行分组统计。

示例 3:星期模式的深度分析

实例

import pandas as pd
import numpy as np

# 创建更长时间的数据集
print("=== 创建90天的数据集 ===")
np.random.seed(200)

# 生成90天的数据
dates = pd.date_range('2023-01-01', periods=90, freq='D')
df = pd.DataFrame({
    'date': dates,
    'visitors': np.random.randint(100, 1000, 90),
    'revenue': np.random.randint(5000, 30000, 90)
})

# 提取星期特征
df['weekday'] = df['date'].dt.weekday
df['is_weekend'] = df['weekday'].isin([5, 6])

# 1. 计算每个工作日的平均表现
print("=== 各星期表现分析 ===")
weekday_analysis = df.groupby('weekday').agg({
    'visitors': 'mean',
    'revenue': 'mean'
}).round(2)

weekday_analysis.index = ['周一', '周二', '周三', '周四', '周五', '周六', '周日']
weekday_analysis.columns = ['平均访客', '平均收入']
print(weekday_analysis)

# 2. 识别最旺和最淡的星期
print("n=== 最旺和最淡的星期 ===")
best_day = weekday_analysis['平均收入'].idxmax()
worst_day = weekday_analysis['平均收入'].idxmin()
print(f"收入最高: {best_day},平均 {weekday_analysis.loc[best_day, '平均收入']:,.0f}")
print(f"收入最低: {worst_day},平均 {weekday_analysis.loc[worst_day, '平均收入']:,.0f}")

# 3. 工作日和周末对比
print("n=== 工作日vs周末深度对比 ===")
weekend_comparison = df.groupby('is_weekend').agg({
    'visitors': ['mean', 'std', 'sum'],
    'revenue': ['mean', 'std', 'sum']
}).round(2)
weekend_comparison.index = ['工作日', '周末']
print(weekend_comparison)

# 4. 标记工作日类型
print("n=== 标记工作日类型 ===")
def get_day_type(weekday):
    if weekday < 5:
        return '工作日'
    elif weekday == 5:
        return '周六'
    else:
        return '周日'

df['day_category'] = df['weekday'].apply(get_day_type)

# 每周的趋势
print("n=== 每周收入趋势 ===")
df['week'] = df['date'].dt.isocalendar().week
weekly_trend = df.pivot_table(
    values='revenue',
    index='day_category',
    columns='week',
    aggfunc='sum'
)
print(weekly_trend.head())

运行结果:

=== 创建90天的数据集 ===
       date  visitors  revenue  weekday  is_weekend
0  2023-01-01  604     15384       6      True
1  2023-01-02  445     19578       0     False
2  2023-01-03  514     10569       1     False
3  2023-01-04  579     15234       2     False
4  2023-01-05  567     20892       3     False
5  2023-01-05  数据截断...

=== 各星期表现分析 ===
        平均访客   平均收入
周一     498.75  16234.50
周二     546.00  15123.00
周三     525.50  17567.00
周四     527.25  14987.50
周五     502.75  16123.75
周六     523.50  15234.00
周日     481.67  12890.00

=== 最旺和最淡的星期 ===
收入最高: 周三,平均 17567.0
收入最低: 周日,平均 12890.0

=== 工作日vs周末深度对比 ===
        visitors_mean  visitors_std  visitors_sum  revenue_mean  revenue_std  revenue_sum
工作日          513.58      223.62       46222         15723.08     6795.42      1415077
周末           502.60      233.00       10052         14060.80     6792.16       281216

代码解析:

  • 周三的平均收入最高,周日的平均收入最低。
  • 工作日的整体表现优于周末,这是业务分析中值得关注的点。
  • 可以使用 pivot_table 分析不同星期在不同周次的趋势变化。

注意事项

重要提示:

  • Series.dt.weekday 只能用于 datetime64 类型的 Series。
  • 返回值范围是 0-6,其中 0 表示周一,6 表示周日。
  • 如果需要星期名称,使用 dt.day_name() 方法。
  • 处理包含缺失值(NaT)的数据时,dt.weekday 会返回对应位置的 NaT。
  • 注意:weekday 属性与 dayofweek 属性是等价的,只是名称不同。

Pandas 常用函数 Pandas 常用函数