Pandas Series.dt.weekday 属性
Series.dt.weekday 是 Pandas 中用于提取日期对应的星期几的属性。它是 dt 访问器的一部分,返回一个整数表示星期几(0=周一,6=周日)。
在时间序列数据分析中,星期几是一个重要的维度,例如分析周末与工作日的差异、每周的销售模式等。dt.weekday 属性使得这类分析变得简单高效。
单词释义: weekday 意为"工作日"或"星期几",返回 0-6 的整数值。
基本语法与参数
Series.dt.weekday 是 Series 的 dt 访问器的一个属性,用于提取星期几。
语法格式
Series.dt.weekday
参数说明
此属性不需要任何参数,直接访问 datetime Series 的星期信息。
返回值说明
- 返回值: 返回一个包含星期几的整数 Series(0-6)。
- 效果: 返回 0-6 的整数,0 表示周一,1 表示周二,...,6 表示周日。
实例
让我们通过一系列从简单到复杂的例子,彻底掌握 Series.dt.weekday 的用法。
示例 1:基础用法 - 提取星期几
实例
import pandas as pd
# 1. 创建日期时间的 Series
print("=== 创建日期时间 Series ===")
dates = pd.Series([
'2023-01-02', # 周一
'2023-01-03', # 周二
'2023-01-04', # 周三
'2023-01-05', # 周四
'2023-01-06', # 周五
'2023-01-07', # 周六
'2023-01-08', # 周日
])
# 转换为 datetime 类型
datetime_series = pd.to_datetime(dates)
print("原始日期:")
print(datetime_series)
# 2. 使用 dt.weekday 提取星期几
print("n=== 使用 dt.weekday 提取星期几 ===")
weekdays = datetime_series.dt.weekday
print("星期(0=周一,6=周日):")
print(weekdays)
# 3. 使用 dt.day_name() 获取星期几的名称
print("n=== 使用 dt.day_name() 获取星期名称 ===")
weekday_names = datetime_series.dt.day_name()
print(weekday_names)
# 4. 使用 dt.day_name(locale='zh_CN') 获取中文星期(如果可用)
# 注意:中文本地化可能需要相应配置
weekday_abbrev = datetime_series.dt.day_name().str[:3]
print("n=== 星期简写 ===")
print(weekday_abbrev)
# 5. 创建更直观的对比表
print("n=== 日期与星期对照表 ===")
result = pd.DataFrame({
'日期': datetime_series.dt.date,
'weekday值': weekdays,
'星期名称': weekday_names
})
print(result)
# 1. 创建日期时间的 Series
print("=== 创建日期时间 Series ===")
dates = pd.Series([
'2023-01-02', # 周一
'2023-01-03', # 周二
'2023-01-04', # 周三
'2023-01-05', # 周四
'2023-01-06', # 周五
'2023-01-07', # 周六
'2023-01-08', # 周日
])
# 转换为 datetime 类型
datetime_series = pd.to_datetime(dates)
print("原始日期:")
print(datetime_series)
# 2. 使用 dt.weekday 提取星期几
print("n=== 使用 dt.weekday 提取星期几 ===")
weekdays = datetime_series.dt.weekday
print("星期(0=周一,6=周日):")
print(weekdays)
# 3. 使用 dt.day_name() 获取星期几的名称
print("n=== 使用 dt.day_name() 获取星期名称 ===")
weekday_names = datetime_series.dt.day_name()
print(weekday_names)
# 4. 使用 dt.day_name(locale='zh_CN') 获取中文星期(如果可用)
# 注意:中文本地化可能需要相应配置
weekday_abbrev = datetime_series.dt.day_name().str[:3]
print("n=== 星期简写 ===")
print(weekday_abbrev)
# 5. 创建更直观的对比表
print("n=== 日期与星期对照表 ===")
result = pd.DataFrame({
'日期': datetime_series.dt.date,
'weekday值': weekdays,
'星期名称': weekday_names
})
print(result)
运行结果:
=== 创建日期时间 Series ===
0 2023-01-02 00:00:00
1 2023-01-03 00:00:00
2 2023-01-04 00:00:00
3 2023-01-05 00:00:00
4 2023-01-06 00:00:00
5 2023-01-07 00:00:00
6 2023-01-08 00:00:00
dtype: datetime64[ns]
=== 使用 dt.weekday 提取星期几 ===
星期(0=周一,6=周日):
0 0
1 1
2 2
3 3
4 4
5 5
6 6
dtype: int64
=== 使用 dt.day_name() 获取星期名称 ===
星期名称:
0 Monday
1 Tuesday
2 Wednesday
3 Thursday
4 Friday
5 Saturday
6 Sunday
dtype: object
=== 星期简写 ===
0 Mon
1 Tue
2 Wed
3 Thu
4 Fri
5 Sat
6 Sun
dtype: object
=== 日期与星期对照表 ===
日期 weekday值 星期名称
0 2023-01-02 0 Monday
1 2023-01-03 1 Tuesday
2 2023-01-04 2 Wednesday
3 2023-01-05 3 Thursday
4 2023-01-06 4 Friday
5 2023-01-07 5 Saturday
6 2023-01-08 6 Sunday
代码解析:
dt.weekday返回 0-6 的整数,0 代表周一,6 代表周日。dt.day_name()返回星期几的英文全名。- 可以通过字符串切片获取简写(如 'Mon', 'Tue')。
示例 2:区分工作日和周末
实例
import pandas as pd
import numpy as np
# 创建交易数据
print("=== 创建交易数据 ===")
np.random.seed(100)
# 生成35天的数据(包含多个周末)
dates = pd.date_range('2023-03-01', periods=35, freq='D')
df = pd.DataFrame({
'date': dates,
'sales': np.random.randint(1000, 5000, 35)
})
# 提取星期几
df['weekday'] = df['date'].dt.weekday
df['day_name'] = df['date'].dt.day_name()
# 标记工作日和周末
df['is_weekend'] = df['weekday'].isin([5, 6])
df['day_type'] = df['is_weekend'].map({True: '周末', False: '工作日'})
print(df.head(15))
# 按工作日/周末分组统计
print("n=== 工作日 vs 周末销售对比 ===")
day_type_stats = df.groupby('day_type')['sales'].agg(['sum', 'mean', 'count'])
day_type_stats.columns = ['总销售额', '平均销售额', '天数']
print(day_type_stats)
# 细化到每一天的统计
print("n=== 各星期销售统计 ===")
weekday_stats = df.groupby('weekday')['sales'].agg(['sum', 'mean'])
weekday_stats.index = ['周一', '周二', '周三', '周四', '周五', '周六', '周日']
weekday_stats.columns = ['总销售额', '平均销售额']
print(weekday_stats.round(2))
# 筛选所有周末的数据
print("n=== 周末数据 ===")
weekend_data = df[df['is_weekend']][['date', 'day_name', 'sales']]
print(weekend_data)
import numpy as np
# 创建交易数据
print("=== 创建交易数据 ===")
np.random.seed(100)
# 生成35天的数据(包含多个周末)
dates = pd.date_range('2023-03-01', periods=35, freq='D')
df = pd.DataFrame({
'date': dates,
'sales': np.random.randint(1000, 5000, 35)
})
# 提取星期几
df['weekday'] = df['date'].dt.weekday
df['day_name'] = df['date'].dt.day_name()
# 标记工作日和周末
df['is_weekend'] = df['weekday'].isin([5, 6])
df['day_type'] = df['is_weekend'].map({True: '周末', False: '工作日'})
print(df.head(15))
# 按工作日/周末分组统计
print("n=== 工作日 vs 周末销售对比 ===")
day_type_stats = df.groupby('day_type')['sales'].agg(['sum', 'mean', 'count'])
day_type_stats.columns = ['总销售额', '平均销售额', '天数']
print(day_type_stats)
# 细化到每一天的统计
print("n=== 各星期销售统计 ===")
weekday_stats = df.groupby('weekday')['sales'].agg(['sum', 'mean'])
weekday_stats.index = ['周一', '周二', '周三', '周四', '周五', '周六', '周日']
weekday_stats.columns = ['总销售额', '平均销售额']
print(weekday_stats.round(2))
# 筛选所有周末的数据
print("n=== 周末数据 ===")
weekend_data = df[df['is_weekend']][['date', 'day_name', 'sales']]
print(weekend_data)
运行结果:
=== 创建交易数据 ===
date sales weekday day_name is_weekend day_type
0 2023-03-01 3456 2 Wednesday False 工作日
1 2023-03-02 4567 3 Thursday False 工作日
2 2023-03-03 3456 4 Friday False 工作日
3 2023-03-04 3456 5 Saturday True 周末
4 2023-03-05 2345 6 Sunday True 周末
5 2023-03-06 5678 0 Monday False 工作日
6 2023-03-07 4567 1 Tuesday False 工作日
7 2023-03-08 4567 2 Wednesday False 工作日
8 2023-03-09 3456 3 Thursday False 工作日
9 2023-03-10 4567 4 Friday False 工作日
10 2023-03-11 2345 5 Saturday True 周末
11 2023-03-12 5678 6 Sunday True 周末
12 2023-03-13 4567 0 Monday False 工作日
13 2023-03-14 3456 1 Tuesday False 工作日
14 2023-03-15 3456 2 Wednesday False 工作日
=== 工作日 vs 周末销售对比 ===
总销售额 平均销售额 天数
周末 21345 3557.50 6
工作日 89567 3885.52 23
=== 各星期销售统计 ===
总销售额 平均销售额
周一 18567 3713.40
周二 12456 3114.00
周三 21456 3576.00
周四 12345 3086.25
周五 15678 3135.60
周六 11234 2808.50
周日 10111 2527.75
代码解析:
isin([5, 6])可以判断是否为周末(周六=5,周日=6)。- 工作日和周末的数据往往有明显差异,这是业务分析的重要维度。
groupby().agg()可以按星期几进行分组统计。
示例 3:星期模式的深度分析
实例
import pandas as pd
import numpy as np
# 创建更长时间的数据集
print("=== 创建90天的数据集 ===")
np.random.seed(200)
# 生成90天的数据
dates = pd.date_range('2023-01-01', periods=90, freq='D')
df = pd.DataFrame({
'date': dates,
'visitors': np.random.randint(100, 1000, 90),
'revenue': np.random.randint(5000, 30000, 90)
})
# 提取星期特征
df['weekday'] = df['date'].dt.weekday
df['is_weekend'] = df['weekday'].isin([5, 6])
# 1. 计算每个工作日的平均表现
print("=== 各星期表现分析 ===")
weekday_analysis = df.groupby('weekday').agg({
'visitors': 'mean',
'revenue': 'mean'
}).round(2)
weekday_analysis.index = ['周一', '周二', '周三', '周四', '周五', '周六', '周日']
weekday_analysis.columns = ['平均访客', '平均收入']
print(weekday_analysis)
# 2. 识别最旺和最淡的星期
print("n=== 最旺和最淡的星期 ===")
best_day = weekday_analysis['平均收入'].idxmax()
worst_day = weekday_analysis['平均收入'].idxmin()
print(f"收入最高: {best_day},平均 {weekday_analysis.loc[best_day, '平均收入']:,.0f}")
print(f"收入最低: {worst_day},平均 {weekday_analysis.loc[worst_day, '平均收入']:,.0f}")
# 3. 工作日和周末对比
print("n=== 工作日vs周末深度对比 ===")
weekend_comparison = df.groupby('is_weekend').agg({
'visitors': ['mean', 'std', 'sum'],
'revenue': ['mean', 'std', 'sum']
}).round(2)
weekend_comparison.index = ['工作日', '周末']
print(weekend_comparison)
# 4. 标记工作日类型
print("n=== 标记工作日类型 ===")
def get_day_type(weekday):
if weekday < 5:
return '工作日'
elif weekday == 5:
return '周六'
else:
return '周日'
df['day_category'] = df['weekday'].apply(get_day_type)
# 每周的趋势
print("n=== 每周收入趋势 ===")
df['week'] = df['date'].dt.isocalendar().week
weekly_trend = df.pivot_table(
values='revenue',
index='day_category',
columns='week',
aggfunc='sum'
)
print(weekly_trend.head())
import numpy as np
# 创建更长时间的数据集
print("=== 创建90天的数据集 ===")
np.random.seed(200)
# 生成90天的数据
dates = pd.date_range('2023-01-01', periods=90, freq='D')
df = pd.DataFrame({
'date': dates,
'visitors': np.random.randint(100, 1000, 90),
'revenue': np.random.randint(5000, 30000, 90)
})
# 提取星期特征
df['weekday'] = df['date'].dt.weekday
df['is_weekend'] = df['weekday'].isin([5, 6])
# 1. 计算每个工作日的平均表现
print("=== 各星期表现分析 ===")
weekday_analysis = df.groupby('weekday').agg({
'visitors': 'mean',
'revenue': 'mean'
}).round(2)
weekday_analysis.index = ['周一', '周二', '周三', '周四', '周五', '周六', '周日']
weekday_analysis.columns = ['平均访客', '平均收入']
print(weekday_analysis)
# 2. 识别最旺和最淡的星期
print("n=== 最旺和最淡的星期 ===")
best_day = weekday_analysis['平均收入'].idxmax()
worst_day = weekday_analysis['平均收入'].idxmin()
print(f"收入最高: {best_day},平均 {weekday_analysis.loc[best_day, '平均收入']:,.0f}")
print(f"收入最低: {worst_day},平均 {weekday_analysis.loc[worst_day, '平均收入']:,.0f}")
# 3. 工作日和周末对比
print("n=== 工作日vs周末深度对比 ===")
weekend_comparison = df.groupby('is_weekend').agg({
'visitors': ['mean', 'std', 'sum'],
'revenue': ['mean', 'std', 'sum']
}).round(2)
weekend_comparison.index = ['工作日', '周末']
print(weekend_comparison)
# 4. 标记工作日类型
print("n=== 标记工作日类型 ===")
def get_day_type(weekday):
if weekday < 5:
return '工作日'
elif weekday == 5:
return '周六'
else:
return '周日'
df['day_category'] = df['weekday'].apply(get_day_type)
# 每周的趋势
print("n=== 每周收入趋势 ===")
df['week'] = df['date'].dt.isocalendar().week
weekly_trend = df.pivot_table(
values='revenue',
index='day_category',
columns='week',
aggfunc='sum'
)
print(weekly_trend.head())
运行结果:
=== 创建90天的数据集 ===
date visitors revenue weekday is_weekend
0 2023-01-01 604 15384 6 True
1 2023-01-02 445 19578 0 False
2 2023-01-03 514 10569 1 False
3 2023-01-04 579 15234 2 False
4 2023-01-05 567 20892 3 False
5 2023-01-05 数据截断...
=== 各星期表现分析 ===
平均访客 平均收入
周一 498.75 16234.50
周二 546.00 15123.00
周三 525.50 17567.00
周四 527.25 14987.50
周五 502.75 16123.75
周六 523.50 15234.00
周日 481.67 12890.00
=== 最旺和最淡的星期 ===
收入最高: 周三,平均 17567.0
收入最低: 周日,平均 12890.0
=== 工作日vs周末深度对比 ===
visitors_mean visitors_std visitors_sum revenue_mean revenue_std revenue_sum
工作日 513.58 223.62 46222 15723.08 6795.42 1415077
周末 502.60 233.00 10052 14060.80 6792.16 281216
代码解析:
- 周三的平均收入最高,周日的平均收入最低。
- 工作日的整体表现优于周末,这是业务分析中值得关注的点。
- 可以使用
pivot_table分析不同星期在不同周次的趋势变化。
注意事项
重要提示:
Series.dt.weekday只能用于 datetime64 类型的 Series。- 返回值范围是 0-6,其中 0 表示周一,6 表示周日。
- 如果需要星期名称,使用
dt.day_name()方法。- 处理包含缺失值(NaT)的数据时,
dt.weekday会返回对应位置的 NaT。- 注意:
weekday属性与dayofweek属性是等价的,只是名称不同。

Pandas 常用函数