📊 数据分析

核心能力

🐍 Python 数据分析

Pandas NumPy Matplotlib Seaborn
  • 数据清洗与预处理
  • 统计分析(描述性统计、假设检验)
  • 时间序列分析
  • 数据透视与分组聚合

📈 可视化与报表

  • 静态图表:柱状图、折线图、散点图、热力图
  • 交互式图表:Plotly、Bokeh
  • Dashboard 构建
  • 自动化报表生成(PDF、HTML)

📑 Excel/CSV 数据处理

  • 批量读取与写入 Excel/CSV
  • 多表合并与数据关联
  • 公式计算与数据验证
  • 格式美化与条件格式

🎮 游戏数据分析

  • 玩家行为分析(留存、付费、活跃)
  • 游戏关卡难度分析
  • A/B 测试结果分析
  • 平衡性数据分析

常用代码示例

Pandas 数据清洗

import pandas as pd

# 读取数据
df = pd.read_csv('data.csv')

# 数据清洗
df = df.dropna()  # 删除空值
df = df.drop_duplicates()  # 删除重复

# 统计分析
print(df.describe())

# 分组聚合
result = df.groupby('category')['value'].agg(['mean', 'sum', 'count'])

数据可视化

import matplotlib.pyplot as plt
import seaborn as sns

# 基础图表
plt.figure(figsize=(10, 6))
sns.barplot(data=df, x='category', y='value')
plt.title('分类统计')
plt.savefig('chart.png')

# 热力图
plt.figure(figsize=(10, 8))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm')
plt.savefig('heatmap.png')

Excel 自动化

import openpyxl
from openpyxl.styles import Font, PatternFill

# 创建工作簿
wb = openpyxl.Workbook()
ws = wb.active

# 写入数据
ws['A1'] = '标题'
ws['A1'].font = Font(bold=True, color='FFFFFF')
ws['A1'].fill = PatternFill(start_color='4472C4', end_color='4472C4', fill_type='solid')

# 保存
wb.save('report.xlsx')

项目应用案例

📊 游戏数据统计报表

  • 每日活跃用户(DAU)统计
  • 关卡通过率分析
  • 玩家留存曲线
  • 自动化日报生成

📈 游戏平衡性分析

  • 数值表格对比分析
  • 胜率/出场率统计
  • 参数敏感性分析

📚 参考资料

在线文档

推荐书籍

  • 《利用 Python 进行数据分析》 - Wes McKinney (Pandas 作者)
  • 《Python 数据科学手册》 - Jake VanderPlas
  • 《游戏数据分析实战》 - 游戏行业数据指标详解