← 返回上级

Protected

需要密码

将 DWTS 原始表格清洗为选手-赛季-周面板,显式处理 N/A、淘汰后 0 分占位、评委数量差异和淘汰周标签。
把明星/专业舞者粉丝存量、当周表现增益和赛季规则放入同一估计框架,用于反演隐藏粉丝票份额。
用 Dirichlet 后验刻画估计不确定性,并以遗传算法调参,使模型尽量复现历史淘汰同时惩罚失败和过宽区间。
比较排名制与百分比制在不同赛季淘汰机制中的交叉应用差异,解释规则变化对淘汰结果的影响。

Snapshot

结果指标

2402完整面板记录celebrity-professional-week complete cases
28.09%规则分歧率排名制与百分比制交叉应用后的淘汰结果分歧
+0.092专业舞者增量解释对 total fan outcome 的 ΔR²_pro 约 0.0922
0.8933表现成分对齐度professional effects 与 performance component 的 alignment

Mermaid

反演流程

flowchart LR
  A["DWTS 原始数据"] --> B["选手-赛季-周面板"]
  B --> C["评委分与淘汰标签"]
  B --> D["明星 / 专业舞者粉丝存量"]
  C --> E["赛季规则仿真"]
  D --> F["粉丝票先验强度"]
  E --> G["Dirichlet 后验"]
  F --> G
  G --> H["遗传算法调参"]
  H --> I["命中概率 / 区间宽度 / 规则比较"]

Timeline

推进过程

2026.01.30阅读 2026 MCM Problem C,整理 DWTS 原始数据字段,完成选手、专业舞者和周评分数据清洗。
2026.01.31构建粉丝投票估计、赛季规则仿真、Instagram 外部验证和遗传算法参数搜索。
2026.02.01 - 2026.02.02输出 Q1 数据处理报告、贝叶斯一致性图表、置信区间热力图和 MCM/ICM Summary。
2026.04整理清洗后面板、代码包和结果展示图。

Methods

方法与工具

面板数据把宽表评分列转成 contestant-season-week 粒度,构造 judge_total、judge_percent、judge_rank 和 eliminated_this_week。
规则仿真按赛季处理排名制、百分比制和 Bottom-2 lock 等淘汰规则,使估计结果受真实比赛机制约束。
Dirichlet 后验围绕单点估计构造粉丝票份额后验,用区间宽度和命中概率表达不确定性。
贝叶斯一致性用 posterior hit probability 检查估计票份额能否复现历史淘汰,而不是只展示最可能的票数。
遗传算法搜索粉丝存量、表现增益和规则参数,目标函数同时考虑一致性、失败率和不确定度惩罚。
外部验证用 Season 34 Instagram 粉丝量对 celebrity fan stock 和 professional fan stock 做合理性检查。

PDF Preview

材料预览

MCM Problem C 最终论文

Resources

相关文件