一亩三分地

写作上交或投稿前用AI review board过一遍，少走弯路（附开源项目）

2 个月前

826

分享一个自己亲历的案例，顺便推一下自己开源的工具。本人做实证金融研究，这是自己论文里真实发生的案例。

背景

做实证金融，研究信息传导到价格的滞后（Information-Price Lag）。当时设计了一个 predictor 叫 PLT（Price Lead Time，从投资者注意力峰值到后续价格峰值的天数），用它预测后续的 cumulative abnormal return。

结果：ρ=0.62，t=38.8，long-short alpha 33pp。

金融学里经典效应（动量、size、value）的 t-stat 一般是 2-5。我的结果大了一个数量级，直觉告诉我有问题，但怎么找都找不到。

用 AI 评审委员会跑了一遍

参考 AgentReview (EMNLP 2024) 的 multi-agent peer review 框架，自己搭了一套 7 专家系统。7 个角色全部独立审，结果全部指向同一个地方：

Tautological correlation，不是 prediction。

PLT 定义在 120-day window 里，而 outcome variable（CAR）是 90-day window。90天是120天的子集：
High PLT → 价格峰值还在测量期内 → price still rising → positive alpha
Low PLT → 价格峰值已过 → price falling → negative alpha
这是 look-ahead bias 的一种特殊形式——未来信息被嵌进了 predictor 的定义里，correlation 是机械产生的，不反映任何真实的预测能力。

Fix 之后

只用 observation date（注意力峰值当天）已知的信息重构 predictor：价格波动率 + 注意力与价格的时序关系。

结果：ρ=0.094，t=4.56，alpha 6.45pp。下降了~80%，但仍然显著，而且是 real signal。

论文里把原来那个失败的 PLT 完整披露出来了——作为反例，直接 motivate 最终的 clean variable 设计。

工具开源了：

github.com/melody1015/academic-review-board

7专家 + 4阶段流程（独立评审→匿名交叉讨论→加权投票→GM裁决），支持6个学科范式（Econ/Finance, CS/AI, Bio-omics, Clinical Epi, Behavioral, Engineering）。

examples/ 目录里有两个真实输出的脱敏样例，可以直接看流程是怎么跑的。

适合对象：准备投稿、想在 submission 前先自己把 Reviewer模拟一遍的 PhD/postdoc。

有问题欢迎讨论，也欢迎 PR。

2条回复

最早最热最新

去一亩三分地美国站
1point3acres.com
查看全部2条讨论