写作上交或投稿前用AI review board过一遍,少走弯路(附开源项目)

216
0
分享一个自己亲历的案例,顺便推一下自己开源的工具。本人做实证金融研究,这是自己论文里真实发生的案例。

背景

做实证金融,研究信息传导到价格的滞后(Information-Price Lag)。当时设计了一个 predictor 叫 PLT(Price Lead Time,从投资者注意力峰值到后续价格峰值的天数),用它预测后续的 cumulative abnormal return。

结果:ρ=0.62,t=38.8,long-short alpha 33pp。

金融学里经典效应(动量、size、value)的 t-stat 一般是 2-5。我的结果大了一个数量级,直觉告诉我有问题,但怎么找都找不到。

用 AI 评审委员会跑了一遍

参考 AgentReview (EMNLP 2024) 的 multi-agent peer review 框架,自己搭了一套 7 专家系统。7 个角色全部独立审,结果全部指向同一个地方:

Tautological correlation,不是 prediction。

PLT 定义在 120-day window 里,而 outcome variable(CAR)是 90-day window。90天是120天的子集:
High PLT → 价格峰值还在测量期内 → price still rising → positive alpha
Low PLT → 价格峰值已过 → price falling → negative alpha
这是 look-ahead bias 的一种特殊形式——未来信息被嵌进了 predictor 的定义里,correlation 是机械产生的,不反映任何真实的预测能力。

Fix 之后

只用 observation date(注意力峰值当天)已知的信息重构 predictor:价格波动率 + 注意力与价格的时序关系。

结果:ρ=0.094,t=4.56,alpha 6.45pp。下降了~80%,但仍然显著,而且是 real signal。

论文里把原来那个失败的 PLT 完整披露出来了——作为反例,直接 motivate 最终的 clean variable 设计。

工具开源了:

github.com/melody1015/academic-review-board

7专家 + 4阶段流程(独立评审→匿名交叉讨论→加权投票→GM裁决),支持6个学科范式(Econ/Finance, CS/AI, Bio-omics, Clinical Epi, Behavioral, Engineering)。

examples/ 目录里有两个真实输出的脱敏样例,可以直接看流程是怎么跑的。

适合对象:准备投稿、想在 submission 前先自己把 Reviewer模拟一遍的 PhD/postdoc。

有问题欢迎讨论,也欢迎 PR。