【招募科研助理 | RL + Model-Based方法 | 远程】
16916
导师背景
王卿,香港大学(HKU)计算机系研究员,前IBM Research scientist,研究方向为机器学习与强化学习。在顶会(AAAI、KDD、WWW等)发表论文20+篇,持有15+项专利。
研究方向
1point3acres.com
王卿,香港大学(HKU)计算机系研究员,前IBM Research scientist,研究方向为机器学习与强化学习。在顶会(AAAI、KDD、WWW等)发表论文20+篇,持有15+项专利。
研究方向
- Model-Based RL — 利用model-based方法为强化学习生成高质量训练数据,解决sample efficiency的核心瓶颈问题
- Interest Drift Detection — 检测用户兴趣随时间的动态变化,提升推荐系统的实时适应能力
- 国内高校在读本科生,研究生
- 对强化学习、机器学习有兴趣,有一定Python/PyTorch基础
- Have strong software engineering skills with experience building complex ML systems
- Can balance research exploration with engineering rigor and operational reliability
- Enjoy collaborating across research and engineering disciplines
- Are comfortable working with large-scale distributed systems and high-performance computing
- Have experience with training, fine-tuning, or evaluating large language models
- 合作期3个月起,表现优秀者可续
- 全程远程,时间灵活
- 顶会论文共同发表机会
- 科研推荐信(适合申请海外PhD)
1point3acres.com
