英国谢菲尔德大学 (QS Top100) 招收计算机博士生,可以支持申请CSC!

326
0
英国谢菲尔德大学Dr. Bei Peng组正在招聘一名博士生,负责开发用于从人类反馈中进行强化学习(RLHF)的新算法,以便在没有预先定义奖励函数的情况下,高效解决复杂的强化学习任务。该项目的主要目标是开发一种全新的 RLHF 框架,使其在学习更复杂行为的同时,相比现有 RLHF 算法能够显著减少人工交互反馈的次数。该项目的研究方向灵活,学生将有机会探索与其研究兴趣相匹配的相关领域。学生可以在该项目中探索新 RLHF 框架的应用,例如大型语言模型(LLMs)的微调与对齐或者在机器人领域使用人类反馈。项目还可以探索将 LLMs 直接作为 RLHF 框架的一部分,用于生成和解释自然语言反馈。具体的应用和研究方向将取决于学生的个人兴趣。

学生将于2026年春季或秋季入学。

导师:Dr Bei Peng、Dr Robert Loftin
申请截止日期:2025 年 10 月 31 日

申请要求:
1. 计算机科学、数学或相关领域的学士或硕士学位
2. 在机器学习/强化学习方面具备扎实的编程能力与数学背景
3. 精通 Python 等编程语言,并熟悉常用的深度学习与机器学习框架
4. 良好的英语沟通能力,雅思总分不低于 6.5(各单项不低于 6.0)

奖学金信息:
对于英国本土学生:该奖学金提供全额资助,为期3.5年
对于国际学生:该奖学金提供学费资助,为期3.5年。该奖学金不提供生活费资助,学生需要自费或者申请CSC来获取生活费资助。

感兴趣的同学请在这里提交申请:findaphd.com
(申请时请在拟定导师栏填写 Dr Bei Peng 和 Dr Robert Loftin)

如果有任何关于该职位的问题,请联系:
Dr Bei Peng ([email protected])