学院数据科学与工业软件研究团队获WISE 2022最佳论文奖
时间: 2022-11-22
发布者: 赵朋朋
文章来源: 科研与研究生办公室
审核人: 李恩秀
浏览次数: 1451
第23届网络信息系统工程国际会议(Web Information Systems Engineering,WISE 2022)于2022年11月1日至3日在法国比亚里茨成功召开。我院数据科学与工业软件研究团队2020级硕士张惠旺为第一作者、赵朋朋教授为通讯作者的论文“Click is Not Equal to Purchase: Multi-task Reinforcement Learning for Multi-behavior Recommendation”获得会议最佳论文奖。
张惠旺同学在保研至我院后,加入了数据科学与工业软件研究团队,积极参与科研项目研究与科学实验工作,在赵朋朋教授的指导下,围绕推荐系统这一方向,开展了强化学习推荐、多行为推荐、自监督强化学习推荐的研究,多次获得18新利体育 研究生奖学金。
论文贡献:现有的基于强化学习的推荐方法假设只有一种类型的交互行为存在于用户和项目之间,而实际推荐场景涉及多种类型的用户交互行为(例如,点击、添加到购物车、购买等)。该文提出了一种基于多任务强化学习的多行为推荐方法(Multi-Task Reinforcement Learning model for multi-behavior Recommendation,MTRL4Rec),该方法通过单个强化学习模型为用户的不同行为提供不同的推荐策略。过程中,该工作提出了一个模块化网络,其中的模块可以被重用或相互隔离,以对用户行为之间的共性和差异进行建模。然后,使用任务路由网络在模块化网络中为每个行为任务生成路由。实验结果表明所提出的方法性能优于目前的最先进水平。