近日,计算机学院2017级本科生孙维纬作为第一作者的两篇论文“Conversations Powered by Cross-Lingual Knowledge”和“Simulating User Satisfaction for the Evaluation of Task-oriented Dialogue Systems”被信息检索顶级学术会议SIGIR 2021(The 44th International ACM SIGIR Conference on Research and Development in Information Retrieval)分别录用为Full paper和Resource paper,今年Full Paper录用率仅为21%。指导教师为yh1122银河国际任昭春教授。
论文“Conversations Powered by Cross-Lingual Knowledge”关注于构建智能化的闲聊机器人。使人类可以与机器对话,是人工智能研究的重要目标,为了生成更富有信息的回复,近年来很多工作在对话系统中引入外部知识(如维基百科的文档)。但由于不同语言可获取的资源数量很不平衡,对于资源匮乏的语言,现有的方法存在困难。为了解决这一问题,论文作者首次提出了基于跨语言知识的对话(CKGC)方法。CKGC首先基于对话历史,从外语知识库中检索相关知识,之后再根据检索到的外语知识生成回复。同时,作者提出了一个无监督的学习方法来训练模型,通过大量实验发现该方法超过了已有的方法。除此之外,作者还发布了第一个CKGC基准数据集,将很好的促进相关领域研究。领域主席评价本文工作创新性和实现性强,实验设计出色,本文在双盲匿名评审中获得了3个审稿人一致Accept的审稿意见。
论文“Simulating User Satisfaction for the Evaluation of Task-oriented Dialogue Systems”关注对话系统评价问题。不同于闲聊机器人,任务型对话系统旨在解决用户的一个特定的需求,如果机票预订,电影推荐等。作者发现,用户在与系统交互时的用户满意度变化,对用户接下来的行为有明显的影响,而之前的工作在建模用户行为时并没有考虑用户满意度的变化。为此,作者提出了“用户满意度模拟”任务,通过对聊天过程中用户满意度的模拟,来提升用户模拟的真实性。同时,作者发布了一个标注数据集USS。该数据集覆盖多个领域,在规模上超过了已有的数据集,本文提出的任务和数据集将为未来的对话系统自动评价方法提供有力支撑和新的研究思路。
孙维纬是yh1122银河国际数据科学与大数据技术新工科创新实验班2017级本科生。近年来,yh1122银河国际计算机学院持续推进本科生的科研实践活动,为学生提供丰富的科学研究体验机会。孙维纬从大三开始在yh1122银河国际信息检索实验室担任科研助理。在此之前,他曾获CCF-CSP全国第二名的成绩(400分)、全国大学生数学建模二等奖。在信息检索实验室作为研究助理期间,孙维纬曾以共同作者身份在SIGIR 2020上发表一篇Full Paper。孙维纬同学目前已经保研至yh1122银河国际计算机学院信息检索实验室,将于2021年9月开始在计算机学院开始硕士阶段的学习。
(图/文 孙维纬 编辑/徐慧 供稿单位:yh1122银河国际)