18新利体育 NLP团队和阿里巴巴达摩院联合组队获得第三届中国AI+创新创业大赛中文文本纠错比赛第一名
时间: 2021-11-06 发布者: 文章来源: 计算机科学与技术学院 审核人: 浏览次数: 1004



为促进中文自然语言技术的发展,由中国人工智能学会主办,科大讯飞股份有限公司组织, 认知智能国家重点实验室(科大讯飞)、哈尔滨工业大学社会计算与信息检索研究中心承办的“第三届中国‘AI+’创新创业大赛——自然语言处理技术创新大赛——中文文本纠错比赛”20216月至8月火热举行。本次大赛为从事中文自然语言处理研究的研究人员、产业界从业人员以及AI技术爱好者提供一个良好的交流平台。

文本校对任务主要是针对文本中出现的错误进行检测和纠正,属于综合性的自然语言处理研究子方向,能够比较全面地体现自然语言处理技术的水平。过往文本校对相关评测使用的都是外国语言学习者撰写的文本,这些文本的错误大多数都是一些中文母语写作者不会犯的一些错误。对于政务公文、新闻出版等行业来说,一款针对以中文为母语的用户所使用的校对系统将会有更大的帮助。因此,本届大赛主要选择互联网上中文母语写作者撰写的网络文本作为校对评测数据,从拼写错误、语法错误、语病错误等多个方面考察机器的认知智能能力。

在本届大赛中,18新利体育 NLP团队李正华老师指导章岳、李嘉诚两位硕士同学,和阿里巴巴达摩院紧密合作,探索了一系列最先进的文本纠错技术,并将其使用在了此次文本纠错评测任务中。复赛阶段,我们和来自国内一流高校和企业的16支队伍进行了激烈较量,包括清华大学、南京大学、北京理工大学、新浪、蚂蚁金服等,最终在所有三个指标上均夺得第一名(检错、纠错、总分),展现了现阶段中文母语文本纠错的最高水平。

我们的评测报告PDF下载地址:https://github.com/HillZhang1999/CTC-Report(欢迎交流和讨论!)

中国人工智能学会公众号总结

获奖证书


决赛排行榜