头像

姓名:李正华

学位:

职称:教授

最新更新

1564 访问

教育经历

  • 本科,2002.09-2006.07,计算机科学与技术,哈尔滨工业大学,学士
  • 硕士,2006.09-2008.07,计算机科学与技术,哈尔滨工业大学,硕士
  • 博士,2008.09-2013.04,计算机应用技术 ,哈尔滨工业大学,博士

工作经历

  • 2013.08-2016.07,18新利体育 ,讲师
  • 2016.07-2021.07,18新利体育 ,副教授
  • 2021.07-,18新利体育 ,教授

社会职务


  • ACL-2023/2024 Area Chair

  • CCL-2022/2023 Evaluation Track Co-Chair

  • 中文信息学报责任编辑(2021年12期;2022年10期;2023年11期)


个人简介

李正华,男,18新利体育 计算机科学与技术学院教授、博士生导师。哈尔滨工业大学本硕博。2010年在新加坡资讯通信研究院访学半年。2013年4月博士毕业,8月加入18新利体育 。目前成果包括:在CCF-A/B类顶级会议和期刊上发表论文约60篇,其中10余篇ACL长文,目前Google引用数2500+;获得COLING-2022 Best Long Paper(CCF-B类)NLPCC-2020最佳论文(CCF-C类);多次在国内外重要评测中取得第一名,如句法语义(CoNLL09、SemEval19、CoNLL19、CCL22、CCL23)、文本纠错(CTC21、CGED21、WAIC22、CAIL22、CCL23);主持国家自然科学基金面上项目2项、青年项目1项;长期和阿里、华为、百度保持科研探索为主的合作;标注句法数据集CODT、语义数据集MuCPAD、文本纠错数据集MuCGEC、数据库问答Text2SQL数据集SeSQL;构建了汉语理解平台CUP、数据标注平台DAP、文献文本纠错平台。获得2023年CCF-NLPCC“青年新锐学者”。

科研方面,我最大的梦想是去回答:计算机是否可以理解人类语言?可以理解到什么程度?采用什么样的技术去理解?这些问题都很难回答。什么叫“理解”,本身就是一个问题。如何在计算机中表示句法、语义、常识、世界知识、垂直领域知识等,是人工智能最重要的挑战。也许终其一生,我也无法做出重大突破。然而,在未知的世界中,探索而来的点滴发现都令我欣喜;能够见证、理解别人的重要发现,也让我开心。

我目前的研究兴趣包括:大模型知识萃取、大模型干预技术;词法、句法、语义分析技术及其应用;文本纠错;语音处理和NLP的深度融合;Text2SQL语义解析(数据库问答);数据标注方法和数据资源构建;领域移植问题。我的研究特点:钻研前沿技术、实际实用实干、数据和算法并重;不求成果数量,只求不断提高自己的能力和水平。教学方面,积累了大量笔记、板书照片、视频资源。研究生培养方面,3名博士生毕业,分别就职苏大、昆明理工、华为;约25名硕士生毕业;多人获得研究生国家奖学金;2人获得江苏省优秀硕士学位论文。

我的长远职业规划和梦想是:1)坚持第一线写代码、写论文,做有意思的科研,做一个优秀的科研工作者;2)认真上课,做一名合格的教师;3)认真指导研究生,培养出优秀的硕士和博士研究生;4)不断梳理自己掌握的知识,著书立说,用简单的文字和合适的例子,把东西讲出来。

人生苦短,珍惜时间和精力,尽量只做自己想做的,并全力做好。


邮箱联系方式:(zhli13 at suda dot edu dot cn) 


HLT研究所服务器上的个人主页:http://hlt.suda.edu.cn/~zhli (主要包含论文信息)

也欢迎大家关注“语析LAGroup”公众号,里面会及时发布语言分析小组相关的招生、新闻、论文预讲、交流等活动。


社会职务


  • ACL-2023/2024 Area Chair

  • CCL-2022/2023 Evaluation Track Co-Chair

  • 中文信息学报责任编辑(2021年12期;2022年10期;2023年11期)


研究领域

自然语言处理、人工智能、机器学习


我近期的研究兴趣包括:

  • 大模型知识萃取、大模型干预技术

  • 分词、多粒度分词

  • 句法分析

  • 语义分析,如SRL、AMR等

  • 面向数据库问答的语义分析:Text2SQL parsing

  • 数据标注方法、语料库构建、语言资源

  • 无监督学习方法、领域移植问题

  • 噪音文本规范化、文本错误纠正(文本纠错)(希望可以打造一个面向汉语的产品,类似grammarly)

  • 语音文本信息融合的语言理解



开授课程

  • 2024春

  • Linux操作系统 (网页,内含笔记、板书)

2023秋研究生专业写作(网页
  • 2023春

  • Linux操作系统 (网页,内含笔记、板书、讲课视频)

  • 2022秋

  • 研究生专业写作 (网页)

  • 2022春

  • 信息检索综合实践 (网页,内含课件、作业、讲课视频)

  • 2021春

  • Linux操作系统 (网页,内含笔记、板书、讲课视频)

  • 2020秋

  • Python程序设计 (网页,内含笔记、板书、讲课视频)

  • 2020春

  • Linux操作系统 (网页,重新整理了2018春的视频和笔记)

  • 2019秋

  • Linux操作系统 (文正学院9人,网页,内含笔记、板书)

  • 2019春

  • Linux操作系统 (网页,内含笔记、板书)

  • 2019春

  • 信息检索课程设计(网页,内含课件和作业)

  • 2018秋

  • 2018春

  • Linux操作系统 (网页,内含笔记、和视频百度云链接)

  • 2017秋

  • Python程序设计 (网页,录播课,建议看2020秋Python视频和笔记)

  • 2016秋

  • Python程序设计(网页,内含PPT)

  • 2016春

  • 信息检索课程设计 (网页,内含作业和数据)

  • 2015秋

  • 中文信息处理 (网页,内含讲义、作业和数据等,推荐看我主页中的新生编程基础练习)

  • 2015秋

  • Linux操作系统 (网页,内含PPT)



•2020-2021(2)本科计18计算机图灵Linux操作系统

•2021-2022(1)自考20自考软工3班业余Linux系统及应用

•2021-2022(2)本科计21计科信息检索综合实践

•2022-2023(1)研究生 22博士22硕士专业写作

•2022-2023(2)本科计20人工智能Linux操作系统

•2023-2024(1)研究生2023博士 2023硕士专业写作


科研项目

  • 1、融合多源知识的跨领域汉语句子语义分析,-2025.12,李正华,NSFC面上项目
  • 2、知识驱动的汉语网络文本依存句法分析,-2022.12,李正华,NSFC面上项目
  • 3、基于大规模部分标注数据的依存句法分析,-2018.12 ,李正华,NSFC青年项目

论文

  • 1、https://www.aclweb.org/anthology/people/z/zhenghua-li/
  • 2、http://scholar.google.com/citations?user=faXAgZQAAAAJ&hl=en
  • 3、https://dblp.uni-trier.de/pid/72/8937.html
  • 4、https://dblp.org/pid/72/8937.html
  • 5、https://www.semanticscholar.org/author/Zhenghua-Li/3221743
  • 6、http://hlt.suda.edu.cn/index.php/LA-paper-report-talk-etc,[请白天访问,或者VPN访问]

科技成果

软件著作
专利
  • 1、一种数据标注方法及装置
  • 2、一种基于异构标注数据的快速序列标注方法及装置
  • 3、基于序列标注建模的多粒度分词方法及系统
  • 4、基于模式嵌入的自动树库转化方法
  • 5、基于多级词典的分词方法装置设备及可读存储介质
  • 6、基于树形循环神经网络的自动树库转化方法
  • 7、一种数据标注方法及装置
  • 8、序列标注方法、装置及序列标注模型的训练方法
  • 9、一种基于神经网络的中文分词模型的训练方法

荣誉及奖励

  • 1、钱伟长中文信息处理科学技术奖一等奖,2010
  • 2、博士生国家奖学金(哈尔滨工业大学),2012
  • 3、“NLPCC-2020最佳论文” 通讯作者(CCF-C类会议),2020
  • 4、华为云 “2020年度优秀合作伙伴奖”,2020
  • 5、华为云“2021年度最佳论文复现奖”指导教师,2021
  • 6、华为云“2021年度AI名师奖”,2021
  • 7、“2021年江苏省优秀学术型硕士学位论文”指导老师,2021-11-02
  • 8、“2021年江苏省计算机学会优秀硕士学位论文”指导老师,2021
  • 9、2022年18新利体育 学生“我最喜爱的老师”,2022
  • 10、COLING-2022 Best Long Paper 通讯作者 (CCF-B类会议),2022-10-15
  • 11、“2022年江苏省优秀学术型硕士学位论文”指导老师,2022-12-14
  • 12、“2022年江苏省计算机学会优秀硕士学位论文”指导老师,2023-01-14
  • 13、CCF-NLPCC“青年新锐学者”,2023-10-15

招生信息

招生说明:HLT网站版本(需白天或vpn访问); github版本

NLP基础编程练习:HLT网站版本(需白天或vpn访问);github版本


请同学们邮件联系我,联系我之前,务必读一下招生说明。

邮箱联系方式:zhli13 at suda dot edu dot cn


我希望在我的带领下,语析组(LAGroup)这条小船可以在知识的海洋中不断前进,在努力做出高质量工作的同时,不断学习、消化、慎思新的知识,不断追求真理。同时,我希望LAGroup的氛围是宽松的、自由的、尊重个性的、可持续发展的,而不是压榨式的、短视的。因为我相信只有这样,才能做出真正有价值的东西,且不会完全被世俗、潮流所左右。


LAGroup“组训”:求真、务实、独立、自由


合作青年教师:龚晨(AI研究院师资博士后)



在读学生 (字母序)


2020级博士(1):刘亚慧(山东农大考研18硕,直博)
2021级博士(1):周厚全(矿大保研19硕,直博)
2022级博士(2):侯洋(苏大保研20硕、直博)、周仕林(苏大20硕,直博)

2025级博士(1):经过较扎实科研训练的同学,可以发邮件联系我。


2022级硕士(4):辜仰淦(广东工业保研)、蒋浩辰(苏大)、刘雨萌(江南大学保研)、马溪(太原理工)
2023级硕士(4):陈杰琳(国际关系学院)、乔子恒(苏大保研)、王学彬(西南交通保研)、张紫岩(苏大、和龚晨共同指导)

2024级硕士(1):周昊喆(长安大学)

2025级硕士(2-3):请尽早联系。保研同学在拿到保研资格之前就可以联系。



毕业学生 (字母序)


2017级博士(1):李英(昆明理工考博,昆明理工任教)[2022.06]
2018级博士(2):龚晨(苏大保研16硕、直博,苏大任教)、夏庆荣(苏大保研16硕、直博,华为)[2022.06]


2021级硕士(6):崔秀莲(苏大保研)、窦晨晖(苏大、和龚晨共同指导)、黄赛豪(苏大保研、百度实习)、严福康(苏大)、张磊(文正、美团实习)、章岳(苏大保研、阿里+腾讯实习)

2020级硕士(4):侯洋(苏大保研、直博)、李嘉诚(燕山大学、专硕、字节实习、中国移动研究院西安)、李帅克(苏大保研、百度实习、创业)、李扬(苏大、华为实习、中国移动研究院苏州)、刘泽洋(华北电力、专硕、百度实习、公务员)、周仕林(苏大、专硕直博)

2019级硕士(2):杨浩苹(苏大保研、唯品会实习、思必驰)、周厚全(矿大保研、直博)、周明月(苏大保研)

2018级硕士(4):蒋炜(苏大、华为实习、华为Cloud&AI)、陆凯华(苏大、专硕、华为实习、上海银行)、吴锟(浙江理工、百度实习、百度NLP)、张宇(苏大、阿里实习、读博)、刘亚慧(山东农大,直博)
2017级硕士(3):黄德朋(苏科技,华为杭州实习,小红书上海)、彭雪(山东农大,华为杭州实习、移动苏州)、章波(苏大,阿里巴巴杭州达摩院实习、转正)
2016级硕士(3):郭丽娟(江西财经保研,科沃斯实习,狗尾草公司工作)、孙佳伟(北航,搜狗北京实习,微软苏州工作)、朱运(山西大学,搜狗北京工作)、龚晨(苏大保研、直博)、夏庆荣(苏大保研、直博)
2015级硕士(3):陈伟(南阳理工、爱奇艺北京实习、爱奇艺北京工作)、凡子威(滁州学院、科大讯飞北京实习、搜狗北京工作)、张月(苏大保研、阿里巴巴杭州实习、阿里巴巴杭州工作)
2014级硕士(1)[2017春毕业]:巢佳媛(苏大、微软北京实习、阿里巴巴杭州工作)


学生管理规则【链接失效,会以其他方式沟通说明】:

Suda-HLT-LAGroup学生管理规则

Suda-HLT-LAGroup本科俱乐部同学(或招生考察中同学)管理规则