“苏集创”是依托18新利体育 国家技术转移中心(18新利体育 知识产权运营中心),紧密围绕苏州产业创新集群布局,以18新利体育 等国内外知名高校、科研院所、技术创新中心的集成创新成果为标的,构建科技、产业、资本深度融合的成果发布平台。
本期向大家推介的是18新利体育 计算机领域的一批优质专利:
1、一种文本情绪极性的识别方法及装置
专利号:ZL201510032757.3
专利类型:发明
专利权人:18新利体育
发明人:李寿山 汪蓉 周国栋 张民
专利摘要:本申请提供了一种文本情绪极性的识别方法及装置,该方法包括:利用预先构建的分类器,可以确定出待识别文本在不同情绪极性类别中的极性概率值,将最大极性概率值对应的情绪极性确定为待识别文本的情绪极性,从而确定出了待识别文本的情绪极性。并且,预先构建分类器时使用的训练集中包含的语料是从一种语言翻译后的另一种语言,实现了跨语言的训练集的构建,可以有效解决在某种语言场景中已标注语料不足无法构建训练集的问题。进一步地,训练集中还可以加入已确定出情绪极性的文本,扩展了训练集中已标注语料的数量,构建的分类器分类准确率更高。
2、一种微博用户交互式性别识别方法及装置
专利号:ZL201510087855.7
专利类型:发明
专利权人:18新利体育
发明人:李寿山 王晶晶 段湘煜 周国栋 张民
专利摘要:本方案公开了一种微博用户交互式性别识别方法及装置。该方法首先获取微博用户的个人资料信息和用户之间的交互微博文本,并利用交互用户个人资料中的性别信息对交互文本的交互式性别类别进行标注;然后利用标注好的用户之间的交互文本作为训练样本,并利用训练样本训练最大熵分类器;最后,对某测试交互用户集进行分类。综合来看,本发明可以利用交互文本对微博中的两个交互用户的交互式性别进行识别,且在训练样本数量有限的情况下,达到较高的准确率。
3、一种篇章级情感分类方法及装置
专利号:ZL201310444957.0
专利类型:发明
专利权人:18新利体育
发明人:李寿山 王志皓 周国栋
专利摘要:本申请提供了一种篇章级情感分类方法,通过收集篇章级文本和已标注极性的句子级文本,确定已标注极性的句子级文本为已分类句子级文本,从篇章级文本中的子句中获取与已分类句子级文本极性相同的待分类子句,以对篇章级文本的极性进行标注。相比于直接对篇章级文本进行人工标注所需时间短,因此减少了人工的劳动时间,节约了人力,且缩短了训练过程的时间,提高了对待分类文本进行分类的效率。在本申请中得到篇章级基分类单元和句子级基分类单元两种分类单元,分别对待分类文本进行分类,并将分类后的结果进行相加,得到最终分类结果。由于使用了两种分类单元对待分类文本进行分类,提高了分类结果的准确率。
4、一种主客观分类器构建方法和系统
专利号:ZL201410508281.1
专利类型:发明
专利权人:18新利体育
发明人:李寿山 张栋 周国栋
专利摘要:本发明公开的主客观分类器构建方法和系统,在着眼于对问题进行训练的同时,还着眼于对问题的答案进行训练,分别在问题和答案两类文本上构建基分类器,后续通过对两个基分类器进行融合,得到最终的主客观分类器。可见,本发明在主客观分类中加入了答案分类,通过结合答案特征对问题分类进行补正、校准,实现了基于问题与答案互补的主客观分类,规避了因问题训练样本的歧义性而导致分类器准确率低的弊端,提高了利用主客观分类器对问题进行分类的准确率,进而提升了问答系统的性能。
5、基于最大熵的事件论元及论元角色的识别方法及系统
专利号:ZL201510236815.4
专利类型:发明
专利权人:18新利体育
发明人:李寿山 朱珠 周国栋 张民
专利摘要:本发明公开基于最大熵的事件论元及论元角色的识别方法,提取事件的实体信息以确定事件论元候选项并提取事件的论元信息;提取事件论元候选项的特征信息,并利用特征信息及论元信息进行数据处理得到论元识别语料和论元角色识别语料;利用论元识别语料训练最大熵二元分类模型得到最大熵二元分类模型;利用论元角色识别语料训练最大熵多元分类模型得到最大熵多元分类模型;利用最大熵二元分类模型对事件中的事件论元候选项进行识别,得到论元识别结果;利用最大熵多元分类模型对论元识别结果进行识别,得到论元角色识别结果;该方法提高事件论元及论元角色识别效率;还公开基于最大熵的事件论元及论元角色的识别系统。