编辑推荐
暂无
内容简介
语言知识库是众多自然语言处理系统不可或缺的组成部分,同时也是各种自然语言处理技术赖以实现的基础。语言知识库建设已经成为自然语言处理领域最基本、最重要的应用基础研究之一。本书是以北京大学计算语言学研究所开发的综合型语言知识库为基础,围绕异质资源的集成创新这一主题,从资源集成的广度和深度两个方向开展研究的。首先,介绍了综合型语言知识库系统的构成及功能;其次,以名词为切入点,研究从语料中自动获取名词语法属性的方法,内容涉及数词与名词构成的数名结构,数词、量词与名词构成的数量名短语及名词与名词构成的复合名词短语,并对这3种属性关系进行了详细的句法和语义分析。
作者简介
王萌,女,北京大学计算机软件与理论专业博士学位,江南大学人文学院副教授,曾作为技术骨干参与国家重点基础研究发展计划(973项目),主持国家自然基金青年项目"面向语义检索的汉语名名组合自动释义研究”。
目录
目 录
第1章 引 言 1
1.1 研究意义和背景 1
1.2 研究内容和基础 3
1.3 本书内容及结构安排 4
第2章 综合型语言知识库系统 7
2.1 国内外相关研究 7
2.2 综合型语言知识库的资源概况 9
2.2.1 语言数据资源简介 10
2.2.2 工具软件简介 17
2.3 系统集成方案 19
2.4 系统功能 21
2.4.1 语言加工模块 21
2.4.2 知识检索模块 22
2.4.3 知识挖掘模块 23
2.5 本章小结 24
第3章 词语的概率语法属性研究 26
3.1 现代汉语词汇计量研究的发展 27
3.2 构建《概率型现代汉语常用词汇知识库》 30
3.3 名词概率语法属性研究 31
3.3.1 “数名”属性 33
3.3.2 “数量名”属性 34
3.3.3 “前名”和“后名”属性 35
3.4 本章小结 35
第4章 数名结构的计量研究 37
4.1 数名结构 37
4.2 实验设计 38
4.2.1 语料标注 38
4.2.2 获取数名结构 39
4.3 分散度 40
4.4 实验结果及分析 42
4.5 本章小结 44
第5章 量名搭配的句法语义分析 45
5.1 复杂数量名短语的识别 46
5.1.1 名词短语识别概述 46
5.1.2 复杂数量名短语界定 48
5.1.3 系统流程 49
5.1.4 量名搭配词典的构建 50
5.1.5 右边界识别算法 53
5.1.6 实验结果及分析 56
5.2 量名搭配统计结果 59
5.3 量词对名词的语义选择倾向 62
5.3.1 选择倾向 62
5.3.2 量名搭配的特点 62
5.3.3 获取方法 63
5.3.4 实验结果及分析 66
5.4 基于量词的名词概念获取 69
5.4.1 概念获取 69
5.4.2 基于量词的名词概念描述 70
5.4.3 聚类方法 71
5.4.4 评价方法 72
5.4.5 实验设计 73
5.5 本章小结 77
第6章 复合名词短语的研究 79
6.1 复合名词短语概述 79
6.1.1 复合名词短语定义 79
6.1.2 复合名词短语的特点 80
6.1.3 复合名词短语的相关研究 81
6.2 复合名词短语的自动获取 83
6.2.1 问题提出 83
6.2.2 数据准备 83
6.2.3 统计指标 85
6.2.4 基于机器学习模型SVM的实验 92
6.2.5 讨论 95
6.3 复合名词短语的语义解释 97
6.3.1 问题概述 97
6.3.2 汉语复合名词短语的释义方法 100
6.3.3 动词获取 100
6.3.4 释义短语生成 104
6.3.5 释义短语过滤 105
6.3.6 实验结果 109
6.3.7 结果分析 110
6.4 基于相似度计算的复合名词短语推荐 113
6.4.1 问题概述 113
6.4.2 研究思路 113
6.4.3 词语相似度计算 114
6.4.4 短语相似度计算 117
6.4.5 实验数据及结果 118
6.5 本章小结 119
第7章 总结与展望 120
7.1 总结 120
7.2 进一步工作 121
附录A 语料库词性标记与词典词类代码对照表 124
附录B 复杂数量名短语的识别结果样例 126
附录C 6.3节中实验所用的复合名词短语样例 129
附录D 基于相似度计算的复合名词短语推荐样例 130
后记 131
参考文献 135
面向概率型词汇知识库建设的名词语言知识获取 pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版