欢迎光临
免费的PDF电子书下载网站

Web数据管理:概念与技术 PDF下载

编辑推荐

暂无

内容简介

  本书介绍Web数据管理技术 ,包括:Web数据抽取(数据型页面和文档型页面的 抽取方法、基于视觉信息的抽取方法、包装器生成与 维护及实体识别),Web数据集成(查询接口集成、 模式匹配、查询转换、数据库采样、数据库大小估计 及集成系统实现),数据空间(数据空间的模型、索 引、查询及系统实现),以及Web数据管理新技术 (Web信息可信性、移动Web搜索、移动应用集成、大 规模知识库构建及社交媒体)。

  本书适合作为Web数据管理的教科书,也可以作 为相关领域研究人员和开发人员的参考书。

作者简介

暂无

Web数据管理:概念与技术 PDF下载

目录

序一
序二
前言
第1章 绪论
1.1 引言
1.2 Web数据及特点
1.3 Web数据管理及其应用
1.4 Web数据抽取
1.5 Web数据集成
1.6 数据空间
1.7 小结
参考文献
第2章 XML基础知识
2.1 引言
2.2 基本概念
2.3 XML查询语言
2.4 小结
参考文献
第一部分 Web数据抽取
第3章 Web数据抽取方法概述
3.1 引言
3.2 Web页面分类
3.3 Web数据抽取定义
3.4 Web数据抽取方法
3.5 Web数据抽取评价标准
3.6 小结
参考文献
第4章 数据型页面抽取方法
4.1 引言
4.2 多记录数据型页面的抽取方法
4.3 单记录数据型页面抽取方法
4.4 小结
参考文献
第5章 文档型页面抽取方法
5.1 引言
5.2 单记录文档型页面抽取方法
5.3 多记录文档型页面抽取方法
5.4 小结
参考文献
第6章 包装器的生成与维护
6.1 引言
6.2 包装器的生成
6.3 包装器的维护
6.4 系统结构
6.5 小结
参考文献
第7章 基于视觉的数据抽取
7.1 引言
7.2 Web页面上的视觉信息
7.3 基于视觉的数据记录抽取
7.4 基于视觉的数据项抽取
7.5 小结
参考文献
第8章 Web实体识别
8.1 引言
8.2 属性分类
8.3 整体解决方案
8.4 训练集的自动获取
8.5 属性匹配
8.6 属性权重的迭代训练
8.7 小结
参考文献
第二部分 Web数据集成
第9章 Web数据集成概述
9.1 引言
9.2 集成框架
9.3 集成查询接口的生成
9.4 查询处理
9.5 查询结果的处理
9.6 小结
参考文献
第10章 查询接口集成
10.1 引言
10.2 查询接口分析与集成
10.3 简易查询接口生成与处理
10.4 小结
参考文献
第11章 不确定模式匹配
11.1 引言
11.2 模式匹配定义
11.3 相似度计算
11.4 基于数字实例的模式匹配
11.5 模式匹配优化
11.6 不确定性模式匹配
11.7 小结
参考文献
第12章 查询转换
12.1 引言
12.2 查询转换问题
12.3 近似查询转换定义
12.4 基于动态规则的查询转换
12.5 基于谓词的查询转换
12.6 基于查询能力的查询转换
12.7 小结
参考文献
第13章 数据库采样
13.1 引言
13.2 基本概念
13.3 Web数据库图模型
13.4 Web数据库采样方法
13.5 小结
参考文献
第14章 数据库大小估计
14.1 引言
14.2 一种朴素的基于词频的估算方法
14.3 一种粗糙的基于词频的估算方法
14.4 小结
参考文献
第15章 Web数据集成系统
15.1 引言
15.2 体系结构
15.3 静态集成案例——学术信息集成
15.4 动态集成案例——工作信息集成
15.5 小结
参考文献
第三部分 数据空间
第16章 数据空间概述
16.1 引言
16.2 什么是数据空间
16.3 数据空间的特征
16.4 数据空间与数据库
16.5 数据空间与数据集成
16.6 数据空间系统
16.7 小结
参考文献
第17章 数据空间模型
17.1 引言
17.2 iDM数据模型
17.3 核心数据空间
17.4 任务空间
17.5 小结
参考文献
第18章 数据空间索引
18.1 引言
18.2 倒排索引
18.3 FAX索引
18.4 UFAX索引
18.5 小结
参考文献
第19章 数据空间查询处理
19.1 引言
19.2 查询接口
19.3 关键字查询
19.4 多属性组合查询
19.5 任务查询
19.6 小结
参考文献
第20章 数据空间系统
20.1 引言
20.2 实现技术
20.3 系统框架
20.4 系统功能
20.5 其他系统
20.6 小结
参考文献
第四部分 Web数据管理新技术
第21章 Web信息可信性
21.1 概述
21.2 不同应用场景下的信息可信性
21.3 信息可信度评估方法
21.4 Web信息可信度评估框架
21.5 小结
参考文献
第22章 移动Web搜索
22.1 引言
22.2 系统框架
22.3 地理标记Web资源
22.4 查询处理
22.5 相关性排名
22.6 查询结果可视化
22.7 小结
参考文献
第23章 移动应用集成
23.1 引言
23.2 移动应用集成框架
23.3 移动应用匹配
23.4 关键技术
23.5 小结
参考文献
第24章 大规模知识库构建
24.1 引言
24.2 关联数据
24.3 知识图谱
24.4 小结
参考文献
第25章 社交媒体
25.1 引言
25.2 社交媒体的特点
25.3 社交媒体数据带来的挑战
25.4 社交媒体中的短文本分析
25.5 基于社交媒体的事件发现
25.6 社交媒体事件处理框架
25.7 小结
参考文献
索引

前沿

前言

 ; Web数据指能够通过Web访问到的所有数据。基于Web数据访问形式不同,Web又分为浅层网络浅层网络(Surface Web)和深层网络深层网络(Deep Web)。如何有效地管理Web上的大量信息,以满足用户不断增长的高质量的信息需求,成为学术界和产业界共同关注并致力于解决的问题。Web数据所呈现的特征为:海量异构;分布广泛;动态增长;先有数据,后有模式。这使得Web数据无论从数量上还是复杂程度上,都与传统数据库技术所处理的数据显著不同,需要有更先进的技术来管理Web数据。
 ; Web数据管理Web数据管理的主要目的是解决Web上丰富信息资源有效利用的问题,从而大大提高Web应用的开发效率。Web数据管理是指针对特定的主题领域,利用数据抽取和数据集成技术,自动识别Web中与所给主题相关的实体及实体之间的关联,构造面向主题的结构化关联数据,并对这些数据进行有效处理(包括数据质量数据质量、动态演化动态演化、隐私保护隐私保护等),从而为用户提供高质量的信息服务。
传统的数据库技术为传统应用系统的开发提供了有利的支撑,缩短了应用开发周期,降低了系统维护成本。Web数据管理技术与传统的数据库技术一脉相承,其大大降低了Web应用系统开发的难度,同样缩短了应用开发周期,降低了系统维护的代价。诸如学术集成系统学术集成系统、网络舆情系统网络舆情系统、价格比对系统价格比对系统、工作查找系统工作查找系统等应用,利用Web数据管理系统可以方便快捷地加以开发,并实现日常的自动增量维护。
 ; 当下大数据浪潮一浪高过一浪,大数据大数据所体现的数据量大(volume)、数据多样性(variety)、实时性强(velocity) 、价值大(value)以及真实性(veracity)的特征与Web数据的特征几多相似。因此本书所提出的Web数据管理技术与方法,本质上提供了将多源异构非结构化数据非结构化数据加以结构化管理的途径,进而为解决大数据管理问题提供了有益的尝试。
 ; 特别感谢两位在此领域颇有建树的学者百忙中拨冗为本书作序:美国宾汉姆顿纽约州立大学孟卫一教授和清华大学周立柱教授。孟卫一教授在Web数据管理方面是国际上的知名学者,作为元搜索引擎的开拓者在国际上享有盛誉,自2000年以来多次回国开办Web数据管理方面的讲习班,与本研究团队交流密切,对我们的工作多有指导和帮助,他目前是Web时代信息管理国际会议(WAIM)指导委员会主席。周立柱教授领导的研究团队在大规模Web数据管理和知识提取方面有出色的研究工作,对本实验室的研究工作常年给予指导和帮助,他目前担任中国计算机学会数据库专业委员会主任委员。他们对本书作了整体概括和推介,在此深表谢意。
 ; 本书的形成凝聚了中国人民大学网络与移动数据管理实验室集体智慧。特别感谢实验室的博士研究生和硕士研究生,先后有若干届的学生参与到本项目的研究中来,他们是博士生刘伟、姜芳艽、李玉坤、张金增、马如霞、马友忠、李勇,以及硕士生谷明哲、王海燕、胡东东、李宇、李忺、林灿、凌妍妍、王仲远、艾静、赵婧、胡享梅、贾琳琳、张相於、寇玉波、陈威、邓云、童薇、王淼、赵可君等。刘伟(第一部分)、姜芳艽(第二部分)、李玉坤(第三部分)、王仲远(第15、21章)等直接参与写作并在资料收集和文献整理方面做了大量工作。
本书涉及面广,内容丰富,参考文献众多。值得指出的是,在全书的撰写和课题的研究中,尽管投入了大量精力、付出了艰苦努力,但受知识水平所限,书中不当之处在所难免,诚恳希望读者批评指正并不吝赐教。如果有任何建议或意见,可发电子邮件。
孟小峰
2014年3月于北京

Web数据管理:概念与技术 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:Web数据管理:概念与技术