编辑推荐
大数据时代,建立一个网站或应用程序,搜索功能是必备的。本书将Elasticsearch、Logstash、Kibana联袂奉献给广大读者,可使读者尽快熟悉ELK架构,并构建自己的Web应用程序,完成分布式信息检索与分析工作。本书适合需要了解和开发类似产品的人员阅读。 ;
内容简介
对大数据的搜索与挖掘,在当今网络时代是很有必要的。高凯编著的这本《实战Elasticsearch Logstash Kibana--分布式大数据搜索与日志挖掘及可视化解决方案》提出的分布式大数据搜索与日志挖掘及可视化解决方案是基于Elasticsearch、 Logstash和Kibana而形成的,它能有效应对海量大数据所带来的分布式存储与处理、全文检索、日志挖掘、可视化等的挑战。构建在全文检索开源软件Lucene 之上的Elasticsearch,不仅能对海量规模的数据完成分布式索引与检索,还能提供数据聚合分析; Logstash能有效处理来源于各种不同数据源的日志信息;Kibana能得出可视化分析结果。本书讲解有关 Elasticsearch、Logstash、Kibana的使用,相关内容以模块化的方式进行组织,注重实战,强调实践,内容新颖,组织合理。
本书可为高校相关专业(如计算机科学与技术、软件工程、情报学、图书馆学、信息管理与信息系统 )学生的学习和科研工作提供帮助,同时对于从事大数据搜索与挖掘、信息检索与智能处理技术的工程技术人员和希望了解网络信息检索与分析技术的爱好者也具有较高的参考价值。
作者简介
高凯,男,博士毕业于上海交通大学计算机应用技术专业,省级重点学科“计算机软件与理论”中“信息检索与云计算”方向学术带头人,硕士研究生导师;中国计算机学会会员,中国中文信息处理学会会员,英国学术期刊International Journal of Computer Applications in Technology编委会委员,5th、6th、7th lnternational Conference on Modelling,Identification and Control程序委员会委员;主要研究方向为自然语言处理、网络信息检索、社会网络计算、大数据搜索与挖掘、云计算等;近几年出版了《信息检索与智能处理》、《大数据搜索与挖掘》、《网络信息检索技术及搜索引擎系统开发》等学术专著及《数据库原理与应用》、《计算机专业英语》、《Android程序设计基础教程》等多部教材。  ;
目录
第1章 概述 1.1 Elasticsearch的安装与简单配置 1.2 走近Elasticsearch 1.2.1 Elasticsearch是什么 1.2.2 Elasticsearch中涉及到的相关概念 1.2.3 Elasticsearch API的简单使用方式 1.2.4 Elasticsearch RTF版本中的部分插件简介 1.2.5 Elasticsearch基本架构 1.3 Elasticsearch索引及其构建 1.3.1 概述 1.3.2 借助Head工具构建索引 1.3.3 Mapping简述 1.4 信息检索及其构建 1.5 实例 1.6 扩展知识与阅读 1.7 本章小结 第2章 文档索引及管理 2.1 文档索引概述 2.2 建立索引 2.3 通过映像Mapping配置索引 2.3.1 在索引中使用映像 2.3.2 管理/配置映像 2.3.3 获取映像信息 2.3.4 删除映像 2.4 管理索引文件 2.4.1 打开、关闭、检测、删除索引文件 2.4.2 清空索引缓存 2.4.3 刷新索引数据 2.4.4 优化索引数据 2.4.5 Flush操作 2.5 设置中文分词器 2.6 对文档的其他操作 2.6.1 获取指定的文档信息 2.6.2 删除文档中的信息 2.6.3 数据更新 2.6.4 基于POST方式批量获取文档 2.6.5 删除部分文档 2.7 扩展知识与阅读 2.8 本章小结 第3章 信息检索与结果过滤 3.1 实验数据集描述 3.2 简单检索 3.3 基本检索 3.3.1 设置不同字段的排序权重 3.3.2 指定返回的字段子集 3.3.3 Term查询、Terms查询、Witdcard通配符查询 3.3.4 Match、Match_all、Match_phrase查询 3.3.5 Query_string查询 3.3.6 Prefix、Range查询 3.3.7 More_like_this、Fuzzy_like_this查询 3.3.8 跨字段检索 3.4 Filter概述 3.5 常用Filter及其应用 3.5.1 And Futer及Or Filter 3.5.2 Bool Filtcr 3.5.3 Exists Filter和 Missing Filter 3.5.4 Type Filter 3.5.5 Match all Filter 3.5.6 Not Filter 3.5.7 Query Filter 3.6 复合查询 3.7 结果排序 3.8 扩展知识与阅读 3.9 本章小结 …… 第4章 信息统计分析与搜索提示 第5章 Elasticsearch部分功能的Java客户端实现 第6章 Elasticsearch配置与集群管理 第7章 基于Logstash的日志处理 第8章 基于Kibana的数据分析可视化 第9章 网络信息检索与分析实践 参考文献
前沿
云计算、智慧城市、移动互联网、大数据与物联网已经成为大数据时代的前瞻技术,实现了人、机器与实物的多维互联互通,监测数据、内容数据、社交数据、关系数据裂变式增长,大数据时代全方位地到来。大数据具有多(体量大)、快(生成速度快)、好(价值大)、省(高效)的特征,传统的信息搜索、数据挖掘与知识呈现理论技术难以满足当下多样化的需求。大数据的理念与理论已经成为了人所共知的科学常识,但是大数据搜索、挖掘与可视化等落地的工程实践尚有较大距离,也是当下的工程急需。
本书从分布式大数据搜索、日志挖掘与可视化三个角度出发,以非结构化文本信息、半结构化的日志数据为处理对象,进行宏观解决方案与微观方法技巧全面阐释。具体地说,如何利用在全文检索开源软件Lucene之上的Elasticsearch对大数据进行分布式计算与全文检索;如何利用Logstash对日志文件智能分析与处理;如何利用Web接口Kibana对日志进行高效的搜索、可视化、分析等各种操作是,是本书的论述重点。
从工程实践的角度掌握ElasticSearch、Logstash、Kibana的基本使用方法和技巧,很有必要。目前,国内专门针对ElasticSearch、Logstash、Kibana进行介绍的书很少,本书是目前国内较早的一本综合介绍ELK架构的编著,涉及范围广泛,内容新颖,条理清晰,组织合理。
实战Elasticsearch、Logstash、Kibana ——分布式大数据搜索与日志挖掘及可视化解决方 pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版