编辑推荐
精通MongoDB——*流行的“大数据”NoSQL数据库技术,搭建MongoDB环境、使用GridFS和新的聚集框架、使用非SQL命令处理数据、复制、复制标签和标签分片、优化MongoDB ;
内容简介
本书根据MongoDB的*版本做了相应更新,其中包含MongoDBn*的所有特性,包括版本2.2中引入的聚集框架和版本2.4中引入的哈希索引。MongoDB是最流行的“大数据”NoSQL数据库技术,并且正处于发展中。来自10gen的David Hows以及具有丰富MongoDB开发经验的Peter Membrey和Eelco Plugge,组成了本书的专家团队,他们在本书中分享了自己的专业知识和经验,帮助你了解成为MongoDB专家所需的所有知识。
主要内容
◆在所有主流平台上搭建MongoDB,包括Windows、Linux、OS X和云平台(例如Rackspace、Azure和Amazon EC2)
◆用GridFS和新的聚集框架
◆使用非SQL命令处理数据
◆使用PHP或Python编写应用
◆优化MongoDB
作者简介
目录
第Ⅰ部分 MongoDB基础
第1章 MongoDB简介
1.1 了解MongoDB哲学 1.1.1 使用正确的工具处理正确的工作 1.1.2 天生缺少对事务的支持 1.1.3 JSON和MongoDB 1.1.4 采用非关系的方式 1.1.5 选择性能还是特性 1.1.6 在任何地方均可运行数据库 1.2 将所有组合在一起 1.2.1 生成或创建键 1.2.2 使用键和值 1.2.3 实现集合 1.2.4 了解数据库 1.3 了解特性列表 1.3.1 使用面向文档存储(BSON) 1.3.2 支持动态查询 1.3.3 为文档创建索引 1.3.4 使用地理空间索引 1.3.5 分析查询 1.3.6 就地更新信息 1.3.7 存储二进制数据 1.3.8 复制数据 1.3.9 实施分片 1.3.10 使用映射和归约函数 1.3.11 全新的聚合框架 1.4 获取帮助 1.4.1 访问网站 1.4.2 与MongoDB开发者沟通 1.4.3 剪切和粘贴MongoDB代码 1.4.4 在Google小组中寻找解决方案 1.4.5 利用JIRA跟踪系统 1.5 小结第2章 安装MongoDB 2.1 选择版本 2.2 在系统中安装MongoDB 2.2.1 在Linux中安装MongoDB 2.2.2 在Windows中安装MongoDB 2.3 运行MongoDB 2.3.1 先决条件 2.3.2 研究安装目录布局 2.3.3 使用MongoDB shell 2.4 添加额外的驱动 2.4.1 安装PHP驱动 2.4.2 确认PHP安装正确 2.4.3 安装Python驱动 2.4.4 确认PyMongo安装正确 2.5 小结第3章 数据模型 3.1 设计数据库 3.1.1 集合的更多细节 3.1.2 使用文档 3.1.3 在文档中内嵌或引用信息 3.1.4 创建_id字段 3.2 构建索引 3.3 使用地理空间索引 3.4 在真实世界中使用MongoDB 3.5 小结第4章 使用数据 4.1 浏览数据库 4.2 在集合中插入数据 4.3 查询数据 4.3.1 使用点号 4.3.2 使用函数sort、limit和skip 4.3.3 使用固定集合、自然顺序和$natural 4.3.4 获取单个文档 4.3.5 使用聚集命令 4.3.6 使用条件操作符 4.3.7 使用正则表达式 4.4 更新数据 4.4.1 使用update()更新 4.4.2 使用save()命令实现upsert 4.4.3 自动更新信息 4.4.4 指定匹配数组的位置 4.4.5 原子操作 4.4.6 以原子的方式修改和返回文档 4.5 重命名集合 4.6 删除数据 4.7 引用数据库 4.7.1 手动引用数据 4.7.2 使用DBRef引用数据 4.8 使用索引相关的函数 4.8.1 学习索引相关的命令 4.8.2 强制使用某个索引查询数据 4.8.3 限制查询匹配 4.9 小结第5章 GridFS第Ⅱ部分 在开发中使用MongoDB第6章 PHP和MongoDB第7章 Python和MongoDB第8章 高级查询第Ⅲ部分 使用MongoDB处理大数据第9章 数据库管理第10章 优化第11章 复制第12章 分片
前沿
译 者 序
随着大数据的不断发展,非关系型数据库已经变得越来越重要,相关的产品也都得到了飞速发展。而其中MongoDB更是佼佼者,作为高性能开源文档数据库,MongoDB以敏捷、可扩展和对企业应用友好而著称。使用MongoDB的公司包括Foursquare、Craiglist,、迪士尼、SAP、Intuit、EA等。
本人从2013年开始有幸能够接触到MongoDB,并在实际工作中使用它。但是在学习使用过程中始终存在着一些困难,MongoDB相关的书籍太少,尤其是中文方面的,并且对MongoDB的讲解也不够详尽。因此,如果想彻底了解和学习MongoDB,就必须硬啃它的官方文档,这对于英文能力不佳的读者肯定也是难点。
所以这次清华大学出版社准备引进出版此书时,我感到非常高兴,也非常荣幸能够负责本书的翻译工作。能够为MongoDB的推广做出一点贡献,能帮助大家深入了解MongoDB的强大特性,我就感到非常满足了。
《MongoDB大数据处理权威指南(第2版)》由浅入深地介绍MongoDB的基础知识、使用和高级功能,并且提供了丰富的样例,保证读者在读完本书之后能独立搭建起自己的开发环境。即便是对NoSQL毫不了解的读者,也可以顺利完成本书的阅读。对于有一定开发经验的读者,相信本书关于数据库优化、复制和分片方面的讲解也会让你感到耳目一新。总而言之,本书是学习MongoDB数据库的一本不可多得的精品之作。
另外,感谢清华大学出版社的编辑们为本书付出的心血。同样感谢妻子对我翻译工作的支持和鼓励。没有你们的支持和鼓励,本书就不可能顺利出版。
对于这本经典之作,译者对本书进行了严格审校,对其中一些具有争议的地方也进行了反复考证,但个人精力有限,难免有疏漏之处,敬请各位读者谅解。如有任何意见或建议,请不吝指正。本书全部章节由王肖峰翻译,参与翻译活动的还有杜欣、高国一、孙其淳、孙绍辰、徐保科、尤大鹏、袁强强、张宏、张立红、邓伟、王蕊。
最后,希望各位读者能够早日掌握强大的MongoDB特性,轻松地处理工作中遇到的问题,如原书作者所描述的:轻松工作,按时下班!
致 谢
感谢MongoDB团队曾经和现有的所有成员。没有他们的帮助我们就无法完成本书的编写,人们对数据存储的观点也会出现极大的不同。我要特别感谢悉尼MongoDB团队的同事们,他们为本书的编写提供了极大的帮助。
——David Hows
编写书籍是一个团队性的工作。即使有时只有一个作者,在幕后也会有许多人帮助将所有东西整合在一起。因此我非常感谢MongoDB社区和Apress的所有人,感谢他们的辛勤工作、耐心和支持。特别要感谢Dave和Eelco,他们帮助完成了本书的第2版。
我还想感谢Chuck Smith,一位让我迷上世界语并让我保持有很高兴趣的朋友(维基百科世界语版本的创始人)。这正好与本书第2版的编写产生了交集,我对学习世界语的极大兴趣延伸到了本书的编写上。另外还必须感谢L.L.Zamenhof博士,他创建了世界语。一个远超于时代的人,我希望能带着这个梦想前进。
最后,感谢妻子Sarah的耐心和长久的支持。
——Peter Membrey
感谢9gag社区,没有他们本书就无法在数月前完成。
——Eelco Plugge
我想感谢mongodb-user和mongodb-dev邮件列表中的所有成员,感谢他们能够忍耐我提出的无休止的问题。
——Tim Hawkins
前言
我接触数据库的时间相对较晚,从2006年才开始使用MySQL。在学完所有计算机本科都提供的逻辑课程之后,我开始使用MySQL构建出一个完整的LAMP架构,其中用到了一些基本表。此时,我并未对SQL表管理的复杂性进行深入思考。不过,随着时间的流逝,我看到了存储越来越多异构数据的需要,并且随着时间的推移,简单的模式可以如何在它的生命周期中成长和演变。
我第一次接触MongoDB是在2011年,当时Peter Membrey建议我不要使用包含30个键行以及30个值行的上下文表,而是应该使用MongDB实例来存储数据。就像所有开发者在面对一项新技术时的感觉一样,我对之嗤之以鼻并且坚持我原来的计划。直到我使用糟糕的设计已经完成一半代码时,Peter仍然坚持我应该尝试使用MongoDB,此时我才接受意见。如同所有来自SQL阵营的开发者一样,MongoDB能够接受任何类型数据并且可以根据任何搜索条件返回这些数据的能力让我感到震惊。直到现在我也仍然大呼过瘾。
——David Hows
本书的组织方式在本书中,Peter、Eelco Plugge、Tim Hawkins和我都希望能够完全地展示出我们在学习MongoDB时的经验:在保持设计简单和清晰的同时,教会你如何使用MongoDB。每章内容都将展示一个单独的样例数据库,因此你可以按照模块或线性的方式阅读本书;这完全取决于你自己。这意味着如果愿意,你可以略过某些特定的章节,而不会影响你对其他内容的学习。
本书的样例命令将显示在它们的输出中。它们将以等宽的“代码”字体出现,并且会以加粗的方式显示,以便与其他结果输出加以区分。在大多数章节中,你都会遇到提示、警告和注意,它们包含有用的有时甚至极其重要的信息。
——David Hows
免费在线读
了解MongoDB哲学
如同所有的项目一样,MongoDB有一套自己的设计哲学用于帮助指导开发。本节内容将介绍一些MongoDB数据库的基本原则。
1.1.1使用正确的工具处理正确的工作
MongoDB中最重要的哲学概念是:一鞋难合众人脚。在过去的许多年中,传统的关系(SQL)数据库(MongoDB是面向文档的数据库)一直被用于存储所有类型的数据。无论该数据是否符合关系模型(被用在所有的RDBMS数据库中,例如MySQL、PostgresSQL、SQLite、Oracle、SQLServer等)都无所谓;无论如何,数据都将被填充到数据库中。一般来说,部分原因是因为读取和修改数据库相比操作文件系统更加简单(和安全)。如果选择一本PHP方面的书籍,例如PHPforAbsoluteBeginners,byJasonLengstorf(Apress,2009),它将会教你使用数据库存储信息,而不是文件系统。这样做只是因为它更简单。在使用数据库存储信息的时候,开发者必须一直遵守它的工作流程。很明显,我们并未按照数据库原有的意图使用它。任何尝试在数据库中存储复杂数据、创建5张表,然后将它们组合在一起的开发者,都会明白我们在讲什么。
MongoDB团队决定他们不会创建另一个试图为所有人做所有事情的数据库。相反,该团队希望创建一个只用于处理文档的数据库,而不是行,并且它的速度要快,还要具有强大的扩展性和易用性。为了实现这个目标,他们不得不忽略一些特性,这意味着MongoDB在某些特定的情况下并不是最理想的选择。例如,它缺少事务支持,意味着无法使用MongoDB编写财务应用。也就是说,MongoDB可能对于之前提到的部分应用(例如存储复杂数据)是非常合适的。不过这不是个问题,因为你完全可以在财务模块中使用传统的RDBMS,而使用MongoDB存储文档。这样的混合解决方案非常常见,并且一些产品级应用(例如NewYorkTimes网站)已经在这样做了。
一旦适应MongoDB可能无法解决所有问题的理念之后,你会发现对于某些问题,MongoDB可以完美地解决它们,例如分析(例如网站中使用的实时GoogleAnalytics)和复杂数据结构(例如博客文章和评论)。如果你仍然无法接受MongoDB是一个正式的数据库工具这个观点,那么请提前跳到1.3节“了解特性列表”,该部分内容将展示MongoDB的一些强大特性。
注意:
缺少事务和其他传统数据库特性并不意味着MongoDB不稳定,或者不能用于管理重要数据。
MongoDB设计背后的另一个关键概念是:数据库应该一直具有多个副本。如果单个数据库实例出现问题,那么它可以轻松地通过另一个服务器恢复到正常状态。因为MongoDB的目标是尽可能地快,所以它采取了一些捷径,导致它难以从系统崩溃中恢复。开发者认为最严重的系统崩溃可能就是从服务中移除一台计算机;这意味着即使数据库完全恢复了,也无法正常使用。记住:MongoDB不会尝试为所有人完成所有事情。但对于许多目的(例如构建Web应用),MongoDB是一个能够实现解决方案的完美工具。
现在你应该已经明白了MongoDB的起源。它不会尝试在所有方面都表现完美,也乐于承认它不会适用于所有人。不过,对于选择使用它的开发者,MongoDB提供了一个功能丰富的面向文档数据库,并且对运行速度和扩展性做了优化。它也几乎可以运行在任何目标上。MongoDB的网站上包含了可运行在Linux、MacOS、Windows和Solaris中的安装文件。
MongoDB成功实现了这些目标,因此使用MongoDB有点像梦幻一样(至少对于我们来说)。不必担心如何将数据压缩到一张表中,只需要将数据组合在一起,然后将数据传递给MongoDB。考虑一个真实的例子。本书的合作者PeterMembrey最近开发了一个应用,用于存储一组eBay搜索结果。搜索结果的数量是不固定的(最多100个),因此他需要一种简单的方式在数据库中将用户和搜索结果关联起来。
Peter曾尝试使用MySQL,他不得不设计出一张表用于存储数据,并编写相应代码存储他的结果,然后再编写代码将结果组合在一起。这是一个相当常见的场景,大多数开发者在开发中经常会遇到。通常,我们不得不这样做;不过,对于该项目,他决定使用MongoDB,因此事情就变得有点不同了。
具体地说,他添加了下面这样两行代码:
request[ebay_results]=ebay_results_array
collection.save(request)
在本例中,request是Peter的文档,ebay_result是键,而ebay_result_array包含来自eBay的搜索结果。第二行保存了修改后的数据。将来当他访问该文档时,他将获得与之前格式完全相同的数据。他不需要任何SQL;也不需要执行任何会话;更不需要创建任何新表或编写任何特殊代码——MongoDB就可以完成工作。他最终轻松地完成了工作,并按时回家。
……
MongoDB大数据处理权威指南(第2版)(大数据应用与技术丛书) pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版