编辑推荐
 ;
 ;《大数据资源》是上海市数据科学重点实验室主任朱扬勇教授主编的“大数据三部曲”丛书(资源,技术和应用)中的首部,联合了国内外研究数大据资源的专业科研机构,包括中国科学院科学数据研究中心、哈佛大学医学院、复旦大学、上海交通大学、山东农业大学、上海财经大学、东华大学、云南大学、上海市交通信息中心、上海市节能监察中心等,围绕政务、科学数据、农业、金融、制造业、能源、医疗、交通,大数据治理、大数据质量等领域,深入研究这些领域积累的数据资源,相关数据资源,国内外范围内的相关数据资源机构,数据资源的获取途径和方法。本书系国内首部系统论述大数据资源的著作,对国内大多数行业领域的大数据资源获取和研究,支撑大数据决策具有重大的参考价值。
内容简介
《大数据资源》基于大数据行业的发展情况,选择应用比较热门的行业,对该行业的大数据资源分类、特点、获取方法等进行深入介绍,主要包括金融、能源、农业、制造业、交通、医疗、科学研究等领域。本书共分10章:第1章,绪论;第2章,政府数据资源;第3章,科学数据与资源共享;第4章,农业领域数据资源;第5章,制造业大数据资源;第6章,金融数据资源;第7章,交通数据资源;第8章,能源数据资源;第9章,医疗大数据;第10章,数据质量;第11章,大数据治理。《大数据资源》的读者对象包括计算机学科和数据科学学科的高等院校师生,金融、医疗、交通、城市规划、智慧城市等领域应用大数据技术和开发实践的工程技术和研究人员,以及广大大数据相关专业的管理、决策人员。
作者简介
朱扬勇,复旦大学计算机科学技术学院教授、学术委员会主任,上海市数据科学重点实验室主任,上海市政府信息化专家委员会专家,中国计算机学会大数据专家委员会专家,美国马里兰大学客座教授。从事数据领域研究25年,是国内最早一批从事数据挖掘研究的学者,是国际数据科学研究的主要倡导者之一。主持过国家自然科学基金、国家863计划项目、上海市科委重点等多项数据挖掘领域的研究课题,曾获上海市科技进步一、二、三等奖。相关研究成果在国内外权威期刊或会议上发表论文100余篇,出版专著2本,教材3本。2009年发表了数据科学论文“Data Explosion, Data Nature and Dataology”,并出版了第一本数据科学专著《数据学》(《DATAOLOGY AND DATASCIENCE》),对数据科学进行了系统化的探讨和描述。
目录
第1章 绪论
1.1 基本概念
1.1.1 数据
1.1.2 数据界
1.1.3 大数据
1.2 数据资源
1.2.1 数据资源的形成
1.2.2 数据矿床
1.2.3 数据资源的战略性
1.3 数据资源建设
1.3.1 面临的问题
1.3.2 数据权属
1.3.3 国有数据资源和市场数据资源
前沿
2008年,熊赟教授和我发表了一篇题为“加强数据资源保护和开发利用”的文章。我们提出了“数据资源是重要的现代战略资源,其重要程度将越来越显现,在本世纪有可能超过石油、煤炭、矿产,成为最重要的人类资源之一”;“数据资源开发利用滞后于网络基础设施和应用系统的建设,制约了国家信息化的综合效益”;“数据资源保护不利、开发不足、利用不够的现象将长期存在”;“提高数据资源开发利用水平、保护国家的战略资源是增强我国综合国力和国际竞争力的必然选择”。也是在这篇文章中,我们第一次提出“数据界(DataNature)”、“数据科学(DataScience)”和“数据学(Dataology)”。我们还建议 “从信息化转向数据资源开发利用”、“政府政务公开数据要有限度”、“加强国家、企业和公民隐私数据保护”。很欣慰,这些观点现在都已经被大家所接受。2012年,我提出“大数据包括数据、技术和应用三个要素”,2015年熊赟教授和我在《大数据》创刊号上以“大数据是数据、技术还是应用”为题对此进行了系统论述。
也很欣慰,大数据包含数据、技术和应用三个要素的观点正被广泛接受。在大数据发展开始进入理性并逐步落地的阶段,我想是时候将数据、技术和应用三个大数据要素更详细地进行阐述,为国家的大数据发展尽绵薄之力。于是在和上海科学技术出版社商量之后,我开始组织编写《大数据资源》、《大数据技术》和《大数据应用》,也可以算“大数据三部曲”吧。
《大数据资源》主要阐述什么是数据资源;如何进行数据治理;在建设数据资源过程中,如何控制数据质量,以便将来形成高质量的数据资源。还给出一些典型的大数据资源,包括政府数据资源、科学大数据资源、农业数据资源、金融数据资源、交通大数据资源、制造业大数据资源、能源大数据资源、医疗数据资源等,一个领域的大数据资源包括本领域生产的数据、领域外部生产的和本领域数据分析相关的数据。作者尽可能列出这些数据资源的出处,便于读者在实际应用中能够找到这些数据资源。参与编写的有叶雅珍、石蕾、王卷乐、高孟绪、王超、宋长青、李俊清、张洁、秦威、吕佑龙、汪俊亮、陈云、张超、俞立、刘可伋、翟希、何承、顾承华、张扬、任庚坡、葛志松、毛俊鹏、汤春蕾、蔡莉、杨琳、高洪美、宋俊典、张绍华等,感谢这些作者的辛勤劳动。
《大数据技术》主要阐述大数据技术。信息化是生产数据的,大数据是开发数据的,开发数据的技术称为数据技术;更重要的是,信息化是“技术进步促进数据增长”,而大数据是“数据增长促进技术进步”。面对日益增长的数据规模,大数据技术对人类社会发展意义重大。希望2018年完成《大数据技术》。
《大数据应用》主要给出了一些大数据应用的案例。我计划最后来写《大数据应用》。主要原因是目前很多关于大数据的美丽故事,离我们理解的大数据还有差距。现在还没有让我满意的大数据应用案例,希望在未来两年能够收集到足够好的大数据应用案例。希望2019年完成《大数据应用》。
想写好大数据三部曲的心情不言而喻。《大数据资源》已成,所有参与的作者都非常努力和认真,表现出高水平,但由于我本人知识水平和组织能力的限制,书稿还是有许多不满意和遗憾,在此我向读者表示歉意,向参与的作者表示歉意。有位编辑说,写本书能引起大家批评也不错,说明大家在关注。所以,等待读者的批判,感谢。
《大数据资源》即将交付印刷了,不能再修改和等待了。刚好今天航程将近6小时,让我在白天能够有这么长时间的宁静,思绪到远方,写下这些文字,作为序。
朱扬勇
2017年11月8日
大数据资源 pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版