欢迎光临
免费的PDF电子书下载网站

数据分析——基于内容与结构的网络舆情分析报告(2015) PDF下载

编辑推荐

暂无

内容简介

在Web2.0技术与应用不断深化以及移动应用不断产生的新时代,互联网已成为社会民意与民声的重要来源。利用互联网中用户产生的各种数据进行社会舆情分析,已成为当前信息检索与情报获取的一个重要研究方向。人们深刻地认识到,网络信息不仅有研究与应用价值,而且是保证国家或企业安全的重要基础,具有重要的战略意义与社会经济价值。本书对2014年天涯论坛网民在经济、政治、民生、生态以及国际与军事等几个关键领域的网络民意,从网络文本数据挖掘的角度进行了初步分析。此外,应用社会网络分析方法直观地展示了一些与内容分析相符的结论。通过这些相关的分析,反映出热点事件以及相关民意,期望为相关机构和部门信息决策提供参考。

作者简介

饶元,副教授/博士生导师,西安交通大学软件学院,业务分析与技术系副主任。计算机软件与理论专业博士学位,随后在清华大学自动化系CIMS中心-用友软件公司从事联合博士后研究工作,并曾担任用友软件公司SOA创新中心主任,多年软件企业工作经验。是《电子学报》《通信学报》《International Journal of Information Processing and Management》等期刊的审稿人。

数据分析——基于内容与结构的网络舆情分析报告(2015) PDF下载

目录

第1章 社会网络分析研究概况 1
1.1 基于论坛的网络舆情分析基础 2
1.2 数据特征分析 4
第2章 分析方法、模型和数据指标的构建 9
2.1 社会化网络分析方法 9
2.2 主要模型的构建 12
2.3 数据分析指标 17
2.4 主要算法 24
2.5 本章小结 27
第3章 领域舆情整体网及数据视图 28
3.1 整体网络特征分析 28
3.2 经济社区网络特征分析 29
3.3 政治社区网络特征分析 36
3.4 民生社区网络特征分析 42
3.5 生态社区网络特征分析 49
3.6 国际和军事社区网络特征分析 56
3.7 本章小结 62
第4章 经济领域的相关舆情分析 64
4.1 经济领域热点专题和热点词分析 64
4.2 经济领域意见领袖分析 67
4.3 专题1:房市与房价专题 70
4.4 专题2:股市与股票 85
4.5 专题3:货币与汇率 99
4.6 本章小结 112
第5章 政治领域的相关舆情分析 113
5.1 政治领域热点专题热点词分析 113
5.2 政治领域意见领袖分析 117
5.3 专题1:国企改革 119
5.4 专题2:反腐风暴 133
5.5 专题3:依法治国 147
5.6 本章小结 159
第6章 民生领域的相关舆情分析 161
6.1 民生领域热点专题和热点词分析 161
6.2 民生领域意见领袖分析 165
6.3 专题1:教育与就业 168
6.4 专题2:收入分配 183
6.5 专题3:社会与医疗保障 199
6.6 本章小结 213
第7章 生态领域的相关舆情分析 215
7.1 生态领域热点专题和热点词分析 216
7.2 生态领域意见领袖分析 220
7.3 专题1:生态环境 222
7.4 专题2:生态资源 236
7.5 专题3:技术或措施 249
7.6 本章小结 260
第8章 国际与军事领域的相关舆情分析 261
8.1 国际与军事领域热点专题和热点词分析 261
8.2 国际与军事领域意见领袖分析 265
8.3 专题1:领土与主权 268
8.4 专题2:合作共荣 285
8.5 专题3:国际事故 299
8.6 本章小结 312
第9章 社会舆情分析工作总结与展望 314
9.1 社会舆情分析总结 314
9.2 下一步工作展望 317
主要参考文献 318
后记 320

前沿

前 言
网络技术特别是移动互联网络技术与应用的快速发展,推动了大数据时代的来临。一方面,人们越来越多地依赖网络,将其工作与生活的见解、经验、评价与情感以O2O的方式即时地共享和发布到网络之中;另一方面,人们也希望将这一些由群体共同创建的信息所组成的大数据资源,通过一些合理的分析方法与共享机制来实现数据信息的价值利用。面对网络中存在的这样一些海量的、结构无序的和以内容为核心的特殊数据,借助社会网络的分析方法与文本挖掘的方法,人们可以更好地从数据之间存在的关系网络结构特征以及内容文本特征中寻找到分析问题的新视角。这也是本研究报告在对网络舆情进行分析与研究工作基础之上,希望建构与表达的一种数据分析的整体框架;这也是在2014年由科学出版社出版的**本报告之后,一年来我们对网络舆情研究与分析方法的一次升级与提升。
社会网络分析方法研究是一种相对较为成熟但近年来又十分活跃的领域,该方法原本应用于社会科学领域,通过调查问卷获取采样数据并分析不同的社会结构组成、社会网络中不同组成成员之间的联系、社会结构的演化行为等内容,为人们理解构成社会的人群静态结构特征以及不同类型人群之间的动态行为特征之间的关系,并为管理与决策提供更优的决策依据。
但是,随着网络技术与应用的发展,特别是即时交流工具与Web2.0的一些应用,极大地推动了现实物理社会向网络虚拟社会的行为迁移。在这种信息迁移的过程中,人们极大地突破了时间与空间的界限。一方面,使过去以口述自然语言的无记录交流方式,变成了以网络语言的文字或多媒体数据记录的方式进行交流,从而沉淀了大量的文本数据与多媒体数据内容,而且这些数据的规模每年均以指数方式爆炸性增长,从而改变了传统的社会网络分析过程中的数据抽样模式;另一方面,不同的人群沉积的信息中存在大量有价值的信息与知识,如何利用人类历***有效的信息共享机制,深度挖掘这些信息中存在的宝贵内容知识资源,为更多的人提供知识与信息服务,已成为新的数据时代下人们面对的一个新机遇与新挑战。因此,社会网络分析也正在向社会计算与社会智能的方向发展与演化。
因此,有人开始对未来网络社会的工作与交流模式进行了预测,并惊呼“淘宝”“微信”等社会化工具的*为令人担心的一件事情就是:随着时间的流逝,网络记录了一代人的成长、朋友、交流、交易、娱乐等多种类型的个性化数据信息,从而通过这一些数据的分析,很容易形成一个个人或者机构的轮廓模型,通过这个模型可以分析小到普通百姓消费者、大到单位机构甚至国家领导人的行为偏好与情感交流特征,这也是为什么Google、IBM、Facebook等国际巨头不惜重金在网络领域与舆情分析领域开展深入研究的根本原因之一。特别是在美国斯诺登曝光的“棱镜门”事件后,使人们更加深刻地认识到,网络信息不仅具有理论研究价值与商业应用价值,同时是保证一个国家或企业安全的重要基础,因此具有重要的战略意义与社会经济价值。
西安交通大学软件学院社会智能与复杂数据处理实验室自2012年成立起,便开始从事网络内容与行为的研究,特别希望从文本挖掘与自然语言处理以及社会网络分析方法的角度,探索网络舆情分析方法与社会计算的技术研究策略。三年来,已发布两份社会舆情分析报告,而本报告则是在前面两份报告的基础上,对网络舆情分析方法与指标体系的进一步完善与优化,并对2014年1月到2015年3月期间的网络热点事件进行了跟踪与数据分析,期望通过这些相关的分析,找出中国在经济、政治、民生、生态以及国际事务与军事等范畴下的一些关键网络事件,以及人们在事件讨论过程中所折射出来的草根民意,也期望可以为相关机构与决策部门提供一些参考信息。
本报告得到了众多热心人士的支持帮助,特别是西安交通大学软件学院的领导与老师曾经提供了研究环境与设备资源,还有一些老师将关键的技术、业务分析方法以及数据处理的建议毫无保留地进行分享,在此一并道谢。同时,感谢责任编辑为本报告的面世提供了积极的建议与帮助。特别要感谢的是西安交通大学软件学院社会智能与复杂数据处理实验室的所有老师以及研究生们,通过三年来持续的研究与实践,探索了从简单的数据处理到集成舆情分析平台的设计与开发实现,这些工作为后续不断地深入研究与实践提供了大量的技术与人才储备。另外,通过年度报告研究与发布,锻炼和培养一批优秀的青年才俊。这些青年人才及其努力向上的精神是这个实验室*核心的、*宝贵的智力资产与共同精神财富。
本报告由冯妮同学协助进行整体规划,宋明爽、员鹏、眭欣阳参与了报告的指标定义、算法实现以及全文的整理,并负责了相关内容的数据分析,为本实验室的知识服务平台以及金融风险预测与评估平台的建设奠定了相应的技术基础。我们相信,通过实验室所有人员的共同努力,不仅能够为更多的网民、企业以及政府机构提供越来越深入、越来越有价值的文本挖掘与网络舆情分析成果,也可以将相关共性技术应用于不同的研究领域。希望本报告的面世能“抛砖引玉”,建立一个向同行专家学习和交流的新平台,一方面可以不断促进我们专业分析水平的提升,另一方面可以加强与更多专业机构的协同交流与合作共享。
特别要说明的是,本系列报告的目的在于研究如何利用信息技术与软件工具对网络中的信息进行分析与文本数据的挖掘,也期望利用技术来解决实际中的一些问题。为了保证数据来源的真实性与客观性,在本报告中涉及部分网民的“真实的”网名,在此特别声明,我们仅仅为了表明在研究过程中的客观性,并没有其他的用意。
由于我们的技术水平以及分析能力的限制,本报告虽然较以往的工作有了新的进展,但尚有许多亟待进一步提升与改进的空间,所以希望同行的学者、专家与同仁不吝赐教。希望未来十年,我们可以利用系列报告的方式来不断提升我们的研究与分析水平与能力,以及提高内容与信息挖掘的使用价值,为更多人提供专业的信息与知识服务。
本报告得到了国家科技部“火炬计划”(2012GH571817)、国家社科基金重大项目“基于多学科理解的社会网络分析模型研究——虚拟Web网络空间中的社会网络模型与个体行为机制研究”(13ZD177)、2015年度陕西省科技厅协同创新计划(2015XT-21)“基于网络化感知计算的智慧社区管理关键技术应用示范研究”项目、2015年西安市科技局产学研协同创新计划(CXY1514(5))“基于内容挖掘的专利地图可视化服务的关键技术研究”项目以及中央高校“科研基金”(08143003)等项目的支持,在此一并表示衷心的感谢。

编 者
西安交通大学软件学院
社会智能与复杂数据处理实验室
2015年6月25日

数据分析——基于内容与结构的网络舆情分析报告(2015) pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:数据分析——基于内容与结构的网络舆情分析报告(2015)