欢迎光临
免费的PDF电子书下载网站

Stata数据统计分析教程(Stata入门必备书籍,全面、系统讲解软件的基础知识、数据访问及管理等内容,并配有大量来源于实践的案例) PDF下载

编辑推荐

  《Stata数据统计分析教程》

  Stata入门必备书籍,全面、系统地讲解了软件的基础知识、数据访问及管理等内容,并配有大量来源于实践的案例;

结构系统,讲解清晰,通俗易懂,实用性强,是统计人员、Stata初中级用户、医学及生物研究人员、数据管理员以及其他数据分析人员的必备参考书籍。 ;

内容简介

  廉启国编著的《Stata数据统计分析教程》定位 为Stata入门级的书籍,以Windows平台下Stata 13 .1 MP版本为基准,围绕数据访问、数据管理、数据 呈现和数据分析4个核心问题进行了详细阐述(并介绍 了大量实用且免费的第三方命令)。此外,本书还介 绍了Stata编程以便提高用户日常科研工作效率并介 绍了工作流程以有助于用户更好地实施项目管理(含 数据的加密和恢复)。最后,本书通过两章对近年来 比较热门的Meta分析和日常科研中频繁使用的样本量 估计进行了介绍。


作者简介

  廉启国 上海市计划生育科学研究所助理研究员,复旦大学在职博士,研究方向为青少年发育与行为医学,有10年以上Stata使用经验。他是公卫人网(www.epiman.cn)的创建者,公卫人网是一个公共卫生专业网站,创建于2006年11月11日。公卫人网曾用名“流行病人”,主要定位于流行病学专业交流;后因讨论话题扩大到整个公共卫生领域,更名为“公卫人”,并沿用至今。

Stata数据统计分析教程(Stata入门必备书籍,全面、系统讲解软件的基础知识、数据访问及管理等内容,并配有大量来源于实践的案例) PDF下载

目录



前言
致谢
第一部分 软件入门
第1章 Stata入门
1.1 Stata软件概述
1.1.1 Stata的发展历史与版本选择
1.1.2 Stata的正确读写与文献引用
1.1.3 Stata的软件特点与优势
1.1.4 Stata的主要功能模块
1.2 Stata 操作入门
1.2.1 Stata的安装与激活
1.2.2 Stata的启动与退出
1.2.3 Stata的操作方式
1.2.4 Stata的结果输出
1.2.5 Stata的自定义设置
1.3 Stata 使用基础
1.3.1 Stata的文件格式
1.3.2 Stata的变量类型
1.3.3 Stata的运算符
1.3.4 Stata的语法规则
1.3.5 Stata的使用实例
1.4 Stata升级扩展
1.4.1 Stata软件升级
1.4.2 Stata第三方命令的查找与安装
1.4.3 Stata的帮助文件及学习资源

第二部分 数据访问
第2章 数据访问
2.1 数据格式概述
2.2 直接录入数据
2.2.1 用Stata的数据编辑器录入
2.2.2 用Stata的命令窗口录入
2.3 数据的读取与保存
2.3.1 直接读取和保存Stata格式的数据
2.3.2 导入/导出Excel格式的数据
2.3.3 导入/导出带分隔符的文本格式数据
2.3.4 导入/导出自由格式的文本格式数据
2.3.5 导入/导出固定格式的文本格式数据
2.3.6 导入/导出SAS XPORT 格式的数据
2.3.7 导入/导出 XML格式的数据
2.3.8 导入/导出SPSS格式的数据
2.4 数据格式转换软件Stat/Transfer简介
2.4.1 Stat/Transfer 支持的数据类型
2.4.2 Stat/Transfer 数据转换
2.5 数据录入软件EpiData Entry简介
2.5.1 建立调查表文件
2.5.2 生成REC文件并建立CHK文件
2.5.3 录入数据并导出
2.5.4 EpiData Entry伴侣 EpiMate简介

第三部分 数据管理
第3章 数据清理
3.1 双次录入数据的一致性检验
3.2 逐个变量对数据进行检查
3.3 通过交叉表对数据进行检查
3.4 通过分层对数据进行检查
3.5 通过逻辑对数据进行检查
3.6 更正数据
3.7 识别重复记录
3.8 对缺失值进行检查
3.8.1 缺失值编码
3.8.2 缺失值函数
3.8.3 缺失值检查
……
第4章 标签和注释
第5章 变量加工
第6章 数据集加工

第四部分 数据呈现
第7章 统计描述
第8章 报表制作
第9章 图形绘制

第五部分 数据分析
第10章 假设检验

第六部分 科研必备
第11章 Stata编程基础
第12章 Meta分析
第13章 样本量与检验效能

附录A 常用Stata命令一览表
附录B 常用Stata函数一览表
附录C SAS和Stata的差异
附录D 常见的SPSS代码及对应的Stata代码
附录E 工作流
参考文献

前沿

前 言
为什么要写这本书
Stata是一款无与伦比的统计软件,它优雅、高效且易学。Stata诞生于1985年1月,第一个版本只有44个命令和175页文档。2015年是Stata诞生30周年,目前Stata已经发生了翻天覆地的变化,历经30个版本的迭代,已经升级至14.0版,支持矩阵编程和多核处理器,且提供20本合计超过11 000页的文档。Stata日趋完美,用户遍布200多个国家和地区,已成为最重要的统计软件之一。
作者是2004年在复旦大学读硕士研究生时,在赵耐青教授和张文彤博士的课程中接触并喜欢上Stata的,十年弹指一挥间,也积累了一些Stata的使用经验。一个偶然的机会,在机械工业出版社华章公司李华君编辑的建议下,开始尝试本书的撰写工作。写作的过程也是一个重新学习和梳理的过程,因为将自以为掌握的知识写出来并非易事。
Stata 8是Stata发展的一个重要里程碑,但是在生物统计学和医用统计学领域,有关Stata的书籍还不是很丰富,很多书籍也都是介绍Stata 8之前的软件,未能紧跟Stata的发展步伐。本书定位为Stata入门级的书籍,以Windows平台下Stata 13.1 MP版本为基准,围绕数据访问、数据管理、数据呈现和数据分析4个核心问题进行了详细阐述(并介绍了大量实用且免费的第三方命令)。此外,本书还介绍了Stata编程以便提高用户日常科研工作效率并介绍了工作流程以有助于用户更好地实施项目管理(含数据的加密和恢复)。最后,本书通过两章对近年来比较热门的Meta分析和日常科研中频繁使用的样本量估计进行了介绍。
读者对象
本书适合的阅读对象如下:
Stata初中级用户
医务人员
医学/生物科研人员
数据管理员
生物统计师
其他行业有数据分析需求的人员
如何阅读本书
本书的每个章节都是一个相对独立的知识块,读者可以选择从头开始逐章阅读,如果有一定Stata基础和使用经验的话也可以根据目录跳转到感兴趣的章节。本书主要分为6部分,总计13章,另外还有5个附录。基本结构如下。
第一部分 软件入门(第1章)
第一部分介绍了Stata的基础知识,包括Stata软件概述(发展历史与版本选择、正确读写与文献引用、软件特点与优势)、Stata 操作入门(安装与激活、启动与退出、操作方式、结果输出、自定义设置)、Stata 使用基础(文件格式、变量类型、运算符、语法规则)、Stata升级扩展(软件升级、第三方命令的查找与安装、帮助文件及学习资源)。
第二部分 数据访问(第2章)
第二部分介绍了Stata在数据导入/导出方面的功能,包括Stata自带的数据导入和导出功能、数据导入的第三方命令(usespss)、数据转换软件(Stat/Transfer和EpiMate)、数据录入软件(EpiData Entry)。
第三部分 数据管理(第3~6章)
准确的数据是以后进行科学分析的基础,所以在进行数据分析之前,确保数据已被清理干净是非常必要的。数据管理是个非常枯燥的工作,但它是一切后续工作的基础。第三部分介绍了Stata在数据管理方面的强大功能(尤其是时间戳功能),包括数据清理、标签和注释、变量加工和数据集加工4章。
第四部分 数据呈现篇(第7~9章)
第四部分介绍了Stata在数据呈现方面的功能,包括统计描述、报表制作和图形绘制3章。Stata在数据呈现方面的功能非常强大,尤其是Stata的绘图效果堪称完美,建议对图形有特别要求的读者仔细阅读第9章的内容。
第五部分 数据分析(第10章)
Stata的数据分析非常完善,由于篇幅所限,本书只介绍了统计分析中最常用的一些Stata的功能,包括正态性检验和变换、t检验、方差分析、非参数检验、卡方检验、流行病学表格分析、相关分析、线性回归模型、logistic回归模型、等效性检验。在多元回归模型里特别增加了流行病学家和统计学家对自变量纳入的不同考虑。
第六部分 科研必备(第11~13章)
第六部分是为从事科研工作和数据处理工作的读者准备的,包括Stata编程基础、Meta分析、样本量与检验效能3章。建议对编程感兴趣的读者仔细阅读编程基础一章,医学/生物相关的专业人员需要特别关注的是Meta分析以及样本量与检验效能两章。
免责声明
本书中提及了大量的软件和服务,包括商业的(如:Stata、SAS、SPSS、Stat/Transfer、PASS、Beyond Compare、FileWall、BitLocker、金山数据恢复软件、顶尖数据恢复软件)、免费的(如:EpiData、EpiMate、Power and sample size、uWall、魔方数据恢复、Eraser、金山快盘、有道云笔记、百度云盘、OneDrive、DropBox和Google Drive)和开源的(如:R)3类。作者声明自己与这些软件和服务无任何利益关系,仅为提供更多信息。
此外,本书借鉴了大量的参考资料,并在所引用之处都尽可能地标注了文献出处,若有疏漏之处,作者在此深表歉意,并请及时联系我们,以便在后续版本中增加。
勘误和支持
由于作者的水平所限,经验不足,加之编写时间不尽宽裕,书中疏漏、错误之处在所难免,不妥之处恳请读者批评指正。
本书的勘误信息会发布在公卫人的Stata专版(网址:www.epiman.cn/forum-9-1.html),作者会在Stata专版中不定期更新书中的遗漏。当然,也欢迎读者将在阅读本书时遇到的疑惑、错误和建议在Stata专版中发帖提出。如果有些话题比较隐私,可以发送邮件至作者的邮箱(qglian@fudan.edu.cn),期待能够收到各位的真挚反馈。

免费在线读

  第一部分
  软件入门
  第1章 Stata入门
  工欲善其事,必先利其器。选择一款得心应手的统计软件非常重要,优秀的统计软件不仅要预算合理、功能强大、易于上手、使用方便,而且还要具有前瞻性、权威性、灵活性和可扩展性。此外一个繁荣的用户社区也必不可少。Stata具有强大的统计与计量分析、精致的绘图、简单易行的窗口操作、简练便捷的编程、强大的Mata矩阵运算、丰富的网络资源等功能,这些使其成为世界上用户最多的软件之一,被高度评价为“数据分析的操作系统”,而不仅仅是一款“数据分析软件”。Stata是众多高等院校、研究机构和商业公司在进行数据分析时的首选软件,并被很多国家和国际组织指定为官方使用软件。
  1.1 Stata软件概述
  1.1.1 Stata的发展历史与版本选择
  Stata是一款通用的统计软件包(架构师是William Gould),诞生于1985年(确切说是1984年12月),是StataCorp的核心产品。Stata被世界各地众多的商业和学术机构所使用。大多数的Stata使用者是做研究工作的,尤其是研究经济学、社会学、政治科学、生物医学和流行病学等领域的人员。经历了30年的发展,Stata已经升级到14.0版,如表1-1所示。
  表1-1 Stata发展历程
  Stata版本 发布日期 Stata版本 发布日期
  1.0 1985年1月 2.1 1990年8月
  1.1 1985年2月 3.0 1992年3月
  1.2 1985年5月 3.1 1993年8月
  1.3 1985年8月 4.0 1995年1月
  1.4 1986年5月 5.0 1996年9月
  1.5 1987年2月 6.0 1999年1月
  2.0 1988年6月 7.0 2000年12月
  2.05 1989年4月 8.0 2003年1月
  (续)
  Stata版本 发布日期 Stata版本 发布日期
  8.1 2003年7月 11.0 2009年7月
  8.2 2003年10月 11.1 2010年6月
  9.0 2005年4月 11.2 2011年3月
  9.1 2005年9月 12.0 2011年7月
  9.2 2006年4月 13.0 2013年6月
  10.0 2007年6月 13.1 2013年10月
  10.1 2008年8月 14.0 2015年4月
  每个版本的Stata根据处理数据集大小,又可分为多核版、特别版、标准版和学生版4个型号。Stata/MP(多核版)是Stata软件中运行最快的软件包,适合多处理器计算机(包括双核和多核处理器),它在SE版本上对多核处理器做了特别的优化,MP代表multiprocessor;Stata/SE(特别版)适合大型数据集,SE代表Special Edition;Stata/IC(标准版)适合中等规模的数据,IC代表intercooled;Small Stata(学生版)适合小数据,仅提供给教育机构使用。此外,Stata还提供了嵌入式和网页应用的解决方案Numerics by Stata,在嵌入式环境中,Numerics by Stata拥有Stata的全部功能。
  Stata/IC可运行最多2047个变量的数据集,最大记录数取决于用户计算机的随机存取内存(RAM)的数量。Stata/IC在一个模型里最多可处理798个自变量,与其相比,Stata/SE和Stata/MP可以拟合更多自变量(高达10 998个)的模型,且可以拟合特定的、更大的时间序列的面板数据模型。Small Stata最多可运行99个变量及1200条记录,在一个模型里最多可处理99个自变量。4种型号的特点如表1-2所示。
  表1-2 Stata不同型号的特点
  型 号 最大变量数 最大自变量数 最大记录数 64位版本 并行处理 系统平台
  Stata/MP 32 767 10 998 不限① 有 是 三大平台②均支持③
  Stata/SE 32 767 10 998 不限① 有 否 三大平台②均支持
  Stata/IC 2047 798 不限① 有 否 三大平台②均支持
  Small Stata 99 99 1200 有 否 三大平台②均支持
  ① 最大记录数取决于计算机的随机存取内存(RAM)的数量。
  ② Windows、Mac、UNIX。
  ③ Mac仅支持Intel 64位处理器。

  ……

Stata数据统计分析教程(Stata入门必备书籍,全面、系统讲解软件的基础知识、数据访问及管理等内容,并配有大量来源于实践的案例) pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:Stata数据统计分析教程(Stata入门必备书籍,全面、系统讲解软件的基础知识、数据访问及管理等内容,并配有大量来源于实践的案例)