欢迎光临
免费的PDF电子书下载网站

MIC高性能计算编程指南 PDF下载

编辑推荐

追随并行计算一线专家的足迹,带你步入MIC的神秘殿堂。
高效能服务器和存储技术国家重点实验室主任、浪潮-Intel中国并行计算联合实验室主任王恩东,英特尔副总裁Rajeeb Hazra,PhD亲自为本书作序并推荐。

内容简介

    《MIC高性能计算编程指南》是全球第一本全面介绍MIC软硬件体系架构、应用及编程开发优化的书籍。书中介绍了使用MIC进行通用计算所需要了解的硬件架构、语法、程序优化技巧等知识,是进行MIC高性能与通用计算程序开发的入门教材和参考书。本书共分12章。第1章介绍高性能计算的发展历程;第2章深入介绍MIC的软硬件架构;第3章介绍MIC编程环境的搭建;第4章引入一个简单的MIC实例;第5章简要介绍与MIC编程相关的PpenMP和MPI相关知识;第6章详细讲解了MIC编程的语法;第7章介绍MIC编程用到的工具软件;第8章介绍MIC可以使用的数学库及其用法;第9章详细讲解如何优化MIC程序,从多个方面系统阐述了MIC优化的方式和方法;第10章通过一个典型的矩阵乘法示例,展示MIC优化方法的应用;第11章介绍将MIC技术应用于工程中的流程和方法;第12章引入两个实际工程的例子,讲解如何将MIC技术应用于实际生产过程当中。《MIC高性能计算编程指南》可作为MIC的入门学习和编程参考书,主要面向从事高性能计算的程序员与工程师、MIC加速计算专业领域的科研人员,以及对MIC通用计算感兴趣的程序员,也可作为开设相关课程的高等院校与科研机构的教材。本书由王恩东等编著。

作者简介

    王恩东,浪潮-Intel中国并行计算联合实验室主任,研究员,国务院特殊津贴专家,“863”计划领域专家,高效能服务器和存储技术国家重点实验室主任、浪潮集团高级副总裁,兼任国际信息处理联合会(IFIP)中国委员会主席、中国计算机学会副理事长等职,获国家科技进步奖3项,并获何梁何利奖,发明专利26项。张清,浪潮-Intel中国并行计算联合实验室首席工程师,浪潮HPc应用技术经理,主要从事高性能计算、并行计算,研究CPU多核、GPU、MIC众核技术,曾在生命科学、石油、气象、金融等HPC领域主持多个异构并行计算项目。沈铂,浪潮-Intel中国并行计算联合实验室应用研发资深工程师,主要从事高性能算法、软件开发与优化等方面的技术研究与应用工作,具有多年的生命科学、石油物探、气象等领域开发调优经验。张广勇,内蒙古大学计算机体系结构专业硕士,现任浪潮-Intel中国并行计算联合实验室研发工程师,主要从事GPU/MIC高性能应用软件的开发优化工作,具有丰富的项目开发经验,并在国内外会议期刊发表多篇优秀论文。卢晓伟,大连理工大学计算机应用技术硕士,浪潮-Intel中国并行计算联合实验室应用研发资深工程师,主要从事多个科学领域的算法移植、优化等工作,具有丰富的高性能异构协同计算开发经验。

MIC高性能计算编程指南 PDF下载

目录

序一
序二
前言
第一篇  MIC基础篇
 
第1章  MIC高性能计算 
1.1  多核、众核计算的发展 
1.2  MIC技术简介 
1.3  为什么要选择MIC 
1.3.1  SMP 
1.3.2  集群(cluster) 
1.3.3  GPGPU 
第2章  MIC硬件及软件架构 
2.1  MIC硬件架构 
2.1.1  术语解析 
2.1.2  MIC硬件架构概览 
2.1.3  MIC Core 
2.1.4  环形互联总线Ring 
2.1.5  CLOCK 
2.1.6  页表(Page Tables) 
2.1.7  系统接口 
2.1.8  性能监控单元和事件管理器 
2.1.9  电源管理 
2.2  MIC软件架构 
2.2.1  概述 
2.2.2  Bootstrap 
2.2.3  Linux加载器 
2.2.4  微操作系统(OS) 
2.2.5  对称通信接口(SCIF) 
2.2.6  主机驱动 
2.2.7  sysfs节点 
2.2.8  MPI应用的MIC软件栈 
2.2.9  应用编程接口(API) 
第3章  MIC安装、环境配置 
3.1  MIC环境配置 
3.1.1  前期准备 
3.1.2  安装Host端的Linux操作系统 
3.1.3  安装MIC驱动 
3.1.4  安装在MIC上编译C/C++的编译器 
3.2  SDK示例运行 
第4章  第一个MIC实例——计算PI 
第5章  OpenMP和MPI编程基础 
5.1  OpenMP基础 
5.1.1  OpenMP简介 
5.1.2  OpenMP编程模型 
5.1.3  OpenMP语法简要介绍 
5.2  MPI基础 
5.2.1  启动和终止MPI库 
5.2.2  获取信息 
5.2.3  发送和接收消息 
第6章  MIC编程 
6.1  MIC编程模型 
6.2  应用模式 
6.2.1  CPU原生模式 
6.2.2  CPU为主MIC为辅模式 
6.2.3  CPU与MIC对等模式 
6.2.4  MIC为主CPU为辅模式 
6.2.5  MIC原生模式 
6.3  MIC基本语法 
6.3.1  offload 
6.3.2  变量和函数声明 
6.3.3  头文件 
6.3.4  环境变量 
6.3.5  编译选项 
6.3.6  其他问题 
6.4  MIC上的MPI 
6.4.1  MIC上的MPI限制 
6.4.2  MIC上MPI编程模型 
6.4.3  MIC上的MPI环境配置 
6.4.4  编译及使用 
6.4.5  MIC上的MPI示例 
6.5  SCIF编程 
6.5.1  什么是SCIF 
6.5.2  SCIF的基本概念介绍 
6.5.3  SCIF基本通信过程 
6.5.4  SCIF用到的API函数 
第7章  MIC软件调试与性能分析工具 
7.1  Intel软件工具链对MIC的支持 
7.2  MIC软件调试工具IDB 
7.2.1  IDB简介 
7.2.2  IDB的操作界面 
7.2.3  IDB对MIC架构的支持与要求 
7.2.4  使用IDB调试MIC程序 
7.3  MIC性能分析工具VTune 
第8章  Intel MIC MKL库使用方法 
8.1  Intel MKL核心函数库介绍 
8.2  在MIC卡上使用Intel MKL 
8.2.1  编译器辅助offload方式 
8.2.2  自动offload方式 
8.3  FFT在MIC上的使用 
8.3.1  FFT简介 
8.3.2  FFT在MIC上的使用方法一 
8.3.3  FFT在MIC上的使用方法二 
8.4  BLAS在MIC上的使用 
8.4.1  BLAS简介 
8.4.2  在MIC上调用BLAS库方法 
 
第二篇  性能优化篇

第9章  MIC性能优化 
9.1  MIC性能优化策略 
9.2  MIC优化方法 
9.2.1  并行度优化 
9.2.2  内存管理优化 
9.2.3  数据传输优化 
9.2.4  存储器访问优化 
9.2.5  向量化优化 
9.2.6  负载均衡优化 
9.2.7  MIC线程扩展性优化 
第10章  MIC优化示例:矩阵乘法 
10.1  矩阵乘法串行算法 
10.2  OpenMP多线程矩阵乘法 
10.3  MIC多线程矩阵乘法 
10.3.1  基本版本 
10.3.2  向量化优化 
10.3.3  SIMD指令优化 
10.3.4  矩阵分块乘法 
 

第三篇  工程开发篇
 
第11章  基于MIC的HPC应用开发过程 
11.1  热点测试 
11.1.1  准备工作 
11.1.2  热点测试及定位 
11.2  程序分析 
11.2.1  程序移植模式分析 
11.2.2  计算规模分析 
11.2.3  特点分析 
11.2.4  热点并行性分析 
11.2.5  向量化分析 
11.2.6  MIC内存分析 
11.2.7  程序分析总结 
11.3  MIC程序开发过程 
11.3.1  基于CPU的OpenMP并行 
11.3.2  基于MIC的线程扩展 
11.3.3  单节点CPU+MIC协同并行 
11.3.4  MIC集群并行 
第12章  基于MIC的HPC应用实例 
12.1  基于单节点CPU+MIC协同计算电子断层三维重构并行算法 
12.1.1  电子断层三维重构技术及SIRT算法介绍 
12.1.2  SIRT串行程序分析 
12.1.3  基于OpenMP的SIRT并行程序开发 
12.1.4  基于MIC平台的SIRT并行程序开发 
12.1.5  单节点多卡及CPU+MIC异构协同计算架构设计 
12.2  基于多节点CPU+MIC协同计算大涡模拟并行算法 
12.2.1  格子-Boltzmann大涡模拟算法介绍 
12.2.2  大涡模拟串行程序分析 
12.2.3  基于OpenMP的大涡模拟并行算法 
12.2.4  基于MIC的大涡模拟并行算法 
12.2.5  基于多节点CPU+MIC协同计算平台的大涡模拟并行算法 
参考文献 
 

 

MIC高性能计算编程指南 pdf下载声明

本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版

pdf下载地址

版权归出版社和作者所有,下载链接已删除。如果喜欢,请购买正版!

链接地址:MIC高性能计算编程指南