- 当天更新视频:5部 视频总数量:78283部
Udacity课程7.1 额外的并行计算课题详情
在线播放和下载地址: [ 无需安装任何插件即可快速在线观看和下载 ]
这部关于GPU(图形处理器)的视频教程是Udacity公开课最新推出的一部线上课程,有两个讲师。其中,John Ownes是UC Davis大学电子与计算机工程学院的副教授,在学校带领一群优秀的研究生探索图形处理器(GPU)计算前沿。另一位讲师叫Dave Luebke,是NVIDA的高级研究主管,在NVIDIA研究三维图。他与John Ownes及另外一些人一起致力于扩展GPU的应用范围已经有很多年了。
本期课程是Udacity公开课 课程7.1:并行计算模式B模式,由Dave Luebke主讲。第七单元已经是这一课程的最后单元了。Dave Luebke说很高兴学员能坚持跟随课程学到现在,希望大家学到更多用CUDA进行并行编程的知识。在最后这个单元,有所不同,我们不再深入讨论一个话题,相反,将广泛涉及许多话题,进行简短的讨论。目的是根据学员的兴趣和需要,给大家一些可以继续跟进的指南。
并行计算科学中主要研究的是空间上的并行问题。从程序和算法设计人员的角度来看,并行计算又可分为数据并行和任务并行。一般来说,因为数据并行主要是将一个大任务化解成相同的各个子任务,比任务并行要容易处理。
空间上的并行导致了两类并行机的产生,按照Flynn的说法分为:单指令流多数据流(SIMD)和多指令流多数据流(MIMD)。我们常用的串行机也叫做单指令流单数据流(SISD)。MIMD类的机器又可分为以下常见的五类:并行向量处理机(PVP)、对称多处理机(SMP)、大规模并行处理机(MPP)、工作站机群(COW)、分布式共享存储处理机(DSM)。
图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。用途是将计算机系统所需要的显示信息进行转换驱动,并向显示器提供行扫描信号,控制显示器的正确显示,是连接显示器和个人电脑主板的重要元件,也是“人机对话”的重要设备之一。显卡作为电脑主机里的一个重要组成部分,承担输出显示图形的任务,对于从事专业图形设计的人来说显卡非常重要。
GPU的结构决定了它的数学运算能力巨大,但 分支控制性能低下。它要求在每个计算单元中执行完全相同的操作,因此,只适合执行可以大量并行化的运算。另外,目前GPU硬件是专为单精度浮点运算设计的,执行双精度运算性能会降低一个数量级,对运算精度要求高的场合暂时还不宜使用GPU。所以,GPU目前还不能取代CPU。 因此,GPU大规模并行通用计算的理想运用模式是:用CPU控制主要的流程,将问题分解,把需要大量并行处理的计算密集型任务放到GPU上处理。另外,研究传统问题的新算法,使之适于并行计算也是一大发展方向。