|
在介绍完CPU的发展阶段后,我们可以再从工作量上看看CPU与GPU的应用。纵观当前的客户应用形态,在视频、图形计算工作的负载方面,视频用得比较多。举个例子,现在视频已经占了整个互联网用户三分之一的流量。AMD如何通过自己的融聚技术满足目前大家所需要的现代工作负载要求呢?首先我们有x86技术,还有GPU技术。我们知道x86技术现在已经非常成熟,用于CPU的软件产品也非常成熟。所有的编程人员都知道如何根据它进行编程,同时有非常好的程序序列。从GPU来讲,也非常出色,负载优化,两者结合才使我们迎来了融聚时代。
AMD的APU战略构想,以CPU为基础,融合进GPU巨大的并行计算能力,从而满足未来的紧凑、小巧、低功耗、高性能的用户需求
那么,有了CPU和GPU,如何结合起来打造融聚技术呢?GPU是针对固定功能,主要是图形处理。但随着技术不断发展,也越来越有可编程性。CPU本身就具有很高的可编程性,随着演变发展,也可以承担一些GPU的工作。当我们的GPU编程性越来越高,当CPU密度越来越大,就有可能把两者结合起来,Chekib Akrout强调,这就是去年年底AMD为什么宣布了第一款融聚技术,我们称之为LIano。有了这种集成能力,我认为CPU、GPU不断密切配合,就可以获得更大的计算密度。有了非常好的计算密度,我们就可以搞出非常好的编程模型,让开发人员开发出新的应用,充分利用我们的架构。
AMD的APU未来规划,简而言之,APU就是集成了CPU与GPU优势的产物
现在有了异构计算环境,那么如何打造融聚计划呢?我们知道CPU越来越定制化,GPU的密度非常大。目前GPU开发速度一般比CPU开发速度快一些,GPU有时候一年可以推出新产品,而CPU通常要一、两年的时间。Chekib Akrout再次强调——为了进一步向前推进我们的融聚技术和APU技术,必须有最好的CPU和GPU技术,目前只有AMD才兼有这两种技术。对于这一点,并不难理解,笔者也基本认同。英特尔的CPU实力很强,但GPU方面还没有拿得出手的高性能产品。NVIDIA在GPU方面很强,其CUDA核心与编程架构,在HPC(高性能计算)领域还是很出名的,不过由于没有CPU产品线,NVIDIA的方案也必须建立在英特尔或是AMD的CPU平台上,毕竟GPU现在还不能当CPU使,运行操作系统。而且,在DX11时代,NVIDIA的进度也明显落后于AMD。所以,现在如果要拿出最好的CPU与GPU核心进行整合,也只有AMD能做到了。
AMD融聚技术产品设计方法,在设计之初就将CPU的IP核与GPU的IP核进行统一的考虑,并通过新一代的统一融聚内存控制器来满足具体的数据请求带宽,并设计出最终的APU
说到这,可能有些读者会问,英特尔不是已经有了这种所谓的CPU+GPU的整合产品了吗?那么AMD的APU的优势又体现在哪里呢?其实,只要看看两者的架构,就能明显看出其中的不同。
英特尔目前已经推出了集成GPU的32nm的Clarkdale处理器(隶属Westmere家族),它通过MCP(多芯片封装)技术,将CPU单元与GPU单元封装在一起,但并不是在一块晶圆上原本设计的,而从内部的结构来看,内存控制器移到了GPU单元上,GPU与CPU采用MCP接口相连,显然这与AMD的APU设计理念完全不同,这种设计虽然保证了GPU的效率,但对于CPU的性能将会产生较大的影响,这也就是“非原生”设计的一大弊病,并不能充分发挥CPU与GPU整合的威力。英特尔推出这款产品的本意其实更注重于平台成本的节省,而不是性能的提升
AMD的APU设计,从整合上看就是一体的,GPU与CPU在这里可以看做是不同的处理单元,而对外的接口,包括内存以及I/O则是统一的,这就意味着GPU与CPU核心可以共享内存和I/O地址空间,这对于编程和系统优化来讲,是非常诱人的。即使是数据传输效率,也提升明显。比如在以往的架构中(左上角),GPU要访问主内存中的数据,需要走PCI-E总线经北桥与CPU沟通,CPU再把内存数据发送给GPU,这样的操作效率可想而知,而在APU中,CPU与GPU单元的寻址可以在APU内部进行调度,效率明显提高。相比之下,英特尔的Clarkdale处理器虽然也集成了GPU芯片,但从寻址方式上仍然是传统的,效率方面不可同日而语
不过,GPU与CPU的融合有一个巨大的挑战就是能耗的管理和散热设计,对此Chekib Akrout表示认同,这也是AMD目前的研发重点,而大体的做法和CPU的能耗管理方法差不多,即不用的核心与功能单元就休眠,要用到时才重新打开,不过这涉及到对GPU多核心的精细调整与控制。
在介绍完CPU和GPU架构融合之后,现在要看看软件编程。我们知道有了CPU、GPU,就可以根据不同的线程决定去向,如果按序列进行就往CPU走,如果需要并行就往GPU走。实际上OpenCL和DirectX Compute都是旨在CPU和GPU的并行开发,这也是支持融聚技术发展的第一步。
AMD的融聚产品在软件编程方面,主导两个标准,即OpenCL与DirectX Compute,在这两者中,AMD都是积极的标准制作的参与和贡献者,而AMD自己的Stream SDK也将向业界标准靠拢
现在我们看看软件堆栈,最底下的是硬件,再上面是OpenCL和DirectXCompute,可以让设计人员充分利用我们的架构做工作。再上面的堆栈是所谓的中间件、编译器、调试器、剖面仪等等,可以让技术人员在不需要了解我们技术特性的情况下,继续开发新的内容。有了软件堆栈后我们就要对负载进行非常好的平衡。Chekib Akrout表示,从目前来看,只有AMD公司才有最佳的CPU、GPU软件堆栈和硬件,并帮我们把CPU和GPU的负载平衡起来。
AMD所设想的异构计算的软件生态系统,可以看出基础的硬件核心就是AMD的融聚产品,那当然也包括独立的CPU与GPU所组成的系统,再往上就是标准化的OpenCL与DirectX Compute通用编程环境,在此基础上开发者来开发面向用户的最终应用,而这些应用也将具备CPU与GPU负载均衡的能力
在介绍中,我们能感觉到AMD对于OpenCL和DirectXCompute的看重,而自己的Stream SDK已经放到相对次要的位置,这与NVIDIA大力宣传自己的CUDA编程架构有了明显不同。因此Chekib Akrout一直在强调在编程环境方面的开放性,在他看来,CUDA虽然很强大,但是一个封闭的环境,而开放的环境则对于用户更为友好,因此AMD也积极的加入到这两个标准的开发中。这么说其实并不难理解,毕竟OpenCL和DirectX Compute其实已经是APU能否成功的一大关键所在。
[上一页] [1] [2] [3] [下一页] |
1 | 苹果 iPhone 4(16GB) | ¥4950 | 论坛 |
2 | 诺基亚 X7 | ¥3000 | 论坛 |
3 | 诺基亚 C5-03 | ¥1150 | 论坛 |
4 | 诺基亚 Vertu Constellati | ¥219400 | 论坛 |
5 | HTC 野火 A315c | ¥1600 | 论坛 |
6 | 诺基亚 N8 | ¥2900 | 论坛 |
7 | 诺基亚 C7 | ¥2150 | 论坛 |
8 | HTC Desire S(G12) | ¥2450 | 论坛 |
1 | HTC 野火 A315c | ¥1600 | 论坛 |
2 | HTC Desire S(G12) | ¥2450 | 论坛 |
3 | HTC Sensation(G14) | ¥3300 | 论坛 |
4 | 诺基亚 N9 64G | ¥4850 | 论坛 |
5 | 三星 i9100(16GB) | ¥4160 | 论坛 |
6 | HTC Wildfire S(G13) | ¥1700 | 论坛 |
7 | 诺基亚 N8(粉色) | ¥2650 | 论坛 |
8 | 三星 C6712 | ¥1100 | 论坛 |
1 | 三星 i9100(16GB) | ↘340 | 论坛 |
2 | 诺基亚 E7 | ↘250 | 论坛 |
3 | 诺基亚 C6 | ↘250 | 论坛 |
4 | HTC 野火 A315c | ↘200 | 论坛 |
5 | 诺基亚 X7 | ↘120 | 论坛 |
6 | HTC Sensation(G14) | ↘100 | 论坛 |
7 | HTC 惊艳 S710d | ↘100 | 论坛 |
8 | 摩托罗拉 Atrix 4G | ↘100 | 论坛 |