Tegra 4图形芯片性能解析比Tegra 3有显著提升

正文
我来说两句(人参与)

2013年01月16日07:34

来源：搜狐数码作者：搜狐数码

　　【搜狐数码编译】1月16日，在上周的CES上，Nvidia发布了新一代Tegra 4芯片。这款芯片配备了4枚主频为1.9GHz的ARM Cortex A15核心，还有主频在700-800MHz之间的第五枚Cortex A15核心，用于简单任务的处理。虽然公司总裁黄仁勋所展示的重点在CPU和拍摄性能上的提升，但这枚芯片的GPU性能相比Tegra 3也应该拥有显著的提升。

　　让许多人失望的是，Tegra 4保持了前任的非统一构架，其GPU也并不完全支持OpenGL ES 3.0。Nvidia声称该构架更加适合可供Tegra 4设备所使用的内容。

　　尽管和Tegra 3存在相似之处，Tegra 4 GPU的部件也进行了提升。虽然我们距离这块深藏在构架上的GPU还有一点距离，但已经有更多的细节浮出水面。

　　Tegra 4拥有72个GPU“核心”，那些都是真正的Vec4 ALU独立部件，能够在标量和矢量下工作。Tegra 2采用了单一的Vec4顶点着色单元（4核心），以及单一的Vec4像素着色单元（4核心）。Tegra 3的像素着色单元数量翻倍（4+8核心）。Tegra 4则拥有6个Vec4顶点着色单元（FP32，24核心）和3个深层Vec4像素着色单元（FP20，48核心）。结果是6倍于Tegra 3的ALU数量，全部以满载时钟速率运行的话就比Tegra 3 GPU的520MHz要高。Nvidia暗示了Tegra 4的像素着色设计要比Tegra 3所使用的更加高效。

　　如果我们假设520MHz的最大频率（Tegra 3的极限），一枚功能完全的Tegra 4 GPU可以提供比PowerVR SGX 554MP4（苹果A6X所使用）更多的理论计算。前者的优势来自于更高时钟速率的结果而非更大的芯片空间。这并不一定意味着更高的性能，特别是鉴于Tegra 4的非统一构架。Nvidia声称，在最终时钟速率下，Tegra 4在3D游戏和GLBenchmark测试下的速度都要比A6X快。下面泄露的GLBenchmark结果明显是来自于一枚更老的修订版芯片，与芯片的最终时钟速率相去甚远。

　　相比Tegra 3，新一代芯片在GPU方面的确提供了额外的性能增强，加入了真正的超采样AA和帧缓存压缩（色彩和z缓冲），对24位Z缓冲或模板缓冲（从每像素16位提升）的支持，最大纹理分辨率现在是4K x 4K（从Tegra 3的2K x 2K提升），PCF算法现在也支持阴影，最后，FP16纹理过滤混合功能也被硬件所支持。（Eskimo）