【搜狐数码编译】1月16日,在上周的CES上,Nvidia发布了新一代Tegra 4芯片。这款芯片配备了4枚主频为1.9GHz的ARM Cortex A15核心,还有主频在700-800MHz之间的第五枚Cortex A15核心,用于简单任务的处理。虽然公司总裁黄仁勋所展示的重点在CPU和拍摄性能上的提升,但这枚芯片的GPU性能相比Tegra 3也应该拥有显著的提升。
让许多人失望的是,Tegra 4保持了前任的非统一构架,其GPU也并不完全支持OpenGL ES 3.0。Nvidia声称该构架更加适合可供Tegra 4设备所使用的内容。
尽管和Tegra 3存在相似之处,Tegra 4 GPU的部件也进行了提升。虽然我们距离这块深藏在构架上的GPU还有一点距离,但已经有更多的细节浮出水面。
Tegra 4拥有72个GPU“核心”,那些都是真正的Vec4 ALU独立部件,能够在标量和矢量下工作。Tegra 2采用了单一的Vec4顶点着色单元(4核心),以及单一的Vec4像素着色单元(4核心)。Tegra 3的像素着色单元数量翻倍(4+8核心)。Tegra 4则拥有6个Vec4顶点着色单元(FP32,24核心)和3个深层Vec4像素着色单元(FP20,48核心)。结果是6倍于Tegra 3的ALU数量,全部以满载时钟速率运行的话就比Tegra 3 GPU的520MHz要高。Nvidia暗示了Tegra 4的像素着色设计要比Tegra 3所使用的更加高效。
如果我们假设520MHz的最大频率(Tegra 3的极限),一枚功能完全的Tegra 4 GPU可以提供比PowerVR SGX 554MP4(苹果A6X所使用)更多的理论计算。前者的优势来自于更高时钟速率的结果而非更大的芯片空间。这并不一定意味着更高的性能,特别是鉴于Tegra 4的非统一构架。Nvidia声称,在最终时钟速率下,Tegra 4在3D游戏和GLBenchmark测试下的速度都要比A6X快。下面泄露的GLBenchmark结果明显是来自于一枚更老的修订版芯片,与芯片的最终时钟速率相去甚远。
相比Tegra 3,新一代芯片在GPU方面的确提供了额外的性能增强,加入了真正的超采样AA和帧缓存压缩(色彩和z缓冲),对24位Z缓冲或模板缓冲(从每像素16位提升)的支持,最大纹理分辨率现在是4K x 4K(从Tegra 3的2K x 2K提升),PCF算法现在也支持阴影,最后,FP16纹理过滤混合功能也被硬件所支持。(Eskimo)
我来说两句排行榜