搜狐网站
搜狐 ChinaRen 17173 焦点房地产 搜狗
搜狐数码频道 > 硬件频道 > 显卡频道 > 显卡新品

NVIDIA GF100功耗280W且无法生产

来源:走进中关村
2010年02月02日15:55

  NVIDIA GF100架构正落入和G200相同的陷阱,即花费巨大成果却很小。现在,让我们来看看GF100的架构,并且分析一下GF100的市场前景。

  如果你还记得,去年5月我当时谈到过GT300芯片,它现在被称为费米或GF100。当时我谈论的中心思想是GF100核心面积太大,发热量过大,几乎在所有领域都是设计错误的产品。 NVIDIA企图设计震撼世界的通用图形处理器芯片,它原本可能达到这个目标。不幸的是,现在没有可持续的市场来支撑这个怪兽级芯片。这种通用图形处理器性能必须足够强悍,并且必须能够制造。虽然GPU已经有暂时和可预见的将来,并且也许有大的可持续的市场,通用图形处理器市场则完全是另外一回事。NVIDIA正将费米放在这个危险的赌注之上,这种赌注需要最好的管理才能。

  什么是NVIDIA要推出产品?正如我们刚才所说的流片,GF100费米的芯片尺寸是23.x*23.x毫米,我们听到的是费米GF100芯片面积将控制在550平方毫米之内,与此相比非常不利的是,它的主要竞争对手,ATI Crypesss HD5870图形芯片的面积只有334平方毫米。ATI可以从1张晶圆上收获超过160颗Crypreess芯片,但NVIDIA只能收获104颗GF100芯片。更糟的是,有缺陷的GF100芯片大约占去一张晶圆大约1/3面积,这意味着考虑到芯片尺寸差别,NVIDIA公司可以收获的正常工作的芯片数量之及ATI可以收获数量的1/3。

  NVIDIA GF100原料制造成本将是ATI Crypress两倍还多。如果GF100 512个着色器的设计目是真实的,最近GF100产率达到40%的报道就非常不真实,GF100产率不会达到NVIDIA目前40nm产品产率的一半,并且可能远远少得多。

  成本之外,接下来的问题就是功耗。在CES上演示的GF100显卡功耗 280W,这对单GPU显卡来说,非常危险,因为功耗已经接近PCIe显卡300W的最大值。 NVIDIA公司可以选择打破上限,但它不能再说GF100是一张PCIe显卡。OEM厂商也无法接受功耗大于300W的显卡产品,因为销售明知超出规范规定的产品,将给他们的肩膀抗上一个巨大的责任,OEM厂商一贯的做法是避免一切不必要的责任和成本。

  280W和550平方毫米,就是NVIDIA可以从台积电目前芯片工艺上获得的最大功耗和芯片面积,无论在功耗还是在芯片面积上,GF100已经几乎没有发展空间就。而NVIDIA的竞争对手,却还有60%的芯片面积和50%的功耗可以增加,同时成本还继续低于GF100的成本。这使NVIDIA只能在性能上取得胜利,无法在其它方面同样取得胜利。如果你没有耐心读完本文,那么这就是本文简短的结论:NVIDIA G100无法取得胜利。

  再回到GF100架构本身,黄仁勋之前曾经将Intel的Larrabee图形芯片讽刺问为“Laughabee”(可笑的bee),但是现在黄仁勋自己也在作完全相同的事情。正如我们去年5月所说的那样,GF100几乎没有固定的功能单元,甚至没有tessellator(曲面细分单元)。在G200当中固定的单元,在GF100当中大多分散开来,这种设计是有好有坏。

  这种设计又是如何得来的呢?在硅谷的消息来源告诉SemiAccurate,GF100从来就不是一个图形芯片,它开始作为通用图形处理器芯片进行计算,然后被NVIDIA放弃。当G200的继任者并没有成功,GF100架构于是重新拿出并且摇身一变,成为1个图形芯片架构。这和之前ATI R500Xenos的遭遇非常相似,但R500最终的结果却皆大欢喜。

  GF100如何从通用图形处理器变成图形芯片?NVIDIA为其中每个着色多处理器(SM着色单元,GF100有16个SM)添加了1组逻辑单元,负责DX11所需要的一些工作。这样做的好处是,GF100将有通用图形处理器芯片的优势缺点是,本来可以卖2500美元的产品,现在只能忍痛卖500美元,这在经济上非常不划算。鉴于GPU市场竞争激烈,NVIDIA公司无法对GF100进一步提价以应付成本。

  去年5月我们就说了,NVIDIA并没有专门的硬件tessellators(曲面细分)单元。 NVIDIA称GF100有硬件曲面细分单元,即使我们的消息来源坚持认为它没有。可以说,NVIDIA公司要么是撒谎要么是鸡蛋里挑骨头,但GF100的确没有tessellator(曲面细分)单元。

  相反,GF100 拥有NVIDIA声称的所谓“Polymorph”引擎,而且每个SM单元都有1个这样的引擎。基本上它增加了一些着色功能的子集,这些子集即NVIDIA所谓的“tessellator”(曲面细分)单元,但事实并非如此,竞争对手ATI设计了1个相当小且专用的硬件tessellator单元,且具充分的伸缩性,在HD5xxx系列产品当中都可以看到它的身影。在ATI5xxx显卡当中,镶嵌单元几乎不占用着色时间。在GF100当中,因为没有真正的专用曲面细分硬件,因此应用程序当中,镶嵌细分工作量越大,着色单元的占用量越大。

  NVIDIA会吹捧GF100曲面细分的伸缩性,但是这只是当NVIDIA推出入门和主流费米产品的时候,并且负责曲面细分的SM数量也会缩水。而ATI 5xxx因为采用专门的曲面细分硬件单元,因此入门到主流到高端的5xxx显卡,其曲面细分单元没有丢失任何东西,并且所占面积也完全相同。

  NVIDIA在2010 CES上炫耀GF100曲面细分性能的时候却非常小心,以Unigine出品的Heaven Benchmark为例,声称GF100以60%领先程度,击败了ATI 5870。虽然技术上来说没错,但是这个领先数字在2个方面有故意误导的嫌疑。首先是,这是GF100曲面细分发挥地最好的情况下。如果要显示Unigine软件其它任何测试结果,这种领先程度将大大缩小。

  其次,测试对系统其他部分要求很低,因此曲面细分对系统的任何资源需求很可能会被掩盖。这一测试不可能符合GF100实际使用的情况,这也正是Unigine Heaven Benchmak被选中的原因。合成基准测试通常被用在最好的情况下,而Unigine Heaven Benchmak正是这样。

  最后一点是,我们的消息来源报道说,NVIDIA公司将GF100和Radeon HD5870进行对比,而Radeon HD5870显卡售价比GF100便宜得多。如果NVIDIA拿同等价位,功耗相似的ATI HD5970显卡来进行对比,其结果将不会有多么漂亮。ATI HD5970显卡的曲面细分性能是ATI HD5870显卡的两倍,因此NVIDIA明显不愿意拿ATI HD5970显卡来进行对比。

  另外有趣的是,GF100提升了ROP数量,从G200/GTX280/GTX285的32个提升到48个。虽然ROP数量不会计入两种架构之间任何效率提高当中,但是着色器数量和ROP数量比值,已经大幅下降,这充分说明了GF100预定的目标市场。

  另外,纹理单元数已由G200的80个下降到GF100的64个。同样,没有纹理单元效率的具体数字,这种对比也不一定完美。但是,去年春天我们获悉GF100原定的纹理单元数量是128个。因此,在纹理性能上,GF100不是提高性能,和G200相比,性能却是在降低。

  因此,现在看来,NVIDIA是尽可能让原本定位通用计算的GF100架构具备游戏功能。从图形芯片面积与性能之比可以看到,图形芯片的功能似乎是被NVIDIA强行固定到一个通用图形处理器上。

  NVIDIA让GF100转向游戏市场,因此GF100并没有多大可以回旋余地。NVIDIA公司无法进一步提升GF100芯片面积和功耗,从成本决算上来看,GF100几乎是无法制造的。如果NVIDIA和AMD在图形芯片竞争上的脚步趋缓,或者2500美元以上通用计算市场比较成熟,那么GF100的高成本还能接受,但是现在这2种情况都不存在。

  迄今为止在DX10游戏和DX11演示demo显示,GF100在合成基准测试当中,最多领先更便宜更有效率的HD5870 60%。鉴于GF100芯片面积超过超过5870 60%以上,NVIDIA应该让GF100和芯片面积更大的5970进行对比,奇怪的是ATI 5970在 CES上被NVIDA直接忽视了,主要是因为GF100在最好的情况下,只能和5970打成平手。

  这种情况,让GF100的零售价格只能和5970持平,或更低。由于GF100目前产率在40%,1颗GF100芯片的生产成本就高达125美元,远高于ATI Cypress的50美元,ATI公司单卡双芯片的成本,也比GF100低上25美元。并且280W功耗意味着NVIDIA几乎不可能推出管线和功能不被阉割的单卡双GF100显卡。

  NVIDIA公司已经告诉其显卡制造合作伙伴,和他们最初收到的GF100芯片相比,GF100零售版芯片的工作频率和管线数量将大幅度削减,有可能和费米Tesla版本一样,只有448个流处理器。NVIDIA将会向评测网站和部分PR分发512个流处理器和不缩减工作频率的“特挑”版本,但产率不会让这种特挑版本大批量上市。

  更糟糕的是,SemiAccurate在亚洲的消息来源也表示,目前A3版本的GF100情况也是一团糟。去年春天,我们被告知,该版本的GF100目标频率是1500-1600MHz,但是目前台积电拿出的版本,其工作频率无论如何突破不了1400MHz大关,并且量产频率只能固定在1200MHz,即便量产频率只有目标频率的75%,GF100量产在经济上来说还是不划算的。

  根据1个消息来源透露,目前GF100 A3版本时钟频率无法提升的主要原因,在于GF100的时钟频率和芯片内部各个部分都有关系,并非单一问题,即牵一发动全身,无法通过单一方案来解决问题。

  对于工作电压,现在NVIDIA处于两难境地,现在A3版运行在1个比较低的工作电压,同时具有比较高的工作电流。如果你提高了电压,那么A3版G100功耗就会不成比例增加,超越其他包括HD5870在内的芯片。如果NVIDIA增加电压,G100功耗就会超越PCIEe显卡功耗的最高上限,如果NVIDIA不增加功耗,芯片内部部分“脆弱”的晶体管将无法运行在较低的电压上正常工作。

  不幸的是,对NVIDIA来说,GF100架构设计很糟糕。目前GF100为了达到正常工作,已经牺牲了32个流处理器,并且为了能卖出$ 2,500 - $4000的价格,通用计算版费米,也降低工作频率,并且把流处理器数量砍到 448个。显然,NVIDIA无法精挑细选完全不砍流处理器数量的费米,因为这种精挑细选的芯片数量无法支撑费米通用计算版本或者是GPU版本的市场需求。

  NVIDIA公司已承诺在2月下旬向显示卡厂商批量出货GF100,因此,今年3月发布看来是可行的。在CES上NVIDIA已经通知显示卡厂商,他们将只收到砍流处理器数量的GF100芯片,如果显示卡厂商强烈需求不“阉割”的GF100芯片,那么NVIDIA只会向它们出货数量少得可怜的完全不阉割的GF100芯片。如果你是在新闻媒体或者评测者,并且正在排队等待评测NVIDIA 完全不阉割的GF100显卡,那么你要等待很长时间,因为僧多粥少。

  GF100现在的情况,正是我们去年春天被告知的情况。GF100芯片太热,太大,太集中于通用计算,而不是在图形计算,并且从经济上无法生产。NVIDIA公司在精挑细选的测试项目上,能让GF100赢过更便宜的5870显卡,但它害怕和同等价位,工作噪音更低的HD5970进行对决。这也算是绿色的“Laughabee”吧。

  在未来几个星期内NVIDIA和所在地硅谷将冒出更多的GF100传闻,NVIDIA短时间内还无法发售GF100显卡,只能绝望地看到ATI在DX11 GPU市场蓬勃发展。另一方面,ATI 正在丰富完善它的DX11 GPU产品线,在未来极短时间内,我们将看到ATI DX11产品完全覆盖整个桌面GPU市场,甚至是廉价低端市场。

  直到GF100有足够的数量可以发布,NVDIA在各地的公关现在只能做的就是搞噱头。与此同时,ATI公司正在迅速接近发布衍生产品所需要的6个月时间,如果NVIDIA GF100衍生产品符合经济利益, AMD有可能在GF100衍生产品推出之前完成下一代产品的发布。NVIDIA目前没有新产品可以推出,只能原地打转,这让善于原地打转的冰上舞蹈选手都相形见绌。

  原创编译https://www.semiaccurate.com/2010/01/17/nvidia-gf100-takes-280w-and-unmanufacturable/

责任编辑:yangzhixin
上网从搜狗开始
网页  新闻
*发表评论前请先注册成为搜狐用户,请点击右上角“新用户注册”进行注册!
设为辩论话题

我要发布

近期热点关注
网站地图

数码频道

搜狐 | ChinaRen | 焦点房地产 | 17173 | 搜狗

实用工具