搜狐首页-新闻-体育-娱乐-财经-IT-汽车-房产-家居-女人-TV-ChinaRen-邮件-博客-BBS-搜狗 

数码天下 > 硬件频道 > 硬件评测 > CPU评测
英特尔Conroe为何如此之强?Core微架构全解析
时间:2006年04月29日09:48 我来说两句(0)  

 
作者:架构解析


 微指令融合(Micro-Op Fusion)是从 Banias 核心开始出现的技术,随后的 Yonah 微架构和 Core 微架构也都具备该技术,并不断进行改进。该技术通过减少X86指令解码后生成的微指令的数目,来降低乱序执行引擎和执行单元的压力,从而达到提升处理器效率的目的。

  首先让我们解释一下什么是微指令(Micro-Op)。由于X86指令集的指令长度、格式与定址模式都相当复杂,为了简化数据通路(Data Path)的设计,从很久以前开始,X86处理器就采用了将X86指令解码成1个或多个长度相同、格式固定、类似RISC指令形式的微指令的设计方法,尤其是涉及存储器访问的 load 及 store 指令。所以,现在的X86处理器的执行单元真正执行的指令是解码后的微指令,而不是X86指令。

  微指令融合技术,以及 Intel 的专属栈引擎技术(Dedicated Stack Engine),目的都在于减少微指令的数目。处理器内部执行单元的资源有限,如果可以减少微指令的数目,就代表实际执行的X86指令增加了,可以显著提升执行效能。而且,微指令的数目减少还有助于降低处理器功耗,可谓有益无害。

  微指令融合技术所支持的范围,包括了整数运算、浮点运算和SSE2指令集等各种扩展指令集。根据 Intel 的官方说法,通过微指令融合技术,整数运算大约可以提升5%的性能,浮点运算大约可以提升9%的性能。

  如今SSE、SSE2和SSE3等扩展指令集的重要性与日俱增,但是这些SIMD指令的存储器访问操作——尤其是128bit的操作——一般都需要解码成多条微指令,造成执行效率不高。在 Yonah 微架构与 Core 微架构中,这种类型的操作在很多时候可以解码成1条微指令,从而降低了后端执行单元的压力,对提高SIMD指令的执行效率有不小的帮助。

  细心的读者可能会发现,我们前面曾经提到,Core 微架构每个周期最多可以解码5条X86指令。奇怪的是,这里只有4个解码单元。那么,怎样才可以做到解码5条指令呢?这就需要介绍 Intel 在 Core 微架构的前端引入的一项新的技术——宏指令融合(Macro-op Fusion)。

  所谓宏指令(Macro-Op),即X86指令。宏指令融合技术的引入使得 Core 微架构在前端可以把2条宏指令融合为1条微指令。例如,X86指令中的cmp指令或者test指令可以与jmp指令融合,产生仅1条微指令。而宏指令融合技术也可以与程序中常见的 if-then-else 结构很好的配合。还有传言声称,Core 微架构还可以将某些连接在一起、有依赖关系的浮点乘法与加法指令结合为1条微指令。最后,4个解码单元中的任何一个都可以执行宏指令融合操作,然而每个周期最多只能有1个解码单元执行宏指令融合,所以最大的解码宽度为每周期5条X86指令。

  下面的例子显示了宏指令融合技术的工作方式与效果。

 

 没有宏指令融合技术

 

 采用宏指令融合技术

  虽然 Intel 再次拒绝透露宏指令融合技术的具体效果,但是一些估算表明,宏指令融合技术可以把处理器需要执行的微指令的数目降低10%——已经是非常巨大的提升了。

  宏指令融合技术的优点是显而易见的,降低处理器需要执行的微指令的数目可以在两个方面提高处理器性能。首先,也是十分直观的,执行单元只需执行更少的微指令,直接提高处理器性能。其次,微指令缓冲区相当于容纳了更多的X86指令,乱序执行引擎可以从中更有效的发现能够并行的指令,也就是说,有利于实现更高的指令级并行度(Instruction Level Parallelism,简称ILP)。当然,这些优点与以前 Yonah 微架构就拥有的微指令融合技术(Micro-Op Fusion)十分相似所带来的十分相似。但是,同时拥有宏指令融合技术和微指令融合技术使得 Core 微架构可以比 Yonah 微架构节省更多的执行单元资源和拥有更好的指令级并行度。也许,具有讽刺意义的是,宏指令融合技术和微指令融合技术正在使得 X86 处理器的内核更加接近 CISC 架构,而不是 RISC 架构。这与 Intel 当年推出 IA-64 架构的想法正在背道而驰。

  结合微指令融合与宏指令融合技术,与之前的 Intel X86处理器相比较,Core 微架构的解码单元的实际能力,还要远远大于表面上所看到的4组解码单元的数量。

  Core 微架构前端的改进还包括分支预测单元。分支预测行为发生在取指单元部分。首先,它使用了很多人们已经熟知的预测单元,包括传统的 NetBurst 微架构上的分支目标缓冲区(Branch Target Buffer,简称BTB)、分支地址计算器(Branch Address Calculator,简称BAC)和返回地址栈(Return Address Stack,RAS)。然后,它还引入了2个新的预测单元——循环回路探测器(Loop Detector,简称LD)和间接分支预测器(Indirect Branch Predictor,简称IBP),其中循环回路探测器可以正确预测循环的结束,而间接分支预测器可以基于全局的历史信息做出预测。Core 微架构在分支预测方面不仅可以利用所有这些预测单元,还增加了新的特性:在之前的设计中,分支转移总是会浪费流水线的一个周期;Core 微架构在分支目标预测器和取指单元之间增加了一个队列,在大部分的情况下可以避免这一个周期的浪费。看起来很微不足道?要知道,对微内核设计来说,节省每一个可以节省的周期就是最大的目标;对已经发展了很多年的设计进行改进也是非常非常困难的。

>>进入搜狐数码频道        >>硬件频道文章点击排行榜 >>硬件DIY论坛
火热文章推荐:
·假期2款超值游戏配置推荐
·三星21款液晶显示器齐降价
·新年液晶市场行情大搜罗
火热论坛推荐:
·网通ADSL免费提速有"猫腻"
·网友十年攒机经验的一些总结
01 16日行情:英特尔奔腾4全面降价 内存止涨下跌
02 比17英寸还便宜 7款超低价19宽屏推荐
03 一站式洗白盗版Vista服务惊现中关村
04 R600规格曝光 4999元攒12层PCB游戏配置
05 3000-6000元 6款用户公认经典配置推荐
06 攒机就送你Vista 揭秘中关村盗版黑幕
07 "我是双核的" 5000元起双核整机导购
08 别被忽悠 中关村商户推荐配置单解析
  
[上一页][1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][下一页]

(责任编辑:刘伟)


我来说两句 全部跟贴(0条) 精华区(0条) 辩论区(0条)

用户:  匿名发表:  隐藏地址:


设为辩论话题      


精彩图片新闻


激情四溢沙滩宝贝


数码公社专栏

相关链接





搜狐短信 小灵通 性感丽人 言语传情
三星图铃专区
[周杰伦] 千里之外
[誓 言] 求佛
[王力宏] 大城小爱
[王心凌] 花的嫁纱
精品专题推荐
短信企业通秀百变功能
浪漫情怀一起漫步音乐
同城约会今夜告别寂寞
敢来挑战你的球技吗?
 精彩生活 

星座运势 每日财运
花边新闻 魔鬼辞典
情感测试 生活笑话


今日运程如何?财运、事业运、桃花运,给你详细道来!!!





菊花台
迷迭香
青青河边草
丁香花
原来你也在这里
爱如空气
不要再来伤害我

公社热图


·北美惊现若干神秘UFO/图
·范冰冰真空写真露点[图]
·传说中国内第一美女车模


频道精彩推荐

·胡锦涛访问美国等五国
·所罗门群岛爆发骚乱
·社会主义荣辱观
·王治郅回国 2006世界杯
·火车票交易吧 国足 NBA
·凯美瑞 思域CIVIC
·大众速腾 华晨骏捷
·我的女孩 王子变青蛙
·清华紫光 瑞星 S.H.E
·新农村建设 加息 油价






不怕不怕
吉祥三宝
桃花朵朵开
千里之外
大城小爱
梁祝
迷糊娃娃可爱粉红卡通
四季美眉给你最想要的

news
搜狐分类 ·搜狐招商


创意就是这么简单
女星豪乳尺码大曝光
·现场抓拍明星着透视装
·芙蓉二代横空出世
·央视女主持辞职拍艳照
·徐若瑄15岁全裸写真曝光
·拍摄:娱乐圈性交易过程
·抓拍模特海滩宽衣解带
·外国女生流行拍的艺术照
·台湾十大波霸照片大比拼
·网络美女全裸人体摄影
·范冰冰终于还是脱了

推荐企业
2006年世界电信展 诺基亚 瑞星 联想 摩托罗拉 三星 清华紫光 金山 索尼爱立信 索尼
给编辑写信



设置首页 - 搜狗输入法 - 支付中心 - 搜狐招聘 - 广告服务 - 客服中心 - 联系方式 - 保护隐私权 - About SOHU - 公司介绍 - 全部新闻 - 全部博文
Copyright © 2018 Sohu.com Inc. All Rights Reserved. 搜狐公司 版权所有
搜狐不良信息举报邮箱:jubao@contact.sohu.com