45nm Penryn桌面四核心:Yorkfield2.33GHz工程样本

IntelYorkfield2.33GHz ES Sample
图为Intel下一代45nm「Penryn」家族桌面四核心处理器工程样本,处理器序号为「80569PJ053NL」,采用Socket775处理器接口。「80569」代表核心为「Yorkfield」、「P」为桌面级主流级至效能级产品、「J」是1333MHzFSB、「053」代表频率为2。33GHz、「NL」则代表L2Cache容量为12MB,Core2Extreme版本的TDP为130W、Core2Quad版本的TDP则为95W。
其支持MX、SSE、SSE2、SSE3及SSE4。1指令集、IntelVirtualizationTechnology、EnhancedIntelSpeedStep、Intel64Bit支持、ExecuteBit技术及IntelTrustExecutionTechnology(TXT)。
「Yorkfield」核心其实并非单一芯片,它是把两颗双核心封装在一起,好处是Intel无需为四核心产品重新设计芯片,由于四核心现时市场占有率仍在5%以下,因此这个方法是最节省成本,并能提早问市时间。
不过,两颗双核心封装在一起,两者并没有直接的沟通桥梁,因此当要互相传取数据时,必需要经过FSB,延迟值将会略为提高。但据Intel表示,这个核心互相传取动作,比L2Missed然后需要传取系统内存要快上10倍,而且IntelCore微架构拥有加入了Memory Disambiguation设计,透过Outof Order过程分析内存读取次序,可令其读取提早执行,降低处理器的等候时间,减少闲置及延迟值。
「Yorkfield」内建8.2亿个晶体管,相比上代「Kentsfield」核心多出2.38亿个,主要原因为L2 Cache容量提升50%,约占1。92亿个晶体管,余下部份则为SSE4指令运算单元及微架构的改良部份。
虽然内建晶体管数目上升约40%,但由于改采45nm制程,芯片大小由上代的286平方毫米,减至只有214平方毫米,有助成本进一步下降。
此外,Intel上代65nm产品最高频率约为3GHz,频率超过3GHz后,功耗将会出现明显增长,而45nm产品最高可达约4GHz,在甫结束的IDF2007Fall大会上,Intel更展示5GHz超频示范,意味着Intel新一代45nm将有一定的频率提升空间。
由于新一代45nm产品在CPU GTLREF Ratio设定上有所变更,因此旧有主机板可能需要更新BIOS才能正常启动。
值得注意的是,尽管Intel一直强调只有「3」系列芯片组才能支持45nm,但有主机板业者指出,其实965芯片组也能透过BIOS更新作出支持,不过VTT电压将会被设定至1.2V,处理器功耗会随之提高,减低产品寿命,965芯片组方案虽然可行,但并不建议采用。

(左)Intel 45nm Yorkfield四核心(右)Intel 65nm Kentsfield四核心
● 非单纯制程进化微架构亦作出改进

Yorkfield支持新一代SSE4指令集(Streaming SIMD Extension4),被视为继2001年以来最重要的媒体指令集架构的改进,除扩展Intel64指令集架构外,还加入有关图形、视频编码及处理、三维成像及游戏应用等指令,令涉及音频、图像和数据压缩算法的应用程序大幅受益。
据了解,SSE4将分为4.1版本及4.2版本、4.1版本将会首次出现于Penryn处理器中,共新增47条指令,主要针对向量绘图运算、3D游戏加速、视像编码加速及协同处理加速动作,包括:
|
Penryn SSE4 Instruction summary |
||
|
Instruction Category |
Instructions |
Benefits |
|
Packed DWORD Multiplies |
PMULLD , PMULDQ |
提升编译器矢量运算效能 |
|
Floating Point Dot Product |
DPPS , DPPD |
3D立体制作及游戏,支持CG及HLSL等语言 |
|
Multi-packed sum of absolute diffs& min pos |
MPSADBW , PHMINPOSUW |
视讯编码处理 |
|
Streaming Load |
MOVNTDQA |
视讯编码处理、绘图及GPU数据分享 |
|
Floating Point Round |
ROUNDPS , ROUNDSS , ROUNDPD , ROUNDSD |
视讯编码处理 、绘图、影音处理、2D/3D应用、多媒体及游戏等 |
|
Packed Blending |
BLENDPS , BLENDPD , BLENDVPS , BLENDVPD , PBLENDVB , PBLENDDW |
编译器矢量运算及影音处理、多媒体、游戏等应用 |
|
Packed Integer Min and Max |
PMINSB , PMAXSB , PMINUW , PMAXUW , PMINUD , PMAXUD , PMINDS , PMAXSD |
|
|
Register Insertion/Extraction |
INSERTPS , PINSRB , PINSRD , PINSRQ , EXTRACTPS , PEXTRB , PEXTRD , PEXTRW , PEXTRQ |
|
|
Packed Format Conversion |
PMOVSXBW , PMOVZXBW , PMOVSXBD , PMOVZXBD , PMOVSXBQ , PMOVZXBQ , PMOVSXWD , PMOVZXWD , PMOVSXWQ , PMOVZXWQ , PMOVSXDQ , PMOVZXDQ |
|
|
Packed Test & Set |
PTEST |
|
|
Packed Compare for Equal |
PCMPEQQ |
|
|
Pack DWORD to Unsigned WORD |
PACKUSDW |
|
除了采用更先进的45奈米制程及加入全新SSE4指令集外,Penryn亦基于Intel Core 微架构设计作出多项改良,称为「Enhanced Intel Core Microarchitecture」,并加入了:
Fast Radix-16 Divider(快速Radix-16除法器)
Super Shuffle Engine(超级洗牌引擎)
Split Load Cache Enhancement(增强型缓存拆分负载)
Improved Store Forwarding(存储转发)
Faster OS Primitive Support(高速操作系统同步原始支持)
Virtualization Performance Improvements(增强的Intel虚拟化技术)
Deep Power Down Technology(深度节能技术)
Enhanced Dynamic Acceleration Technology(增强型动态加速技术)
据Intel资深工程师兼Penryn微架构主管Stephen Fischer表示,与上代处理器产品相比,Penryn处理器在绘图效能约超过15%、视讯编码平均可提高20%、3D内容制作可提高逾30%,3D游戏效能更可高达40%,视乎软件设计而定。
读者想了解更多Penryn微架构更新内容,可浏览:《最高提升115% 英特尔45nm Penryn实测》。
● 45nm处理器加入0.5x倍频设定

值得注意的是,Intel将会在45nm Core 2处理器中加入0.5x倍频设定,根据「Intel Yorkfield EMTS Rev 1.1」文件中指出,45nm处理器最低倍频为6x,但由7.5x倍频数开始拥有0.5x倍频设计直至13.5x,最高倍频数为15x。
追加0.5x倍频数的主要原因为新一代处理器的外频由266MHz提升至333MHz,如果沿用整数倍频,则每一级产品的频率差距亦会同样上升,型号数目变少难以覆盖整个产品线,加入0.5x倍频后,产品线型号的设定弹性将大幅提升,同样的做法AMD亦早用于AM2处理器中。