族谱网 头条 人物百科

Haswell微架构

2020-10-16
出处:族谱网
作者:阿族小谱
浏览:597
转发:0
评论:0
技术特性作为英特尔“Tick-Tock”策略下的产物,在“Tick-Tock”时间表上,Haswell架构属于“Tock”阶段,是为架构改进换代。根据Fudzilla的消息,“英特尔透露给合作伙伴的消息指同时钟频率下与IvyBridge架构的产品相比,Haswell架构的产品其性能至少有10%的提升”。而英特尔宣称Haswell整体性能将比IvyBridge快两倍。英特尔称在某些工作负荷上Haswell架构的效率比上代产品的提升了20%。一片基于Haswell架构的处理器芯片的晶圆,与一只铁钉的大小对比已确认的新特性制程更成熟的22奈米制程,大幅改善漏电率(这里的漏电指高制程芯片于运作时,部分电子因量子穿隧效应而由非电路或电路组件的硅中穿过);更成熟的3D-三栅极晶体管;处理器核心14级管线(从IntelCore微架构开始一直沿用至今);和以往一样,整数运算、浮点运算和SIMD运算作业同样...

技术特性

作为英特尔“Tick-Tock”策略下的产物,在“Tick-Tock”时间表上,Haswell架构属于“Tock”阶段,是为架构改进换代。根据Fudzilla的消息,“英特尔透露给合作伙伴的消息指同时钟频率下与Ivy Bridge架构的产品相比,Haswell架构的产品其性能至少有10%的提升”。 而英特尔宣称Haswell整体性能将比Ivy Bridge快两倍。 英特尔称在某些工作负荷上Haswell架构的效率比上代产品的提升了20%。

Haswell微架构

  一片基于Haswell架构的处理器芯片的晶圆,与一只铁钉的大小对比

已确认的新特性

制程

更成熟的22奈米制程,大幅改善漏电率(这里的漏电指高制程芯片于运作时,部分电子因量子穿隧效应而由非电路或电路组件的硅中穿过);

更成熟的3D-三栅极晶体管;

处理器核心

14级管线(从Intel Core微架构开始一直沿用至今);

和以往一样,整数运算、浮点运算和SIMD运算作业同样通过指令端口进行分配;

每核心4个算术逻辑单元(ALU)和3个地址生成单元(AGU,2个位于加载管线,1个位于存储管线);

每核心8指令发射端口,可同时运行8条内部指令(uOPs),以实现4倍整数运算(Intel Sandy Bridge/Ivy Bridge为6uOPs/3倍整数运算)。

2个256比特的SIMD单元,以便支持Larrabee/Knight系列的512位SIMD;

类似于X79芯片组平台(使用LGA2011插座)的可调节外频/基准时钟频率(处理器外频与基准时钟频率异步),意味着Haswell平台的超频限制放宽。 实际上,由于QPI环形链路的设计使得核心电源和时钟频率管理出现这样的混乱:由于三级缓存是CPU核心和GPU核心共用,但三级缓存的电压控制以及时钟频率控制是和CPU核心的同步的,当CPU核心处于低负载而内置GPU核心处于高负载时,三级缓存需要处于全速运作状态,连带CPU核心也需要全速运作,这样不利于处理器的功耗控制。英特尔要解决这个问题,需要CPU核心的基准时钟频率与非CPU核心的异步。

主流级处理器产品全线均为原生四核心, 但实际上,英特尔公布的技术说明已表明下一代的酷睿 i3(Core i3)、奔腾(Pentium)系列仍维持双核心的设计。

英特尔事务性同步扩展 (TSX),大幅改善多线程运行效率。

AVX2指令集(或称Haswell新指令集,包括矢量聚集散射、比特处理以及对FMA3的支持)

改善AES-NI指令的运行性能;

缓存、内存接口、总线、处理器插槽

每核心拥有独立的64KB的L1缓存(32KB数据缓存+32KB指令缓存); ;每核心拥有独立的256KB L2缓存; 所有核心可共享最高32MB的L3缓存.

新的处理器缓存设计,旨在提升缓存带宽,L1、L2缓存带宽由原来的每时钟周期32位组(256比特),提升至每时钟周期64位组(512位),提升L2TLB命中率。以提升大规模高负载运算任务的数据访问表现;

原生支持双通道DDR3-1600; 企业级的Haswell-EP/EX核心还会支持八通道DDR4;

原生支持PCI-E 3.0 x16总线

处理器内部仍然使用QPI总线,单向数据发送性能有4.8GT/s、5.2GT/s、6.4GT/s等三种规格,较低级型号的处理器在芯片组和处理器之间仍然采用DMI总线,单向数据发送性能有2.5GT/s和5.0GT/s两种规格; QPI总线的布局延续Intel Sandy Bridge以来的环形链路设计,设计简单而且效率更高,更容易推出派生产品。

新处理器插座:桌面版本的是LGA 1150,移动版本的是rPGA 947和BGA 1364。 英特尔的技术说明已表示Intel Haswell不会向下兼容于现有的英特尔处理器平台。

内置显示核心

除了部分极致性能/服务器平台以外,所有处理器型号均融合Intel HD Graphics显示核心。

内置显示核心将支持DirectX 11.1以及OpenGL 4.0; 通用运算方面支持Open CL 1.2; 继续强化3D图形处理性能,支持HDMI、DisplayPort、DVI、VGA连接端口标准;支持三屏显示信号独立输出(最高分辨率为4096像素×3072像素)或是4K分辨率输出;

新的英特尔HD图形显示核心(Intel HD Graphics)有三种不同型号,代号分别为GT1、GT2和GT3。GT1拥有10个运行单元和1组纹理单元,定位入门级;GT2拥有20个运行单元和2组纹理单元,定位主流级;最高级的GT3则拥有40个运行单元和4组纹理单元,但只用于移动平台。 而现任的Intel Ivy Bridge集成显示核心HD4000最多只有16个运行单元,但显示核心架构仍旧一样, 由于在架构、制程不变的情形下大幅提升显示核心的规模和规格,可能会使内置显示核心的Intel Haswell架构的处理器的发热量急升,桌面型版本可以突破100瓦,移动版本更达57瓦。

在相同的功耗水平Haswell能提供两倍于Intel Ivy Bridge的图像性能,英特尔称Haswell的内置GPU的性能可媲美售价50$至70$的独立显示核心。

不再支持Windows XP,也不支持Windows Vista。如需在Haswell平台上运行Windows XP,须另行购买独立显卡 。

电源管理、热设计功耗

处理器芯片将内置完整的电压调节模块,Intel又一次把主板上的组件集成至处理器上, 此举可令主板的供电设计变得简单,降低主板厂商的制造主板的制造成本。 但同时也令主板厂商的产品卖点减少,趋于同质化,竞争加剧。 英特尔的这种设计并非是电压调节模块和处理器芯片完全融合,电压调节模块是一块独立的供电芯片,英特尔称‘集成稳压器’(IVR),和处理器芯片共用一块处理器基板。芯片采用22奈米制程,内置20个‘供电单元’(Power Cell),具有可编程化特性,可为处理器各单元模块提供独立稳定的电压控制,理论上最多可以为处理器内各个模块单元提供一共320相供电。

新的高级电源管理,除了传统的EIST和Turbo Boost以外,新增了几个电力控制状态,对于CPU核心和内置GPU核心将会有更明确精细的电压控制,类似于对手超微半导体(AMD)的Turbo Core 3.0;

移动版本的处理器将有热设计功耗为25瓦、37瓦、47瓦以及57瓦的型号 ;而桌机版本的预期则有热设计功耗为35瓦、45瓦、55瓦、65瓦、77瓦、95瓦以及极致性能(包括高级服务器平台的)高达100瓦以上TDP的型号 ,最高达到了Haswell-EP/EX的160瓦,最大通过电流190安培 ,不过有消息指出,由于增大的显示核心,主流级和性能级桌面版本处理器的热设计功耗有可能上扬至105瓦 ;除了移动平台、桌面平台以及服务器平台以外,Intel还专门为超极本设计了TDP只有15W、10W的版本,而且还将采用多芯片模块的设计,将芯片组和处理器集成到一块处理器基板上,类似于Intel Westmere中显示核心和CPU核心集成于一块处理器基板的形式。

预期特性

支持Thunderbolt技术。

128 bytes cache line.

Execution trace cache will be included L2 caching design.

Haswell Refresh

英特尔在2014年5月发布Haswell的改进版,称为Haswell Refresh。同时,发布新一代9系芯片组。

Haswell/Haswell Refresh与8/9系芯片组互相兼容。Haswell Refresh K系列处理器原先只能在Z97或H97主板上使用。 后来英特尔宣布Haswell Refresh K系列处理器也可在8系主板上使用。

i7-4790用以取代i7-4771而非i7-4770。

芯片组

8系列芯片组

支持USB3.0并最多提供6个连接端口

支持SATA 6.0Gb/s并提供最多6个连接端口

优化硬盘数据发送性能,提高数据访问和响应能力,特别是固态硬盘

优化英特尔智能响应技术及其支持驱动程序

为固态硬盘组建的硬盘阵列提供完整的TRIM支持

Intel Lake Tiny技术(动态硬盘加速)改善固态硬盘和机械硬盘混合组合的发送性能

采用32nm制程

秏电量4.1W(上代为6.7W)

于2013年第二季度上市 ,不兼容旧有处理器。

消费级平台上,最高级型号为Z87,支持所有特性;H87不支持动态硬盘加速以及3路PCI-E显卡互联;而最低级的H81取代旧有的H61,仅支持单路PCI-E 2.0 16倍速+六条PCI-E 2.0 1倍速、两个USB 3.0连接端口+八个USB 2.0连接端口、两个SATA 6Gbps连接端口+两个SATA 3Gbps连接端口(无RAID和AHCI),以及每通道内存只支持一个DIMM(亦即每通道仅能插入一条DDR3内存)。除此以外,B85也会取代B75,规格和H87相近但不支持高级硬盘特性。 一些有一定研发实力的厂商,如华硕电脑、华擎科技、技嘉科技等,推出的H87、B85芯片组的主板支持一些处理器型号的倍频调整或是基准频率的调整以实现处理器的超频。

商务平台由Q87、Q85分别取代Q77、Q75。

然而在2013年3月份,有消息指8系列芯片组工程样品中的USB 3.0控制器存在缺陷,会影响S3休眠电源状态以及USB 3.0的使用。 尽管离正式发布仍有三个月的时间,但是英特尔当时却没有修复这个硬件电路BUG的打算,所以销售的C1步进的产品是存在瑕疵的。 后来英特尔于2013年4月份突然宣布这个硬件电路的BUG已修复完成,但仅限于2013年8月份以后推出的C2步进的版本,此前出货的有缺陷的C1步进版本仍然继续销售,只是要注意USB3.0的使用。 有消息称该缺陷只会在Windows 8系统下碰到。 据称该缺陷无法通过更新驱动程序或BIOS/EFI修复,但有网友称在Windows 8和Windows Server 2012下可以通过安装KB2811660和KB2822241修复该缺陷。

9系列芯片组

支持M.2接口

于2014年第二季度上市,将兼容后续的Broadwell处理器。

处理器

消费级处理器

首批上市的基于Haswell架构的消费级桌面型处理器有Core i7系列、Core i5系列,标准电压版的Core i7-4770K/4770、Core i5-4670K/4670/4570/4430的热设计功耗为84瓦(其中带“K”的型号不锁定倍频),节能版的Core i7-4770S、Core i5-4670S/4570S/4430S的为65瓦,低电压版的Core i7-4770T、Core i5-4670T的为45瓦,超低电压版的Core i7-4765T、Core i5-4570T(双核心四线程)的则为35瓦。全部型号内置英特尔HD图形(HD Graphics 4600)。 移动版处理器全部为四核心Core i7,分别为i7-4930MX(TDP 57瓦,8MB三级缓存)、i7-4900MQ(TDP 47瓦,8MB三级缓存)、i7-4800MQ(47瓦,6MB三级缓存),均为rPGA封装。 面向主流市场的Core i3以及Pentium型号则于2013年8月后陆续推出,有Core i3-4130/4330/4340、Pentium G3220/G3420/G3430/G3450等型号。

2014年,为纪念英特尔‘Pentium’(奔腾)品牌诞生20周年,英特尔已于2014年中期推出无倍频锁定的Pentium20周年纪念版(PENTIUM G3258),英特尔8系列和9系列的芯片组均可支持。 除此以外,还将发布英特尔首款消费级八核心处理器,支持DDR4内存。而且还改进处理器顶盖中的导热材料,缓解haswell架构处理器中部分型号的过热问题。

企业级处理器

Intel为在高性能计算和高性能数据中心领域对抗NVIDIA“Project Denver”的新形态处理器(基于ARM的指令集架构的处理器并集成NVIDIA基于“Maxwell”架构的GPGPU),将推出极致性能的x86处理器核心Haswell-EP/EX,最高支持八通道DDR4-4266,热设计功耗高达160瓦,往下还有145瓦、135瓦、120瓦等几个层次结构。

性能表现

与上一代Sandy Bridge/Ivy Bridge架构相比:

Haswell的CPU核心预期至少有10%~20%的性能提升,相对于Ivy Bridge的制品; 不过根据2013年3月流出的Core i7-4770K的工程样品显示,整体性能水平相较于前两代的Core i7而言提升幅度仍然有限。

最高级的内置图形处理器是HD Graphics 4600预计会有翻倍的性能,相对于HD Graphics 4000,而实际上提升幅度和上一代的一样,而且仍然不及对手超微半导体的AMD Fusion APU的内置显示核心。

过热问题

内置显示核心的运行单元(EU)由上代Ivy Bridge的6组大幅增加到20组,同时也将电源控制模块集成到CPU上,四核心型号耗电量由77W上升到84W,使得处理器电压调节模块的热量都集中至CPU上,运行时的温度比上代更高,超频能力亦有所下降。 因为发热升高,性能没有太多提升,使得Haswell微架构在超频玩家中也被戏称‘hotwell’。

制程改进版:Intel Broadwell

根据Intel的“Tick-Tock”策略路线,Intel Haswell微架构的制程改进版代号为 Intel Broadwell ,采用14纳米制程,于Haswell发布后一年发布。 Intel Broadwell将会采用系统单片机(SoC)或多芯片模块(MCM)的设计,将PCH芯片组内置于处理器芯片上或处理器基板上 。这个将意味着Intel Haswell平台的主板和处理器无法与Intel Broadwell的处理器/主板互相兼容,因为Haswell平台的主板仍保留芯片组的设计。*从命名形式来看,Broadwell一部分处理器型号将兼容LGA1150接口.这匹配一代接口用两代的惯例

2012年11月末,有不实传言谣传指英特尔在Broadwell以后将统一采用BGA封装,摒弃插槽,届时将和主板捆绑贩售 ,此言一出,立刻在个人电脑DIY市场上引起强烈反对的声音,而英特尔发言人Daniel Snyder则出面澄清,“英特尔将继续在可以预见的未来为用户提供LGA封装的处理器制品”。 对手AMD也表示,尽管它们有BGA封装的制品大量生产,但不会放弃插槽式的处理器制品。

英特尔也会在Broadwell中加入新指令:

ADOC/ADCX指令,用于任意精度整数操作

继任微架构

Intel Skylake微架构将会是Intel Haswell微架构及其制程改进版Intel Broadwell微架构的继任者。

Haswell微架构

 Intel的微处理器架构路线图,从 NetBurst 以及 P6 至 Skylake

 

参见

Intel Core

Intel Nehalem

Intel Westmere

Intel Sandy Bridge

Intel Ivy Bridge

AMD Bulldozer

AMD Piledriver

AMD Steamroller

参考文献

 


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱
发表评论
写好了,提交
{{item.label}}
{{commentTotal}}条评论
{{item.userName}}
发布时间:{{item.time}}
{{item.content}}
回复
举报
点击加载更多
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回

更多文章

更多精彩文章
打赏
私信

推荐阅读

· 微架构
和指令集架构的关系指令集架构是指在处理器内被处理的程式,指令集架构为组合语言的设计师和编译器所见。指令集架构包含executionmodel,暂存器,地址以及资料格式。微架构包含处理器内部的构成以及这些构成起来的部分如何执行指令集架构。微架构通常被表示成流程图,以描述机器内部元件的连结状况,从一个闸或是暂存器,到算术逻辑单元(ALU)。图上分布着资料路径(可以显示资料在微架构的位置)以及控制路径(显示资料该被什么指令所处理)。每个微架构的的元件都被表示成藉数个逻辑门所建构而成的工具。每个逻辑门都被表示成藉晶体管建构成的零件。拥有不同微架构的机器可能拥有相同的指令集架构,因此可以执行相同的程式。由于半导体科技的进步,新型的处理器可以以较快的速度执行相同的指令集架构。微架构的概念Intel80286微架构在今日,管线资料路径是微架构中最常被使用的资料路径。这种作法也被普遍的用于微处理器,微控制...
· Nehalem微架构
技术特点原生四核心的Nehalem微架构集成北桥全部型号的微处理器核心都集成了存储器控制器,一般支持双通道DDR3SDRAM,消费级产品最高支持三通道DDR3SDRAM,而服务器平台则可以支持四通道DDR3SDRAM;除此以外还处理器核心还集成了PCIExpress2.0控制器。直连式总线从Nehalem微架构开始,Intel改用QPI/DMI直连式总线,放弃了传统的FSB。首发的Corei7使用了新的“QuickPathInterconnect”直连式总线,与AMD的HyperTransport相似。相比FSB,每一个处理器都可以有独立的QPI通道与其他处理器连接,处理器之间不用再共享FSB带宽,并绕路到北桥才能通信。此外,QPI是双向传输。后来发布的Corei5、i3,处理器内部仍使用QPI,但与外部芯片组连接则使用与QPI类似但较QPI的带宽小的DMI(DirectMediaInte...
· SandyBridge微架构
技术特点SandyBridge四核心微架构图解IntelSandyBridge微架构的研发主要由Intel的以色列分公司的研发中心负责,原先SandyBridge代号为‘Gesher’(希伯来语中意为‘桥梁’)。后来为避免让人联想到以色列已解散政党‘Gesherpoliticalparty’,遂改为现在的代号名称。研发计划组由Intel副总裁罗恩·弗里德曼领导并管理。2009年9月在Intel开发者论坛上,Intel展示了使用SandyBridge微架构的工程样品处理器,展示的工程样品处理器为A1步进,并运作于2.0GHz的时钟频率上。缓存与IntelNehalem微架构的相近,L1缓存仍为每核心64KB(32KB数据缓存+32KB指令缓存),L2缓存每核心独占256KB,内置共用式L3缓存,最高可达20MB。多线程/超线程部分型号的处理器(如Corei3、Corei7等)会继续沿袭超线程...
· ARM架构
特色和应用自2005年,每年超过一亿的手机销售约98%至少使用了一个ARM处理器。截至2009年,占大约90%的所有嵌入式32位RISC处理器和ARM处理器被广泛使用在消费性电子产品,包括个人数字助理(PDA)、平板电脑、移动电话、数字媒体和音乐播放器、手持式游戏游戏机、计算器和计算机外围设备(如硬盘驱动器和路由器)。历史一颗主要用于路由器的科胜讯公司ARM处理器用于松下多媒体播放机的芯片ARM的设计是艾康电脑公司于1983年开始的开发项目。这个团队由RogerWilson和SteveFurber带领,着手开发一种类似高级6502架构的处理器。Acorn电脑有一大堆建构在6502处理器上的电脑,因此能设计出一颗类似的芯片即意味着对公司有很大的优势。AcornRISCMachine:ARM2用在BBCMicro上的ARM1secondprocessor团队在1985年时开发出样本“ARM1”...
· MIPS架构
发展历史在1981年,史丹佛大学教授约翰·轩尼诗领导他的团队,实现出第一个MIPS架构的处理器。他们原始的概令是通过指令管线化来增加CPU运算的速度。1984年,约翰·轩尼诗教授离开斯坦福大学,创立MIPS科技公司。于1985年,设计出R2000芯片,1988年,将其改进为R3000芯片。MIPS指令格式在MIPS架构中,指令被分为三种类型:R型、I型和J型。三种类型的指令的最高6位均为6位的opcode码。从25位往下,R型指令用连续三个5位二进制码来表示三个寄存器的地址,然后用一个5位二进制码来表示移位的位数(如果未使用移位操作,则全为0),最后为6位的function码(它与opcode码共同决定R型指令的具体操作方式);I型指令则用连续两个5位二进制码来表示两个寄存器的地址,然后是一个16位二进制码来表示的一个立即数二进制码;J型指令用26位二进制码来表示跳转目标的指令地址(实际的...

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信