您好, 访客   登录/注册

它能做什么?五核心异构x86 SoC英特尔Lakefield技术解析

来源:用户上传      作者:

  在这个智能移动设备已经占据了我们生活绝大部分的年代,如何设计一颗更好、更节能、更适合移动设备使用的处理器,一直以来都是芯片厂商最为关注的话题之一。在ARM架构中,ARM推出了诸如big.LITTLE以及现在被称作DynamIQ大小核匹配的一整套软硬件解决方案,并带来了非常不错的使用效果。在x86架构这边,截至目前依旧是大核心对大核心、小核心对小核心,还没有一款产品能够融合两者的优势。不过,在x86上的这个空白可能要被英特尔填补了。2019年,英特尔就宣布了新的Atom、Core架构以及全新的Foveros 3D封装技术,以及这些技术综合而来的全新Lakefield处理器和其代表的全新混合式异构架构。随着Lakefield处理器的消息不断爆出,各种有关这款产品在设计和性能方面的数据开始走向前台,引发了人们对采用这款全新设计、全新架构和独特异构方案的处理器的好奇。今天,本文就综合多方内容,对这款英特尔未来的移动处理器之星进行解读。
  去年,英特尔发布了Lakefield架构。当时和Lakefield-起登场的还有全新的3D封装技术Foveros以及一些全新的处理器架构设计。作为英特尔近十年来改变最大的处理器产品,Lakefield在设计思路和实现方式上给人们带来了全新的思考,这款堪称里程碑式的产品,一定会在整个处理器的发展历史中留下浓墨重彩的一笔。
  先来看名称,Lakefield是一款移动SoC的代号,也是这款SoC架构特征的名称。设计方面,全新的Lakefield带来了大量不同于之前处理器的设计,包括更小的电路板尺寸、更出色的功耗和性能功耗比表现等。架构方面,Lakefield最值得关注的地方还是其独特的异构多核架构,这个架构包含了非偶数的处理器数量,分别是一个大核心和四个小核心,显然,Lakefield吸取了目前智能手机移动SoC的部分思想,并结合x86实际应用场景的特性。在功耗方面,Lakefield拥有独特的电源设计,以及在待机、信号连接方面低至2mW的低功耗解决方案等。在图形方面,Lakefield还采用了英特尔全新的第11代图形架构,一些消息显示新的图形架构和前代产品相比提升了50%。内存控制器方面,Lakefield使用的是LPDDR4X POP内存,并且将其通过独特的堆叠式封装集成在整个处理器的顶部,最后再来看封装和外观,由于Foveros 3D封装技术的采用,La kefield的处理器尺寸非常小,长宽都仅为12毫米,厚度也仅有1毫米,这个数据要低于目前绝大部分处理器产品。由于Lakefield优秀的特性,在未上市之前,就有很多笔记本电脑厂商宣称将基于Lakefield打造全新的产品,其中包括微软的Surface Neo以及三星的Galaxy Book S等。
  没有计算,只有通信——Lakefield基础模块介绍
  在这里,基础模块是指位于封装层最底层的高分辨率衬底,与此类似的是一些射频芯片的晶元衬底。英特尔在最底层的基础芯片上放置了什么内容呢?答案是部分接口组件。包括USB 3 Type-C接口、音频、Debug模块、SDIO(Secure Digital Input and Output,安全数字输入输出卡,一种在SD卡上发展起来的接口,用于支持一些特殊用途的信号通讯)、PCle 3.0、缓存以及其他一些低功耗的1/0组件。
  这个部分的面积仅仅为92平方毫米,采用了全新的22nm FFL工艺制造。这个基板具有10个金属层和MIM盖帽( metal insulator metal cap),并允许上层模组以TSV的方式导通到基板。从工艺来看,22nm FFL和之前老版本的22nm存在很大差异,22nmFFL相当于加入了大量成熟的14nm工艺技术,优化的超低功耗工艺版本。这个工艺的特点在于针对模拟电路做了增强,并针对低功耗电流泄露做出了优化。不仅如此,由于引入了14nm工艺的特性并且应用在22nm节点上,因此这个工艺采用了一个单一图案的BEOL,显著减少了掩模数量和总体层数,最终降低了成本。之前英特尔曾计划在业内大规模推广22nm FFL工艺的代工,面向移动产品、RF产品等对功耗控制比较敏感的设备。本次这项工艺成功使用在自家产品上,也是对其质量和性能的一种肯定。
  Lakefield的基石英特尔全新22nm FFLI艺简介
  本刊曾经在之前的《面向低功耗、低成本和模拟设备的新工艺——英特尔22nm FFL工艺介绍》中详细介绍了这款全新的工艺。由于本文涉及了22nm FFL工艺,因此在这一部分简单做一些介绍。如果读者希望详细了解这个工艺特性,可以回顾之前的文章。
  英特尔的22nm FFL工艺是一款全新设计的、面向低功耗、低成本和模拟、射频用户的新工艺。22nm FFL和之前的22nm SoC工艺几乎没有什么关系,而是来自更先进的14nm和lOnm工艺技术。22nm FFL和22nm SoC唯一共享的物理特性是相对宽松的108nm栅极间距,这使得栅极的长度更长。实际上22nm FFL的鳍片间距、高度、宽度可以和14nm制程相媲美。
  在工艺细节方面,22nm FFL包含了三个新的层,分别是180nm、720nm和1080nm,其主要特点是金属层间距都采用了整数倍数,比如基本是90的整数倍数,并且针对低成本设计进行了优化。此外,英特尔团队还新设计了一种新的超低功耗逻辑晶体管(简称为LL),可以将永久导通逻辑晶体管的泄露降至最低。为了进一步提高vt,新型LL晶体管的栅极长度比低功率晶体管的栅极长度更长,并且更大,需要144nm的栅极间距。它还采用了非常厚的栅极氧化层,类似于高电压1/0晶体管,可以降低漏电。对于NMOS和PMOS,新型LL晶体管的总漏电流低于0.5pA/μm和0.7pA/μm,这个数值甚至仅有传统22nm工藝的1/30,极大地降低了漏电损耗。在生产方面,22nm FFL拥有一个大型的晶体管库,包含三种高性能逻辑电路,三种低功耗逻辑电路,一种超低漏电逻辑电路,三种模拟电压电源,三个高电压器件以及各种无源器件等,为22nm FFL工艺快速商业化提供了可能。在成本控制方面,22nm FFL工艺放宽了部分要求,减少了对双重图案曝光的需求,并且将第二代和第三代FinFET的大量特性转移至22nm FFL上。新工艺能够通过制造几何形状出色的鳍片,以及功能优异的金属层来提高整体芯片的性能和能耗比。   市场选择方面,22nm FFL非常适合无线调制解调器,比如4G、Wi-Fi和蓝牙芯片等,甚至可能是PC芯片组,比如Lakefield的基础模块部分。总体来看,22nm FFL工艺结合了英特尔FinFET和其他低漏电技术,使得晶体管漏电率降低了100多倍,驱动电流甚至达到了14nm工艺的水平,堪称业界非常出色的超低功耗先进工艺。
  1+4、大小核——计算模块介绍
  SOC的计算模块位于基础模块之上。计算模块比基础模块小了一圈,仅仅只有82平方毫米,集成了大约40亿个晶体管。工艺方面采用的是英特尔第二代10nm工艺制造,也就是10nm+。在这个部分,英特尔集成了几乎所有的高性能部件,包括4通道、每通道16bit的LPDDR4内存、CPU内核、系统代理单元、第11代GPU核心、第11.5代显示引擎以及IPU 5.5。
  在计算模块中,有一些细节非常有趣。比如计算模块这个SoC本身和ke Lake非常相似,英特尔宣称它们确实基于同一个芯片研发而来。在总线方面,英特尔采用了之前惯用的双向环形总线和相关代理节点来连接内核、GPU等重要部件。目前核心内部拥有4个代理节点,分别用于CPU的大核心、4个小核心、GPU和其他所有的功能部件。小核心方面,英特尔采用的是四核心Goldmont Plus架构所使用的集群管理方式(核心已经改用了更新的Tremont),这个集群管理方式已经使用了多代,并且现在没有看到进一步的更新。
  在GPU方面,整个计算模块中大约37%的部分被第11代GPU核心占据,这个数据不包括IPU 5.5部件和第11.5代显示引擎,后者位于计算模块左侧的2个紫色区域。相比Ice Lake,整个计算模块的面积有所降低,这是因为PCle 3.O和Thunderbolt 3(USB Type-C)的控制单元被移出计算模块,放置在了基础模块部分。
  在CPU核心配置上,英特尔首次采用了1+4的方案,也就是一个SunnyCove架构的大内核和四个Tremont架构的小内核混合配置在一起,总计五个核心和五个线程。在这里,原本支持超线程的Sunny Cove架构禁用了SMT同步多线程技术。在之前的产品中,这两个计算核心都是作为独立产品的核心存在的,比如Sunny Cove是为ke Lake打造的,而Tremont在最新发布的Sown Ridge网络处理器中存在。不过在AVX-512方面,尽管其架构支持,但是考虑到Lakefield的应用场景主要是面向低功耗和超轻薄设备,以及Tremont内核需要完全的ISA兼容性的要求,因此Sunny Cove在这款处理器上也没有开启对AVX-512的支持。不过令人奇怪的是,根据芯片晶圆照片判断,AVX-512模块依旧存在于Lakefield的Sunny Cove核心中,并未移除,只是将其禁用了o考虑到AVX-512核心占地面积颇大,移除这个模块有助于降低芯片面积从而减少成本,因此英特尔依旧保留AVX-512核心就略显蹊跷,具体原因尚不得而知。
  英特尔采用1+4的配置方案后,正在运行的工作负载信息会传递给操作系统,以便根据性能需求和电源消耗情况来优化工作负载并配置相关核心资源。在小核心方面,英特尔采用了最新的Tremont内核,英特尔宣称这个核心代表了性能和功耗的显著提升,其架构性能可能介于SandyBridge和Haswell之間。英特尔的数据显示,一个Tremont的内核可以达到Sunny Cove高达70%的性能,同时拥有更出色的性能功耗比。在多线程负载中,4个Tremont内核群集可以实现单个Sunny Cove核心2倍的性能,同时提供明显更好的电源效率曲线。因此,通过为不同特性的工作负载使用更高效率的核心,能够为整个SoC带来更为优秀的功耗和性能表现。一些对性能要求较高的计算任务可以交给Sunny Cove核心负责,而那些需要多线程性能的应用,以及后台工作负载会交由Tremont集群负责,这样会带来更为出色的能源效率。当然,在实际工作中,正如我们在安卓生态环境中看到的那样,如何将合适的程序匹配至合适的核心是一个很复杂的事情,因此良好的电源管理是—项复杂的工作。现在不确定在实际应用中类似混合架构的设计能否达到理论所呈现的优秀表现。
  除了性能和能耗比,4个Tremont集群还有一些有意思的内容值得探寻,比如芯片经济性方面的考虑。4个Tremont集群的面积和一个Sunny Cove核心基本相同,这里需要说明的是,这种比较立足于4个Tremont集群加上共享的1.5MB L2缓存对比1个SunnyCove核心加上512KB缓存。其中,前者核心面积大约为5.14平方毫米,单个Tremont核心面积约为0.88平方毫米。整个Sunny Cove核心搭配缓存的面积约为4.49平方毫米。因此可以看出不同类型的核心尺寸差异巨大。
  Lakefield的技术来源:Sunny Cove和Tremont核心简介
  Sunny Cove架构是英特尔近年来真正堪称架构革新的大核心设计方案。相比前代架构,新的架构同时包含了通用性能提升和特殊性能提升。已知的消息包括增加缓存容量,更宽的核心,增加了L1带宽,分支预测器的改进,减少有效负载延迟等。指令集方面,Sunny Cove内核也加入了AVX-512指令集和相关计算单元,支持IFMA指令以更好地支持大数据算数计算和加密计算,加入SHA和SHA-NI指令以及Galois Field指令,以更好地进行密码学所需要的计算加速等。
  在Sunny Cove之外,Tremont也是英特尔近年来提出的全新高效能架构。其核心变化包括使用了来自SunnyCove这类大核心的指令预取和分支预测单元,采用了2个3-wide的解码引擎,并搭配4宽度的分配和调度引擎实现宽裕的资源分配和调度,更大的缓存容量和更宽的缓存带宽,拥有8个执行端口和7个数据保留单元的宽后端单元设计(包括更强大的浮点和整数单元)以及全新的指令集等。Tremont通过全面革新内核设计,带来了相比前代产品至少30%的性能提升,令人惊讶。   多层堆叠——Foveros3D封装
  Lakefield使用了英特尔Foveros 3D封装技术,来构建完成最终的芯片堆叠封装,其主要的技术难点在于lOnm工艺构建的计算模块和基础模块面对面的结合后,再一同封装在基板之上。对于Lakefield,英特尔使用了50Um点距的微型凸点。在Foveros封装的顶部,英特尔还额外封装了多个LPDDR4的内存。一般来说,内存都是由厂商根据产品型号来选择容量和频率的。英特尔将其封装在处理器之上,好的方面是减少了整个系统所占的面积,不过厂商可能无法自行搭配出更灵活的配置,玩家也无法自行升级内存了o Lakefield支持2个或者4个LPDDR4或者LPDDR4X的内存堆栈。在内存封装方面,英特尔采用的是350微米间距的TMV (through-mold vias)连接。即使整个芯片包括基板、基础模块和核心模块、2层内存封装,但是整个处理器的厚度仅为1毫米,和普通芯片没有任何差异。
  在Foveros封装的内部结构实现方面,英特尔采用了被称为FDI(Foveros Die Interface)的3D晶圆间连接技术来连接所有芯片的10接口。FDI包括过程级别的优化和增强,以确保所有连接界面的电气性能都得到保障。这包括3D建模、结构优化、晶片之间的距离最小化、不同层晶片的耦合以及相鄰凸点之间的耦合。在FDI技术中心,10单元直接位于微型凸块下方,从而消除了引线、布线。在时钟结构方面,FDI使用相对简单的转发时钟架构,其中Tx/Rx位于基础晶片电源上.接口频率不高但是数据宽度很宽,其峰值速率为500MT/s,并且200条相关通道都使用这个统一的速度。在功耗方面,Lakefield上FDI的功耗为0.2pj/bit,比一般的标准芯片组接口,比如英特尔的OPI或者AMD IF总线降低了约10倍。英特尔表示,未来的产品还会进一步减少功耗。
  在基础模块的连接方面,它采用的是TSV技术,可以用于将路由信号和电源直接导通到上层封装芯片。由于基础模块是有源中介层,因此技术难度更高。英特尔表示,采用TSV是因为其规则允许高级别的区块电源利用率高于75%,并且还经过了英特尔的优化,可以在存在TSV的情况下使用SRAM、寄存器文件和10电路等。信号TSV使用的是lxl阵列,功率TSV则以每个C4凸点2xl、2x2、2x3x2的图形阵列构建。英特尔表示,在超过1GHz频率的情况下,TSV电容为50fF,损耗小于0.5dB。
  堪比智能手机——Lakefield成品尺寸
  由于英特尔将内存也集成在了整个SoC中,因此最终的芯片和电路板设计将拥有类似于智能手机成品的尺寸。英特尔传统处理器针对超轻薄设备一般拥有2个系列,分别是Y系列和U系列,比如Ice Lake Y和ke LakeU,均以较小的尺寸和极高的集成度著称。但是,Lakefield和这两个主流系列相比更为微缩,尺寸更小一些。值得指出的是,在外部电源供应上,英特尔采用了Power Management IC,也就是常用于智能手机的PMIC电源管理芯片来代替传统处理器使用的VR或者FIVR电源。
  英特尔也展示了一些搭载Lakefield设计样品的尺寸,其PCB尺寸大约只有1 25毫米长和30毫米宽,表面搭载的芯片包括Lakefield芯片、NAND芯片、电源芯片和通讯、扩展卡插槽等,和常见的智能手机产品有一定的相似之处。
  Lakefield的改进空间和下一代产品
  作为第一个使用了多种新技术的产品,Lakefield还将成为未来所有产品的学习对象。用于逻辑的3D堆栈处理器构建技术是一个全新的领域,为了使Lakefield最终获得成功,必须开发全新的CAD工具以及新的系统级协作优化。英特尔表示,内部和外部的CAD工具都得到了修改和增强,以支持3D IC设计,并应用了包括构造、布局和布线、芯片对芯片的时钟频率控制和建模、电源传输、ESD、散热、信号完整性方面的全新功能。这每一项新功能和新设计都足以写下一本厚厚的技术手册。另外,3D IC的审核和验证工具也得到了加强,从而使开发人员能够验证全芯片的功能。尽管如此,CAD工具依旧远远落后于行业对3DIC开发的需求,未来还需要进一步加强。
  从产品角度来看,作为初代产品,Lakefield依旧存在很多缺陷。英特尔的长期目标是能够采用Foveros技术在基础模块上混合匹配计算芯片。尽管目前用于2D和2.5D芯片的封装和连接技术已经有越来越多的选择,但是针对3D芯片还没有太多的标准可供执行。尤其是在内存方面,Lakefield受限于尺寸和成本使用了POP封装的内存,这意味着内存数据要到达计算芯片,必须穿过POP封装的底层和基板连接的铜柱,再向上传输,穿过基础模块才能抵达计算模块——尽管内存和计算模块就隔了一层POP封装的基板。出现这样的问题的原因是目前还没有为3D IC所设计的标准存储器接口,业内常见的诸如HBM2等存储芯片最多都是为2.5D规格设计的,英特尔表示正在和合作伙伴研究解决方案。
  在下一代产品的设计上,英特尔已经开始讨论其他的一些封装技术了。 Foveros可以和EMIB等其他技术一起使用,英特尔的第二代Foveros将兼容7nm工艺,基础模块则将采用优化版本的lOnm工艺完成。使用Foveros和EMIB的主要产品是代号PonteVecchio的Xe架构GPU,这款产品将在2020年末小范围试用,最终在2021年推出。
  目前已经有一些Lakefield芯片的具体产品信息,包括Core i5-L15G7、Core i5-L16G7两款产品。从这些曝光的产品命名来看,"Core”品牌和“i5”这样的产品档次区分依旧保留,后续的“L”应该是指Lakefield架构,“15”和“16”应该是不同的型号区分,“G7”则是指相关核芯显卡的规格。具体规格上,以Core i5-L16G7为例,这款产品5核心、5线程,核心基础频率1.4GHz,睿频频率据传为2.95GHz。值得关注的是它的图形性能,在3DMark FireStrike中跑出了1069分,基本和GeForceMX 250以及锐龙74800H持平。CPU成绩方面,目前的测试显示其仅为4279分,和赛扬G3900相当,考虑到这并不是最终版本的测试成绩以及软件可能对新处理器在优化上存在一些问题,因此参考意义不大。不过即使如此,考虑到Lakefield的全新特性和独特的架构,以及部分消息宣称其仅为0.002W也就是2mW的待机功耗且完全无需风扇散热、被动散热即可的特性,相信这样的性能和超长的电池续航时间已经足够满足用户需求了。
  从目前的资料看出,Lakefiled本身瞄准的是看重轻薄、长续航的移动市场,这款处理器的创意在于异构五核心的架构和Foveros 3D堆叠架构。前者是处理器设计理念上的—次重大改变,无论是学习智能手机的移动SoC也好,还是专门为笔记本电脑定制也好,这种按需定制的特殊架构在之前从未如此目的明确地出现,当然,它的最终使用效果和性能表现还有待观察。
转载注明来源:https://www.xzbu.com/8/view-15228444.htm