您当前的位置: 首页 > > 众创空间

摩尔定律放缓脚步,芯片巨头英特尔、高通及AMD该如何创新求变?

[ 导读 ] 芯片巨头赖以生存的摩尔定律放缓脚步,同时,诸如深度学习等新应用也在要求使用更强大、更高效的硬件。仅仅扩展一般用途的CPUs不足以满足未来应用程序每瓦特的性能,但异构系统很难设计、制造和编程,芯片设计者该如何应对这一挑战?

图片来自“123rf.com.cn”

芯片设计者面临着越来越艰巨的任务。他们赖以生存的摩尔定律正变得越来越无效。同时,诸如深度学习等新应用也在要求使用更强大、更高效的硬件。

毋庸置疑的是,仅仅扩展一般用途的CPUs不足以满足未来应用程序每瓦特的性能,而且很多繁重的任务都被转移到诸如GPUs、FPGAs、DSPs以及类似于谷歌TPU这样的ASICs等加速器上。问题是,这些复杂的异构系统很难设计、制造和编程。最近在林利处理器会议上,其中一个关键的主题是行业如何应对这一挑战。

NetSpeed Systems的营销副总裁Anush Mohandass说:“如今,架构师面临着一个巨大的,几乎不可逾越的问题——有人需要CPUs,有人需要GPUs,又有人需要视觉处理器,而所有这些都需要完美地协同工作。”

NetSpeed是一家专注于可扩展的、连贯的网络芯片技术的公司,致力于将不同的处理器整合到一起。该公司宣布了其机器学习算法——Turing,用于优化针对汽车、云计算、移动和互联网的处理器的芯片设计。Mohandass谈到了该系统是如何提出“非直观的建议”,以满足电力、性能和区域的设计目标,同时还包括在汽车和工业部门中必不可少的功能性安全要求。

ARM

ARM能够很好地适应这种过渡,因为它此前为移动处理器提供了大量的技术,而这些技术在一定程度上已经成为异构处理器的功能。其最新的DynamIQ集群技术旨在将规模扩展到一个“更广泛的设计范围”,以满足从嵌入式到云服务器的新应用的需求。每个DynamIQ共享单元(DSU)可以有多达8个大小组合的核心,而一个CPU最多可以有32个DSU集群。此外,DSU还有一个低延迟的外围端口,与诸如DSP或神经网络引擎等加速器实现紧密耦合链接,并支持行业标准CCIX和PCI-Express总线。

ARM营销总监Brian Jeff谈到了Cortex-A75和A55 CPU核心的性能提升,灵活的缓存和互联行,以及新的机器学习功能。他表示:“我们构建了一个产品路线图,旨在为这些变化的需求提供服务,在CPU性能方面我们也是这个原则。”此外,他还展示了应用这些芯片的ADAS(自动驾驶辅助)、网络处理以及高密度服务器。

ARM表示,64核A75处理器将提供三倍于目前32核A72服务器芯片的性能,从而使其与英特尔的硅晶片竞争。在关于ARM不断增长的系统级IP演示中,ARM高级产品经理David j.Koenen表示,A75更接近Xeon E5的单线程性能,但同时,他承认目前A75还不能完全匹配英特尔。

高通

高通即将推出的Centriq 2400是基于一个定制的ARMv8设计,即Falkor。高通高级主管Barry Wolford披露了一些相关的细节。他表示,Centriq 2400将提供具有竞争力的单线程性能,同时还能满足数据中心虚拟化环境所需的高核心数。

AMD

在摩尔定律逐渐失效的情况下,AMD正采取一种更实际的方法来解决增加核心数量的问题。AMD非但没有尝试建造一个单片处理器,而是使用了4个14nm的Epyc芯片,并将其与Infinity Fabric打包,以创建一个32核的服务器处理器。AMD首席架构师Greg Shippen表示,对更多核心和更大带宽的需求正在推动CPU和GPU的模具尺寸接近于光刻设备的物理极限。通过将其分为4个模具,整体面积增加了10%,但成本下降了40%,因为小的模具有更高的制造产量。

这种改进不仅提高产量,降低成本,而且还可以在同一个多芯块模块(MCM)中,混合和匹配不同类型的逻辑,内存和输入/输出。美国国防部高级研究计划局(DARPA)有一项计划,旨在进一步促进这种概念的发展。英特尔也正在开发一种MCM,该模块将Skylake Xeon CPU和集成的Arria 10 FPGA结合在一起,预计在2018年上半年完成。英特尔目前的解决方案是一款PCI-Express卡,这是一款搭载Arria 10的可编程加速卡,已经应用于Xeon服务器。英特尔的目标是标准化FPGA硬件和软件,使代码在整个芯片家族和跨代之间运行。

英特尔软件工程经理David Munday说:“用户现在可以在FPGA之间进行无缝衔接,无需重写Verilog。”这意味着加速更便捷——用户可以从一个离散的实现移动到一个集成的实现。

IBM及OpenCAPI联盟一直在推进其自己的解决方案,将加速器附加到一个主机处理器,以满足更高性能和更大内存带宽的需求,以及高性能计算和深度学习。IBM Power硬件架构师Jeff Stuecheli说:“为了获得延迟和带宽特性,我们需要一个新的界面和技术。”

异构系统不仅难于构建,而且也是优化和编程方面的挑战。CPU的强力扩展并不能将各大芯片巨头载向理想的彼岸,但整个芯片行业会不断尝试求新,探索新的方法来扩展功率和性能,从而满足新兴应用的需求。这种更为复杂和微妙的方法需要新技术来设计、连接、制造和编程这些异构系统。

人工智能——2017年最火热的标签。对于众多AI试水者,你知道如何平衡技术与需求吗?你知道如何利用政策事半功倍吗?你知道如何寻找公司的投资伯乐吗?12月14日,「2017创新者年会·AI产业应用峰会」,我们将邀请众多投资人、创业者、AI领域精英共同探讨,不仅是AI+产业+应用,这里是需求方和技术提供方的沟通平台,是政策专家与企业方的交流平台,是投资人与企业方交流的互猎平台,是应届毕业生和企业方的对接平台。多维度,更深度,来这里实现属于你的AI!

上一篇: 消息称苹果将收购Drive.ai 引入更多自动驾驶人才

下一篇: 银信宝:体验指尖上的移动金融服务