返回顶部
首页
机械 | 工程 | 工具 | 行业 | 信息 | 集合 | 诗词 | 组词 | 范文 |
 
您现在的位置:
首页 系统及软件 详细信息

系统创造了理想的AI芯片的幻觉,团队让具有3D内存的多个处理器像一个大芯片一样工作

2021-05-05    阅读量:31187    新闻来源:互联网     |  投稿

理想的神经网络芯片是什么样的?工程师说,最重要的部分是在芯片本身上拥有大量存储空间。这是因为数据传输(从主内存到处理器芯片)通常消耗最多的能量,并且会产生大部分系统滞后,即使与AI计算本身相比也是如此。 


系统创造了理想的AI芯片的幻觉,团队让具有3D内存的多个处理器像一个大芯片一样工作 中国机械网,okmao.com


Cerebras Systems通过制造一台几乎完全由一个包含18 GB内存的大型芯片组成的计算机,解决了这些问题(统称为内存墙)中国机械网okmao.com。但是法国,硅谷和新加坡的研究人员提出了另一种方法。


它被称为“幻觉”(Illusion),它使用在硅逻辑之上构建的3D堆栈中构建有电阻RAM存储器的处理器,因此花费很少的精力或时间来获取数据。仅凭其本身,还远远不够,因为神经网络的规模越来越大,无法容纳在一个芯片中。因此,该方案还需要多个这样的混合处理器以及一种算法,该算法既可以智能地对处理器之间的网络进行分割,还可以知道何时在闲置时迅速关闭处理器。


在测试中,八芯片版本的Illusion的能耗和等待时间仅为“梦想”处理器的3-4%,而“梦想”处理器将所有所需的内存和处理都集成在一个芯片上。


该研究团队(其中包括来自法国CEA-Leti研究实验室,Facebook,新加坡南洋理工大学,圣何塞州立大学和斯坦福大学的贡献)受到了神经网络规模不断扩大这一事实的推动。


负责这项研究的斯坦福大学电气工程和计算机科学教授Subhasish Mitra说:“从某种意义上讲,这种梦想的芯片永远无法使用,因为它是一个不断发展的目标。” 他说:“神经网络变得越来越快,其速度超过了摩尔定律所能保持的水平。”


因此,他们设法设计一种系统,即使它实际上是由多个混合处理器组成的,它也会产生一个带有大量片上存储器的单个处理器的错觉(因此称为项目名称)。这样,幻觉就可以轻松地扩展以适应不断增长的神经网络。


Mishra解释说,这样的系统需要三件事。首先是芯片上的大量内存,这些内存可以快速访问且消耗很少的能量。这就是集成3D的RRAM的地方。他们选择了RRAM,“因为它是密集的,3D集成的,并且可以在掉电状态下快速访问,并且因为在断电时它不会丢失数据, ” H.-S. 斯坦福大学电气工程学教授,该项目的合作者Philip Wong。


但是RRAM确实有一个缺点。像Flash存储器一样,它在被覆盖太多次后就会磨损。在Flash中,软件会跟踪每个存储单元块发生了多少次覆盖,并试图保持该数量,即使在芯片中的所有单元中也是如此。


斯坦福大学理论计算机科学家 Mary Wootters 领导团队为RRAM发明了类似的东西。结果被称为Distributed Endurer,这增加了确保写入中的磨损甚至跨越多个芯片的负担。


即使使用Endurer,混合RRAM和处理器芯片,强大的神经网络(例如当今使用的自然语言处理器)仍然太大而无法容纳在一个芯片中。但是,使用多个混合芯片意味着在它们之间传递消息,消耗能量并浪费时间。


Illusion团队的解决方案是其技术的第二个组成部分,它以最小化消息传递的方式来切碎神经网络。神经网络本质上是一组计算发生的节点以及连接它们的边。每个网络将具有某些节点或整个节点层,这些节点具有大量的连接。


但是,网络中也将存在阻塞点,即节点之间必须传递少量消息的地方。在这些阻塞点上划分一个大型神经网络,并将每个部分映射到单独的芯片上,可确保从一个芯片到另一个芯片的数据传输量最少。Mitra说,“幻觉”映射算法“自动识别切割神经网络的理想位置,以最大程度地减少这些消息。”


但是像这样切碎的东西有其自身的后果。不可避免地,一种芯片会先于另一种芯片来完成其业务,这会拖延系统并浪费功率。其他尝试运行非常大的神经网络的多芯片系统,则以使所有芯片持续忙碌的方式来划分网络,但这是以在它们之间传输更多数据为代价的。


相反,在第三项创新中,幻觉团队决定设计混合处理器及其控制算法,以便可以快速关闭和打开芯片。


因此,当芯片等待工作时,它不会消耗任何功率。Mishra说,CEA-Leti的3D RRAM技术是制造3D SoC的关键,该SoC可以在几个时钟周期内完全关闭并重新启动而不会丢失数据。


该团队构建了八芯片版本的Illusion,并在三个深度神经网络上进行了测试。这些网络的规模远不及目前正在向当今的计算机系统施加压力的网络的规模,因为每个Illusion原型仅为神经网络数据保留了4 KB的RRAM。他们测试过的“梦想芯片”实际上是一个模仿了完整神经网络执行的幻觉芯片。


8片幻觉系统能够在理想芯片能耗的3.5%内和其执行时间的2.??5%内运行神经网络。Mitra指出,该系统可以很好地扩展。总共有4 GB RRAM的64片幻觉的仿真也接近理想。


斯坦福大学的研究生罗伯·雷德韦(Robert Radway)说:“我们已经在开发一种功能更强大的原型。”他是描述“幻觉”的论文的第一作者,该论文于本周在《自然电子》上发表。与原型相比,下一代芯片将具有更大数量级的内存和计算能力。虽然第一代经过了推理的测试,但下一代将用于训练它们,这是一项更加艰巨的任务。


“总的来说,我们认为幻觉对未来技术具有深远的影响,” Radway说。“它为技术创新开辟了广阔的设计空间,并为未来的系统创造了新的扩展途径。”


免责声明:本文仅代表作者本人观点,与中网机械,okmao.com无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。客服邮箱:23341571@qq.com | 客服QQ:23341571
全站地图 | 二级目录 | 上链请联系业务QQ:23341571 或 业务微信:kevinhouitpro