基于卷积神经网络(CNN)的机器学习体系结构已被证明在从计算机视觉到图像分析以及人类语言的处理或生成的广泛应用中具有很高的价值。然而,为了处理更高级的任务,这些体系结构变得越来越复杂,计算要求也越来越高。
近年来,世界各地的许多电子工程师因此一直在尝试开发能够支持复杂的基于CNN的架构的存储和计算负载的设备。这包括能够支持大量权重(即,CNN的不同层所考虑的可训练和不可训练参数)的更密集的存储设备。
中国科学院、北京理工学院和中国其他大学的研究人员最近开发了一种新的内存计算系统,可以帮助更有效地运行更复杂的基于CNN的模型。在《自然电子》杂志上发表的一篇论文中介绍了他们的存储组件,该组件基于由3D忆阻器阵列制成的非易失性内存宏计算。
“将这种系统扩展到3D阵列可以为必要的向量矩阵乘法运算提供更高的并行性、容量和密度,”霍强和他的同事在论文中写道。“然而,由于制造和设备可变性问题,扩展到三维是一个挑战。我们报告了一个基于55纳米互补金属氧化物半导体工艺制造的三维垂直电阻随机存取存储器的2千位非易失性内存计算宏。”
电阻随机存取存储器(RRAM)是基于忆阻器的非易失性(即,即使在电源中断后仍保留数据)存储设备。忆阻器是一种电子元件,可以限制或调节电路中的电流,同时记录先前流过它们的电荷量。
RRAM基本上通过改变忆阻器两端的电阻来工作。虽然过去的研究已经证明了这些存储设备的巨大潜力,但这些设备的传统版本与计算机引擎是分开的,这限制了它们的可能应用。
内存计算RRAM设备通过将计算嵌入内存来克服这一限制。这可以大大减少存储器和处理器之间的数据传输,最终提高整个系统的能效。
霍和他的同事创建的内存计算设备是一个具有垂直堆叠层和外围电路的3D RRAM。该器件的电路采用55纳米CMOS技术制造,该技术是当今市场上大多数集成电路的基础。
研究人员评估了他们的设备,用它来执行复杂的操作,并运行一个模型来检测MRI脑部扫描中的边缘。该团队使用两个现有的MRI数据集训练他们的模型,用于训练图像识别工具,称为MNIST和CIFAR-10数据集。
“当输入、权重和输出数据分别为8、9和22位,且位密度为58.2位时,我们的宏可以执行3D矢量矩阵乘法运算,能量效率为每秒每瓦8.32太拉运算碌m鈥?,研究人员在论文中写道:“我们表明,与传统方法相比,宏在CIFAR-10数据集上提供了更精确的脑部MRI边缘检测和更高的推理精度。”
在最初的测试中,霍和他的同事创建的内存计算垂直RRAM系统取得了显著的结果,优于传统的RRAM方法。因此,在未来,它可能被证明对于更高效地运行复杂的基于CNN的模型具有很高的价值,同时还能实现更好的精度和性能。
漏 2022科学X网络