Descargitas

来自中国的最新突发新闻。

IBM“令人惊叹”的芯片加速人工智能发展

IBM“令人惊叹”的芯片加速人工智能发展

IBM 开发的 NorthPole 芯片将内存和处理功能集成在一起,可显着改进图像识别和其他计算任务图片来源:IBM

加利福尼亚州圣何塞 IBM 的研究人员开发了一种受大脑启发的计算机芯片,该芯片可以通过更快的运行速度和更低的功耗来增强人工智能 (AI)。 庞大的 NorthPole 处理器芯片消除了频繁访问外部存储器的需要,从而比当前基础设施更快地执行图像识别等任务,同时消耗更少的电量。

“它们的能源效率绝对令人惊叹,”帕利绍巴黎萨克雷大学纳米电子学研究员达米安·科利奥兹 (Damien Kerlioz) 说。 作品发表于 科学1他表示,计算和内存可以大规模结合。 “我觉得这篇论文将动摇计算机体系结构中的普遍思维。”

NorthPole 运行神经网络:简单计算单元的多层阵列,经过编程可识别数据模式。 底层获取数据,例如图像中的像素; 每个连续层都会检测到越来越复杂的模式,并将信息传递到下一层。 上层生成的输出可以表示图像包含猫、汽车或其他物体的可能性。

瓶颈减缓

一些计算机芯片可以有效地处理这些计算,但每次计算该层时仍然需要使用称为随机存取存储器(RAM)的外部存储器。 以这种方式在芯片之间传输数据会减慢速度,这种现象被称为冯·诺依曼瓶颈,以数学家约翰·冯·诺依曼的名字命名,他首先设想了基于独立处理单元和内存单元的计算机标准架构。

冯·诺依曼瓶颈是减缓计算机应用(包括人工智能)速度的最重要因素之一。 它还导致能源效率低下。 研究合著者、IBM 计算机工程师 Dharmendra Modha 表示,他曾经估计,在这种架构上模拟人脑需要相当于 12 个核反应堆的生产量。

NorthPole 由 256 个计算单元或核心组成,每个单元都包含自己的内存。 “你正在缓解内核内部的冯·诺依曼瓶颈,”位于圣何塞的 IBM 阿尔马登研究中心的类脑计算首席科学家 Moda 说道。

莫达说,这些细胞核在一个网络中相互连接,该网络的灵感来自于人类大脑皮层部分之间的白质连接。 这些和其他设计原则(其中大部分以前已经存在,但从未结合在单个芯片上)使 NorthPole 在标准图像识别基准测试中大幅击败现有的人工智能设备。 尽管没有使用最新、最小型化的制造工艺,但它也使用了现代人工智能芯片五分之一的能力。 作者估计,如果 NorthPole 的设计采用最先进的制造工艺来实现,其效率将比当前设计提高 25 倍。

在正确的轨道上

但即使是 NorthPole 的 224MB RAM 也不足以支持大型语言模型,例如 Chatbot 使用的语言模型,即使在最简单的版本中也会消耗数千兆字节的数据。 该芯片只能运行需要在单独设备上预先“训练”的预编程神经网络。 但该论文的作者表示,NorthPole 的架构在自动驾驶汽车等速度关键型应用中可能很有用。

NorthPole 技术使内存模块在物理上尽可能靠近核心计算元件。 在其他地方,研究人员正在利用新材料和制造工艺开发更激进的创新。 这使得内存模块本身能够执行计算,原则上可以进一步提高速度和效率。

上个月描述的另一张幻灯片2它使用忆阻器在存储器中执行计算,忆阻器是能够在电阻器和导体之间切换的电路元件。 “IBM 的方法和我们的方法都有望减少与数据传输相关的延迟和能源成本,”忆阻器研究的合著者、北京清华大学的赵斌说道。

还有另一种方法,由多个团队开发,其中包括位于瑞士苏黎世的独立 IBM 实验室的一个团队3 — 它通过改变电路元件的晶体结构来存储信息。 这些新方法是否可以经济地扩大规模仍有待观察。

READ  黑色星期五优惠:购买 Withings ScanWatch 可享受 20% 的折扣