一周似乎不会没有像英伟达和英特尔这样的半导体巨头推动人工智能芯片前沿及其能力的消息。尽管 IBM 通过其 Watson 系统帮助定义了现代人工智能,但并没有经常被提及。
然而,本周,IBM 推出了一款新处理器 IBM Telum,该处理器配备了片上加速功能,可用于银行和其他领域的反欺诈应用程序的 AI 推理中国机械网okmao.com。根据 IBM 的一份新闻稿,在本周的 Hot Chip 会议上宣布的 Telum “旨在为企业工作负载带来深度学习推理,以帮助实时解决欺诈问题”,同时交易正在进行。
该公司表示,经过三年开发的 Telum 是第一款采用 IBM Research AI 硬件中心创建的技术的 IBM 芯片。第一个基于 Telum 的系统预计将在明年上半年出现。
“该芯片包含 8 个处理器内核,具有深度超标量乱序指令流水线,以超过 5 GHz 的时钟频率运行,针对异构企业级工作负载的需求进行了优化,”IBM 表示。“完全重新设计的缓存和芯片互连基础架构为每个内核提供 32MB 缓存,并且可以扩展到 32 个 Telum 芯片。双芯片模块设计在 17 个金属层上包含 220 亿个晶体管和 19 英里长的导线。”
IBM 表示,它与三星合作开发了三星 7nm EUV 技术节点中的 Telum 处理器。IBM 在银行、金融、贸易和保险等行业的大型机客户可能对新处理器最感兴趣,他们正在寻求 AI 推理的提升,但不一定对其他生产 AI 芯片的公司构成威胁。
J. Gold Associates 首席分析师 Jack Gold 通过电子邮件表示:“IBM 正在大力推动人工智能作为其许多主要垂直领域(例如银行、金融、保险)的工作负载加速器。” “他们正在许多这些领域大力推广 Watson。但是,许多 IBM 客户都有他们想要在自己的系统上运行的工作负载(不仅仅是作为 Watson 的服务或在 IBM 云中)。IBM 仍然向其客户群销售大量服务器,并且通过为 AI 构建加速器,他们使大型机具有更强的 AI 能力。”
Gold 表示,推理市场是大规模部署人工智能和机器学习以服务于企业工作负载的地方,虽然英伟达在一定程度上涉足推理市场,但该公司更专注于“高端、重型 [AI ] 训练空间。推理实际上是英特尔在其至强和 FPGA 加速器产品中占据主要地位的地方。”
最终,所有主要的芯片公司,甚至 AWS、谷歌和微软 Azure 等云提供商,都在开展自己的 AI 芯片加速器工作。“IBM 只是在构建一个更适合他们自己的 AI 推理模型的模型,而不是购买现成的模型,”Gold 说。