科学家提出了将大脑活动转化为语音的装置

2019-04-26 阅读量：30604 新闻来源：互联网 | 投稿

未来就在这里：科学家们推出了一种新的解码器，它利用与下颌，喉，嘴唇和舌头运动相关的大脑信号来合成一个人的语音。对于患有瘫痪，言语障碍或神经损伤的人来说，这可能是一个改变游戏规则的行为。

在研究参与者的神经语言中心上的电极放置的插图，其中在演讲期间记录的活动模式（彩色点）被转换成参与者的声道（模型，右）的计算机模拟，然后可以合成以重建句子中国机械网okmao.com。已经说过了（声波和句子，下面）。图片来源：Chang lab / UCSF神经外科。

能够将神经活动转化为言语的技术本身就是一项了不起的成就 - 但对于那些无法口头沟通的人来说，这绝对是一种变革。但是说起来，我们大多数人在日常生活中认为理所当然的过程实际上是一个非常复杂的过程，很难将其数字化。

“它需要精确，动态地协调声音的咬合器结构中的肌肉 - 嘴唇，舌头，喉部和下颌，”Chethan Pandarinath和Yahia Ali在新研究的评论中解释道。

将演讲分解为其组成部分并不真正奏效。如果你考虑它，拼写是离散字母的连续串联，而语音是一种高效的交流形式，涉及重叠和复杂运动的流体流多咬合器声道运动 - 与这些运动相关的大脑模式是同样复杂。

在当前研究中用于记录大脑活动的示例性颅内电极阵列的图像。图片来源：UCSF。

第一步是记录五名参与者大脑的皮层活动。这些志愿者在大声讲述数百个句子时记录了他们的大脑活动。还遵循了声道的运动。然后，科学家对这一过程进行逆向工程，从大脑活动中产生语音。在101个句子的试验中，听众可以很容易地识别和转录合成的语音。

一些研究使用深度学习方法重建来自脑信号的音频信号，但在这项研究中，由博士后研究员Gopala Anumanchipalli领导的团队尝试了不同的方法。他们将这个过程分为两个阶段：一个解码与语音相关的运动，另一个阶段合成语音。演讲是针对另一群人进行的，他们没有任何问题。

在单独的测试中，研究人员要求一位参与者说出句子，然后进行哑剧演讲（演讲与演讲相同，只是没有声音）。该测试也是成功的，作者得出结论，可以解码从未听过的语音特征。

演讲的发生率非常高。失去由于医疗条件而进行通信的能力是毁灭性的。使用头部和眼睛的移动来逐个选择字母的设备可以提供帮助，但是它们产生大约10字/分钟的通信速率 - 比平均语音中的平均150字/分钟慢得多。这项新技术与自然语速相当，标志着一种显着的改进。

重要的是要注意，该设备并不试图理解某人在想什么 - 只是为了能够产生语音。研究作者之一Edward Chang解释道：

“该实验室从未调查是否有可能解码一个人的大脑活动。该实验室的工作专注于让言语失语的患者重新获得沟通能力。“

虽然这仍然是一个概念验证，并且在实际实施之前需要更多的工作，但结果是令人信服的。随着持续的进步，我们终于可以希望赋予言语障碍的个人权力，重新获得说出自己思想并与周围世界重新联系的能力。

免责声明：本文仅代表作者本人观点，与中网机械，okmao.com无关。本网对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考，并请自行承担全部责任。本网转载自其它媒体的信息，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。客服邮箱：23341571@qq.com | 客服QQ：23341571