最近,美国加州大学旧金山分校的科研团队使用人工智能解码系统,把人的脑电波转译成英文句子,最低平均错误率只有3%。这项研究发表在《自然·神经科学》杂志上。
参加实验的4名志愿者都是癫痫患者,他们由于治疗需要在大脑表面植入了数百个微电极。研究人员正是利用这些微电极阵列来记录其脑电波信号,然后借助人工智能系统进行解码。
正确率胜过人工速记员
论文显示,10年前,科学家首次从人类大脑信号中解码出语音,但是解码的精度和速度远低于自然语速。
低到什么程度呢?
研究团队介绍,迄今为止,在直接从脑电波中解码语音的研究中,脑机接口系统仅限于解码单音节,或在志愿者连续念出约100个单词的情况下,只能正确解码不到40%的单词。
为提升解码精确度,研究团队从机器翻译中获得启发,训练了一种循环神经网络。研究中,4名志愿者被要求大声重复朗读30至50句话。他们大脑外侧皮质上分布着大量微电极,可以监测到相应的大脑神经活动。这些脑电波数据输入人工智能系统后,先被编码成一串序列,然后解码成相应的英文句子。
研究人员表示,这项研究展示了以高精度和自然语速来解码皮层脑电图。在对其中一个志愿者的脑电波解码任务中,平均每句话只有3%需要纠正——低于专业人工速记员平均5%的错误率。
但研究团队也强调,该研究涉及的句子量比较少。“如果你尝试不使用这50个句子的数据集,解码就会糟糕很多。”论文第一作者约瑟夫·马金接受媒体采访时说。
展示AI解读神经信号的潜力
“这项研究的创新之处在于,采用端到端的深度学习网络实现神经信号翻译,从工程角度展示了人工智能技术应用于神经信号解读的潜力。”清华大学医学院神经工程实验室、清华大学人工智能研究院教授洪波在接受科技日报记者采访时评价说。
洪波分析,这项研究的难点在于两个方面。
首先是采用了高密度微电极阵列,间距4毫米,多达256个电极,覆盖大脑皮层表面的关键脑区,获取了足够的神经信息用于解码。这种电极在国内尚没有可用于临床的产品。
另外,研究中深度循环神经网络的训练,除了采用时间轴上的卷积操作提高特征提取能力,还把语音频谱特征也作为训练目标,大大降低了对神经数据量的需求。
“脑机接口的一个核心难题是神经信息的解码和翻译,脑电信号噪声大,背后的神经编码机制复杂未知,这些都是挑战。”洪波认为,以深度学习为代表的人工智能技术发展,为脑机接口打开一条应对该挑战的新路径。
不过,在洪波看来,人工智能与脑机接口结合,也带来新难题:如何获得大量的训练数据?来自人脑的高精度神经数据通常只在临床条件下才能获得,这会使神经网络训练陷入困境。
现实应用仍存技术障碍
“这项技术目前主要用于癫痫外科的临床,帮助外科医生在切除癫痫病灶之前,确定关键的语言功能区。要让渐冻人、高位截瘫等残疾患者用上这样的脑机接口,还要继续解决长效电极和解码效率的问题。”洪波说。
他认为,相关技术在未来实际应用中,仍然有很大的技术障碍,例如高密度的微电极阵列目前还无法长期植入,难以作为未来脑机接口的标准电极。
洪波团队也在和材料、微电子以及临床团队合作,开发可以长期植入的微创解决方案。他告诉记者,根本上说,人工智能应用于脑机接口,关键门槛还是长期可靠的神经电极和清晰准确的神经解码规律。
“人们所期待的戴上脑电帽就能读出心里话,从科学和工程角度来看还有很远的距离。但脑科学和人工智能技术的结合,有可能加速这些探索和研发的进程。”洪波说。
责任编辑:Rex_02