Ctrl-labs CEO:脑机接口突破不断,五年内或可实现商用

2019-11-23 08:37发布

【猎云网(微信号:)】11月23日报道(编译:金怡琳)

要让你的大脑理解神经接口初创企业Ctrl-labs的技术到底是什么,着实有点困难。而Ctrl-labs却想让你的大脑直接使用该技术,将精神意图转化为行动。在2019全球网络峰会上,外媒采访了Ctrl-labs的首席执行官Thomas Reardon,以了解脑机接口的工作原理。

Ctrl-labs成立于2015年,是一家总部位于纽约的初创公司,其致力于开发一种腕带,可以将肌肉神经信号转换成机器可执行的指令。Facebook于今年9月收购了该公司,但收购尚未完成,因此自签署协议以来,Reardon并未与这家社交媒体巨头的任何人进行过交谈。但他渴望分享更多关于神经接口技术的信息,以便使人们了解为什么Facebook(以及整个技术行业)会对此感兴趣。

简而言之,Ctrl-labs希望我们与技术进行交互,而不是通过鼠标、键盘、触摸屏、声音或任何其他方式进行信息输入。Reardon和他的团队期望在几年内将能够使用单个神经元而不是思想,就能直接控制技术。

“所有机器学习问题的根源”

Reardon多次表示,他的公司正在解决“所有机器学习问题的根源”。他在会议上也多次提到这句话。苹果首席执行官蒂姆·库克之前曾将自动驾驶汽车描述为“所有人工智能项目之母”。每个人都理解自动驾驶汽车的复杂性,所以我们想知道Ctrl-labs的这项技术到底有多么困难。

Reardon表示:“这种技术能够实时解码神经活动并将其转化为控制,这也是你的身体正在做的。每个级联的神经元序列都属于不同的层,例如信号先到皮层,然后再发送至脊髓。每组神经元都在解析前面传来的信号。在几毫秒的时间内,完成最终动作。”

首先必须捕获所有信号,然后重新调整其用途。“我们正在尝试使用另一端的机器来做到这一点,”Reardon表示。“仅部分解码就需要大量非常灵活的定制算法来实时运算。神经科学的工作方式是记录所有数据,在几周内进行分析。这些大部分都是事后进行的。在事后对数据进行分析,试图理解神经元的活动是如何产生最终行为的。这是所有神经科学的中心目标。因此,实时做到这些是几乎不可能的。”

简而言之,自然界中没有比人脑更复杂的系统了。要创造出一种不用在头骨上钻孔就能识别人类意图的算法是非常困难的。解码单个神经元的运动以控制机器是机器学习的终极挑战。其他一切项目没有比这更复杂的了。

Reardon说:“DeepMind在游戏领域取得的突破让人兴奋。但真正有意义的是能让人们实时体验。”

肌电图

在2018年12月,Ctrl-labs展示了其Ctrl-kit原型。它由两部分组成:一个外壳,大小近似于大型无线电手表;另一个是连着电极的部件,其电极位于手臂上方。Reardon展示的腕戴式设备可以通过蓝牙将其连接到电脑或智能手机进行数据处理。

在我们将意图转化为行动之前,要掌握手腕上的Ctrl-labs设备到底在检测什么。“这叫做表面肌电图(EMG),”Reardon解释说。“这是一种差分传感电极。运动神经元会发出一个叫做动作电位的小脉冲。它沿着轴突向下,穿过肌肉,伸展到接触肌肉中的数百至数千根纤维。当它产生电火花时,肌肉中的每根纤维都会相应产生较大的电火花。运动神经元的电火花非常小,几乎不可见。你也听不到它的声音,因为它只有纳安到皮安的电流。事实上,你的肌肉纤维有很多这样的电活动。而且,每根肌肉的纤维都在产生巨大的电场。”

为了将精神意图转化为行动,EMG设备正在测量由大脑到手部肌肉脉冲引起的电势变化。“最酷的是,我们变成了神经科学家,因为我们明白了‘如何获取肌肉的电活动,并弄清这种神经元产生的电活动是什么’就是我们所做的。我们能够从肌肉的电反应中重现这些脊髓运动神经元的活动。”

机器的咿呀学语

Reardon说,您可以在大约90秒内学会,使用Ctrl-labs腕带来完成大脑的一项任务。那么,在这90秒钟内您和EMG设备之间到底发生了什么?

Reardon说:“我们从婴儿的行为中可以看出。当你还是个婴儿的时候,你就会模仿着呀呀学语。你明白了当有神经意图时,就会做出相应的动作,然后相应建立起了一个从身体的神经映射到动作的输出映射。成人知道这个原理,但婴儿不知道。他们需要相当长的时间才能熟练地抓取物体。这就是所谓的‘技能、接触和掌握’。”

他继续说:“你对此感到兴奋。这是你最感兴趣的事情,甚至超过了说话和数学。你真正擅长的事情是学习如何运动,尤其运用手和嘴。你可以运用一种非常好的技巧来做到这一点。做一些精细的动作,这几乎不涉及神经活动。婴儿要花很长时间才能建立这种联系。但一旦建立了,你就会一直这样做,永远不会停止。”

为了更好地解释他的观点,Reardon在桌上放了一杯水。然后他让我尝一口,并做出身体动作。我照做了。

他说:“这是你一生中最难做的事情。”

我问Reardon,他的意思是不是说这个动作很难教机器人完成。毕竟,手的运动路径每次都不同。他说:“这的确很难,因为涉及到很多的自由度,既涉及您的手部运动——手臂有27个自由度,也涉及到这个东西本身。您在生活中已经喝了几百万次水了,但是每次做的动作都是不同的。不同的重量,不同玻璃的质地等等因素使你每喝一遍,都会产生一套新的动作。”

机械反馈

Ctrl-labs正在研究人类是如何使用自己的身体的,它重新利用了我们控制技术的能力。

“人类具有出色的运动适应能力,”Reardon解释说。“我们脑中有动作路线图。‘我要拿起这只玻璃杯,放到嘴边,而不是放到脸上。’而且我们轻轻松松就做到了,并不需要‘集中精力做这件事。’人类拥有如此巨大的反馈容量,而机器开发却没有达到这种水平。从本质上讲,我们正试图打开这扇大门,就是让机器能够在几秒钟内学习和运用这种技能。他们能大致知道如何去做,并且很快采取行动,而且做得非常好。”

根据Reardon的说法,归根结底,大脑只会做一件事,并一直在做这件事——控制肌肉。人类非常擅长利用大脑控制肌肉,每次都能准确地做出动作,这需要大量的计算,但是对人类来说就很容易,不会产生认知负荷,而机器却做不到。这就是机器学习问题的根源。Ctrl-labs试图研究人类的学习方式。

跳跃的恐龙

谷歌Chrome浏览器具有一个自带的离线恐龙游戏,在没有互联网的情况下您就可以玩。Ctrl-labs之前曾在全球网络峰会上通过该游戏来展示其技术,因此我们也以它为例。

假设您有一个Ctrl-labs腕带,并打算学习如何用意念让恐龙跳跃。首先,您可以通过一个按钮,它可以检测到肌肉的电活动。您按下按钮,恐龙就会跳跃。您不停地按,恐龙就会不断跳跃。最终,您不需要按按钮,而只需要运用意念。当您想让恐龙跳的时候,它就会跳跃。

在腕带内部,有特殊的技术能使它正常工作。Reardon解释说:“一开始,我们让恐龙根据按键来跳。然后,慢慢让它记录过程中的电活动,最后是肌肉的电活动让它跳跃,而不是按键。”

Reardon说:“过去,您使用移动设备所做的所有事情都是通过动作完成的。实际上,所有事都需要动作。但我们想让你忘掉动作,而保持这种意图。”

您的动作不用固定。Ctrl-lab表示,比如您可以用右手的中指按按钮,但在实际操作中,这完全是任意的。可能您用拇指按下了按钮,也可能使耳朵运动。这都不是最令人惊奇的事。

力量调节

“我不必让你停止动作,您就能意识到,无论是否按下按钮,恐龙都会跳跃。这才是最酷的事情,”Reardon说。“这就是大脑真正擅长的,大脑正在试图找出引起反应的最小动作。你现在所做的任务是调节力量。你试图用最少的神经活动产生肌肉收缩来拿回杯子。而且,您总是试图将其最小化,但这是不可能的。”

当您的大脑发现正在做的动作与结果之间没有联系时,它就会停止进行完整的动作。一旦您开始让恐龙在脑海中跳跃,您要保持专注。开始你需要依靠动作,但现在只用意识就可以完成。Ctrl-labs正在利用我们与生俱来的能力,即尽最小的努力来完成一个动作。

您很快就可以通过参加小型培训课程,学会自己用意念控制各个设备的操作。戴上设备后,你可以点击屏幕,在应用或游戏中进行某些操作。大约90秒后,您无需点击屏幕就可以完成此操作。Reardon说,每个人都可以做到这一点。

他说:“这是很奇怪的小把戏。它运行非常平稳,你还可以不断构建新的程序。当你把这些增至数百个按键时,我们会试着将其简单化。第一次体验时,你会觉得非常奇怪但又很有趣。”

打字

由于我们最终谈论的是输入设备,打字是显然要考虑的。让你的思维控制恐龙跳跃是一回事,而用大脑打字完全是另一回事。我们以前见过来自Ctrl-labs的打字演示,但Reardon说,这个月展示的是完全不同的。不同于用实际键盘还是自动更正的虚拟键等平常做法,Ctrl-labs想做的是让你通过意念直接输入单词。

“这一次,我们有能力实时控制语言模型。我们称之为‘造词’,所以你不用打字。你需要做的是实时造词。你可以在单词间进行选择,也很快就能学会如何输入你想要的单词,而不是一次只敲一个字母键。”

这种书写方式的主要吸引力是什么?速度。

“最终,我们希望你能够以说话的速度打字。有些人认为,语速大概是语言产生和创造的认知极限,我们已经很适应说话速度了,但打字显然没有这么快。你可以非常快的语速说话,但你能以每分钟250字的速度打字吗?至今没有人能做到这一点。但其实,口头表达和受文本流控制的方式实际没有任何区别。”

需要明确的是,Ctrl-labs尚未实现这项技术。他们仅演示了每分钟40个单词的打字速度。任何人都可以学习如何在键盘上更快地打字。除了速度之外,还有很多应用可以让你在没有键盘、触摸屏或麦克风的情况下打字。

AR、VR和新兴平台

Reardon说:“这些显然在所谓的新兴平台中具有巨大价值。无论是戴在手腕上或脸上的计算机,它们都需要全新的文本界面。除此之外,我们还花了大量资金说明语音不是控制机器的方式,它只能作为一部分,而且不是最重要的部分。你很少会用到这种方式,这一点在人们使用Alexa上得到了最好的体现。我们应该用文字来控制机器,实际上我们都是用文字来创作,而语音是一种糟糕的方式。”

AR和VR肯定是潜在应用的目标,因为它们目前没有良好的控制体验。因此,Facebook计划将Ctrl-labs合并到其Reality Labs部门中就不足为奇了。自2014年3月以20亿美元收购Oculus以来,Ctrl-labs大概是Facebook最大的一笔收购。机器人技术是Reardon提到的另一个领域,尽管目前还不清楚Facebook是否会继续采用机器人技术。

用意念打字只是Ctrl-labs展示的众多例子之一,这些例子足够激起Facebook的兴趣,让它买下这家公司。但是,令人印象深刻的是该公司是如何实现意念打字的,而不是打字本身。

单一神经元

当Ctrl-labs与神经科学家合作时,第一个问题总是围绕着信号是否来自单个神经元。Ctrl-Labs是否以其他技巧掩盖了其技术?恐龙演示旨在显示该公司可以实时解析单个神经元。这个人并没有做动作,但是恐龙却实现了跳跃。

这就引发了一个问题:神经元以前是用来干什么的?

在回答这个问题时,Reardon对今天关于脑机接口的讨论感到沮丧。其中包括“马斯克和Neuralink正在做的疯狂侵入性活动,他们表示这对那些没有运动能力的人有深远价值。”当然,有些人已经丧失了某些运动能力,现在有机会让他们恢复这种能力,这是好事。但接下来的讨论很快就变成了利用神经元来控制身体之外的事物,以及直接控制人工智能。

意图而非思想

“问题是大脑中的每个神经元已经在运动了,”Reardon解释说。“这不是一群等待使用的神经元,脑机接口技术只是为了关注它们。现实情况是,神经元已经在运动了,你能否试图解析它们的运动并将其转变为动作?目前没有神经科学家可以告诉我什么是思想。这就是为什么我们采用这种独特方法来尝试谈论意图而不是思想。我们非常关注这一点。我们试着让你控制你想控制的东西,首先就是你必须对要做的事有所打算。”

同样,在恐龙演示中,用户非常专心地控制神经元。“他是带着目的,而不是仅仅考虑让恐龙跳跃。他明确的意图使脊椎中的运动神经元产生电火花。”

运动神经元控制着大约1000到1万个尺侧肌肉纤维。当然,您可以使用其他肌肉。

突破

Reardon说:“最困难的部分不仅仅是关注神经元,并让其以新的方式控制某些事物。这是您能够使用该神经元的条件。我们真正艰难的工作是区分您是利用那根神经元来控制身体还是控制机器。我认为,我们在区分同一神经元不同类型的神经活动方面取得了一些惊人的突破。”

你怎么知道它只是单个神经元?

“我们已经得到了详尽的证据,”Reardon说。“我无法在这里详细描述。但是这些证据会随着我们的技术而公布。我们用一种传统的方法证明了是单个神经元被激活。我们的领域称之为运动单元,它是一组对应于单个神经元的纤维。这实际上很难证明,但我们觉得已经通过严谨的科学手段证明了这一点。”

Ctrl-Labs发布其证明时,将通过标准的同行评审。Reardon澄清说,关于单一神经元突破的部分已经发表,但最新的成果尚未发布。

Reardon表示大约五年内,神经接口技术就可以实现商用。

文章来源: https://www.toutiao.com/group/6762285162844652046/