Hardware Club管理合伙人杨建铭:人工智能需要实体支撑|行业前沿

2019-06-26 12:14发布

本文原文载自风传媒杨建铭专栏

网址:https://www.storm.mg/article/239630?srcid

文章原标题:人工智能需要实体支撑

主编导读:人工智能不单纯是依靠软件支撑,还需要大量的真实世界数据和硬件,这说明了为什么AI+IoT近年来大行其道,因为人们发现人工智能不能没有硬件抓取数据,这也催生了一批全球化的AIoT平台如涂鸦智能诞生,赋能初创团队硬件能力和AI解决方案。

作者简介:杨建铭,现任巴黎风险资本公司Hardware Club管理合伙人。台湾大学电机学硕士、法国HEC Paris MBA,CFA持证人,过去曾在亚洲、硅谷和欧洲半导体行业从业十二年,包含创业四年。



​​

▍图片来源于网络

众所周知,科技巨头如谷歌、脸书、百度、亚马逊和苹果,正在抢先定义这个快速崛起的产业结构。但看过诸多人工智能初创公司(以下简称为初创企业)的提案和相关新闻后,会发现许多创业家又重复犯下了曾经在无人机以及VR浪潮中所犯下的错误。

科技创新需要实体载体支撑

任何科技都有最终的实体载体,不管是医疗、运输、能源或通讯。在我们人类进化到像“攻壳机动队”那样,可以将科技创新通过大脑上传至网络,达到完全虚拟存在以前,任何科技都需要透过实体载体与人类以及自然环境互动。

在2004年的初创企业大浪潮下,科技创新主要通过两大载体普及:手提式电脑以及智能手机。脸书和Youtube在电脑浏览器上建立起帝国,Whatsapp和Snapchat等原生的移动初创企业,则是在APP的生态圈里快速地攻城掠地。

这两大载体的普及是无数初创企业得以诞生的原因:有专门的大公司和大品牌大量制造和贩售硬体和作业系统,初创企业开发出的应用程式所能触及到的终端装置数以亿计,挑战只在于如何赢得使用者或企业用户的心。

在这一背景下,所产生的是各种“非垂直整合”的精实初创企业,有初创企业专注于做广告流量导向价值链中的一环,有的开发某种产业应用的共通API,甚至有单纯把各大新闻网站的内容按照关键字定制化、再以美丽的样貌呈现给使用者。

这些精实初创企业(备注:Lean startup,低成本且快速迭代产品的创业公司)只专注在他们觉得最有利可图的那一块,通常是纯软件,实体载体的部分会有“电子代工厂”完成。这种违反自由市场直觉的“众人皆醉我独醒”的心理谬误,让各式各样的精实初创企业在无人机和VR这两个也是由初创企业掀起的浪潮中栽了跟头。



​​

▍中国人工智慧大会在北京开幕,一名参展工作人员介绍“小优机器人”,它可以识别语音,主要应用于陪伴儿童。(新华社)

精实初创企业需实现全面垂直整合

以无人机来说,起头的是大疆DJI,但真正引爆无人机创业热潮的,是由Wired杂志主编克里斯・安德森所创办的3D Robotics。又称为3DR的这间美国初创企业,选择开源(open-source)它的无人机架构,不仅吸引了不少开发者来设计基于3DR的客制化无人机,还吸引了更多精实初创企业来开发作业系统和应用软件。

问题是无人机不同于智能手机,市场中并不存在几亿台装置等待这些软件公司推销自家产品——他们觉得无人机硬件无利可图,若是事实,那么硬件开发商和代工厂一定比软件公司更清楚,也不会抢入这样一个非刚需的高价硬件市场。

两年过去,纯粹做软件(甚至包含引爆开源无人机热潮的3DR本身)的公司开始出现问题:软件开发团队仍在运转,但却没有其他公司愿意赔钱,出货一亿台无人机到全世界的消费者手中,好让纯做软件的公司赚快钱。到头来唯一赚钱的,是从硬件到作业系统到应用程式全面垂直整合的大疆DJI。



​​

▍亚马逊(Amazon)的送货无人机(AP)

VR的世界也存在类似的问题,只是结构不同。

Oculus VR高价卖给脸书、引爆虚拟实境热潮后,果不其然出现了大量的软件初创企业,然而能够大量出货载体(头戴式装置)的却只有新力、三星和Oculus。其中三星和Oculus都是PC平台,理论上各种纯软件初创企业都有机会取得应用市场,但这两家的头戴型装置都需要高阶PC,短期来说只有超级电脑游戏玩家们是可触及的市场。

因此,精实初创企业没办法像在智能手机上那样,无视平台,直接进攻消费者,还是需要遵循古老的新力游戏开发商模式,没有太多弹性策略可以采用。

了解到无人机和VR软件初创企业现在不胜唏嘘的现实后,如果来审视人工智能初创企业,也不难发现,许多初创企业也犯下了同样的错误。



​​

▍苹果执行长库克(Tim Cook)认为,AR比VR更有吸引力。(美联社)

人工智能优化世界:需寻找可输入的资料库

人工智能现在的蓬勃发展,是很狭义的“深度学习”(Deep Learning)。在这个领域里,有明确的“输入”和可定义的“输出”,开发者建立复杂的数学模型,使用足够资料量的“训练集”(training set),反复投入多层的非线性演算单元,从而提炼出一个人工神经网络(neural network),今后再有新的资料输入时,就可以直接汇入这个人工神经网路,来得到输出。

举例来说,如果我们想要的人工智能应用是自动驾驶,我们可以先分析人类开车的方法:用眼睛接受路况(输入),用大脑和经验法则进行判断(人工神经网络),然后用手脚去控制方向盘、油门、煞车和排档(输出)。

因此,要开发自动驾驶的深度学习系统,就得把大量的路况资料,包含高速行驶中看到的行道树、突然从人行道冲出来的小狗、没打方向灯就换车道的车主⋯⋯等——投入到深度学习演算法则中,进而提炼出一组可以代替人类驾车的人工神经网络,将这个网络植入到自动驾驶车中,让它可以针对未来新的输入资料(路况),去自动控制方向盘、油门、煞车和排档等。

这看起来非常合乎逻辑,所有数学很好的人工智能专家都跃跃欲试,但这里面有一个不可忽视的问题:没有任何一间初创企业在成立之初,就有庞大的路况资料库可以用来训练自己的机器——你可以拥有高达240的智商,也熟稔所有深度学习的理论和编程,甚至可能你的论文指导教授就是Yann LeCun本人(卷积网络之父,是公认的世界人工智能三巨头之一。 ),但只要手头上没有谷歌累积了十几年的路况资料,都是巧妇难为无米之炊。

这样一来,大家应该可以理解为什么明明是软件巨头,亚马逊却要自行开发并贩售Echo,明明市面上已经有满坑满谷的安卓手机,谷歌却仍持续开发自家产品,并且还收购智能家庭装置初创企业Nest,并推出Google Home和亚马逊竞争。

原因在于软件巨头们理解持续累积的庞大资料库才是人工智能的决胜战场,软件巨头除了自己已经有的、由他们的使用者自愿提供的纯网络资料(使用者的消费习惯和搜寻历史),他们还想获取更多实体环境中的资料。

换句话说,当一个美国家庭的小孩在嘈杂的厨房中开口:“Alexa,世界最长的河流是哪一条?”时,亚马逊得到的并不只是通过销售亚马逊河相关旅游书籍,带给这个家庭的旅游资料,而是立刻多了一组自然环境中的人声资料,可以投入其深度学习系统,协助Alexa进一步提升语音辨识和回答能力,以期有一天可以达到语音辨识的圣杯:鸡尾酒派对对话。

这样一来,想做纯软件初创企业的人工智能创业家就应该仔细审视自己的应用情境:可以轻松入手的输入资料库是否存在?

在某些领域,这样的资料库的确存在。

以谷歌收购的Deep Mind所开发的Alpha Go来说,输入资料库是固定的围棋规则以及几千年来人类历史累积的棋谱,这是最单纯的应用情境,完全取决于团队的能力(和谷歌的资金)。



​​

▍人工智慧与人类的围棋赛引发人球关注,会不会有一天,这些科技有了自我意识?(美联社)

文字介面的智慧型初创企业,从某种程度上说,也是由(语言)规则和容易取得的文字资料库所构成。但即便如此,我们仍然可以看到,如“安排行事历行程”这样简单的应用,在初创企业耗费掉大笔资金后所产生的产品仍然远远不如我们预期。

另外一个拥有丰富公开资料的市场是上市股票交易,不过这部分的市场早就在避险基金的竞争下千锤百炼,战场已经转移到关于上市公司的非公开资讯,非金融背景的初创企业不见得有优势。

此外,众所皆知的人工智能相关资料库是史丹佛大学的ImageNet,这也是许多深度学习研究者“出国比赛”的战场。但大家都有的,就等于没有,随着深度学习的普及化,同样使用ImageNet开发深度学习的初创企业,彼此间的效能差异(准确度和速度)会越拉越近,而静态影像辨识到底有多少可以应用在其他领域,又是另一个问题。

扣除这几个“输入”相对容易取得的领域后,初创企业能够入手的有用资料真的寥寥无几。

想用人工智能管理商业大楼?感测器开发商不会把辛苦搜集来的用电、用水、湿度、温度⋯⋯等资料让给你。

想用人工智能进行社区安全管理?谷歌Nest旗下的云端监视器龙头Dropcam肯定已经自己在开发相关应用。

想用人工智能管理全加州的农场?开着车南北跑、说服农夫把IoT感测器安装到几百公顷范围内的科技公司或者初创企业,农夫岂会把辛苦换来的宝贵资料转手交给你?

然而,要想抵达我们期待的人工智能优化世界,需要新的实体载体搜集大量的资料,这些实体载体目前不见得存在,存在的话也不见得像电脑或者手机那样是任何软件初创企业都可以直接使用和布局的。

文章来源: https://www.toutiao.com/group/6706654527249973767/