清微智能推出“变形金刚”重构计算或引领AI芯片方向

2019-10-08 12:53发布

中国经济导报 中国发展网 记者王晓涛报道

在9月下旬举行的杭州云栖大会上,阿里首颗芯片问世,平头哥发布了最强AI芯片含光800,而平头哥阵营也在此次大会上首次亮相——清微智能、云天励飞等7家公司发布了7款基于玄铁处理器的芯片。其中,作为一款可重构计算芯片,清微智能的TX510芯片倍受瞩目。

无独有偶,在9月25日下午举行的云栖大会“人工智能芯片专场”上,清华大学微电子所所长魏少军提出,“智慧芯片架构”将让芯片变得智慧。

众所周知,AI芯片近几年很是火热,火热的同时,市场也稍显浮躁,仅去年一年,业内就推出了十几款AI芯片。

如果将AI专用芯片与通用芯片相比较,不难发现两者各有优劣:通用芯片难以负荷对计算的高要求,AI专用芯片则在可编程性、灵活性上有所欠缺。正如魏少军在分析算法的特点时所说:“算法仍在不断演进,新算法层出不穷;一种算法只对应一种应用,没有统一的算法。”

针对AI芯片的不足,美国学者迈克尔·乔丹曾直言:“我们现在正在做的并不是人工智能,而是智能增强。”

此前有业内人士表示,将不同的芯片架构结合在一起的“异构计算”,是一种较被看好的选择。因为异构计算能实现比较好的适应性和灵活性,在通用性和专用性上达成一个折衷。既能高效地处理数据,又能相对保证算法的及时更新和迭代。

而魏少军则对AI芯片的探索提出了更高的要求,他认为,AI芯片要具备八个基本要素。一是可编程性,要适应算法的演进和应用的多样性。二是架构的动态可变性,要适应不同的算法,实现高效计算。三是高效的架构变换能力,时钟周期小于10,低开销,低延迟。四是高计算效率,避免使用指令这类低效率的架构。五是高能量效率,处理器的运算能效比达到10TOPS/W,某些应用功耗小于1mW,某些应用的识别速度即帧率大于25F/s。六是低成本,能够进入家电和消费类电子。七是体积小,能够装载在移动设备上。八是应用开发简便,开发者不需要芯片设计方面的知识。

一年半前,魏少军曾在《AI芯片发展需要应用和架构创新双轮驱动》一文中提出了一连串的问题:什么是理想的AI芯片架构?是否会出现类似通用CPU那样独立存在的通用AI处理器?如果存在的话,它的架构是怎样的?

与前面提到的“异构芯片”不同,魏少军领衔的清华大学微电子所提出的是一种新的用软件定义芯片的芯片架构创新——“重构计算芯片”。乍看之下,可重构计算和异构计算有些类似,因为后者同样会调用不同的计算单元去执行各单元擅长的任务。对此,清华大学微电子所副所长尹首一表示,异构计算相对容易,因为CPU、DSP等都是现成的,将它们集成在一起即可;可重构计算是更底层的计算架构技术创新,本身具有挺高的技术含量和门槛。

魏少军对“重构计算芯片”有着自己的期望,其软件和硬件均可编程,芯片功能随软件变化而变化,可根据算法和应用的不同灵活配置硬件资源,执行不同的任务,就如同芯片领域的“变形金刚”,开发者不需要芯片设计知识,能量效率和计算效率高。同时具有通用、高灵活性的特点,不存在寡头垄断,采用先进的芯片制造工艺,通过扩大用量降低成本,应用市场不存在生态问题。

对于清华大学微电子所率先提出的“可重构神经网络计算架构”理念,业界予以了高度评价。2018年1月24日的《麻省理工科技评论》认为这是中国在芯片领域所取得的至高无比的成就(crowning achievement)。

2018年,以清华微电子所可重构计算团队为背景的创新企业清微智能正式成立 ,其首席科学家是尹首一。

清微智能成立当年,即推出了第一款产品语音芯片“TX210”,主要面向智能耳机。在今年的杭州云栖大会上,清微智能发布了其全球首款可重构多模态智能芯片“TX510”。据了解,TX510不仅支持视觉智能处理,也支持语音智能处理。典型功耗为400mW,峰值算力达1.2TOPS,支持混合精度计算和稀疏神经网络,AI计算有效能效比达5.6TOPS/W。

据悉,TX510集成了阿里平头哥的两款IP Core,团队已和定位“AIoT基础设施提供商”的平头哥有了密切的合作,例如应用无剑平台进行芯片设计。而TX510的第一批客户,将是阿里生态圈中的合作伙伴。预计到明年,清微智能的语音芯片和可重构多模态芯片TX510的总出货量可能在4000万颗左右。

魏少军曾表示,产品技术有多好,得到多少赞扬和奖励,我们统统不承认,我们只承认你卖了多少。市场上论英雄,要靠市场表现。

TX510能否成为AI芯片的英雄,市场无疑将是最好的证明,让我们拭目以待吧。

中国经济导报 中国发展网记者 王晓涛

文章来源: https://www.toutiao.com/group/6745275327137710596/