阿里巴巴的新AI芯片每秒可处理近80000张图像

2019-09-27 04:07发布

阿里巴巴深知对支持当今AI应用程序的专用计算的需求不断增长。去年,这家总部位于杭州的科技巨头启动了其半导体子公司Pingtouge(中文为“ Honey Badger”)来开发嵌入式芯片和神经网络加速器。当时,阿里巴巴首席技术官杰夫·张(Jeff Zhang)承诺,Pingtouge将在今年年中之前生产出世界上最先进的神经网络芯片。

今天,阿里巴巴信守诺言。在2019年阿里云(Aliyun)Apsara大会上,Pingtouge推出了首款用于基于云的大规模AI推理的AI专用处理器。汉光800是阿里巴巴20年历史中的第一款半导体产品。

还宣布了基于汉光800的新AI云服务,该服务的性能比传统基于GPU的服务高100%。

12纳米汉光800包含170亿个晶体管。在ResNet-50上进行推理图像分类基准测试后,汉光800的峰值性能为每秒78,563张图像(IPS)。张说,汉光800的性能是NVIDIA T4 GPU的15倍,是NVIDIA P4 GPU的46倍。该芯片的峰值效率为500 IPS / W。

Pingtouge芯片开发团队花了七个月的时间来完成芯片设计过程,并花了三个月的时间进行流片。

汉光800正在阿里云内的许多应用场景中实现,从视频分类到智慧城市应用。例如,该公司流行的Pailitao平台将可视图像搜索应用于电子商务,从而允许客户通过拍摄查询对象的照片来搜索商品。借助新型汉光800提供的基于AI的图像识别和索引功能,阿里云可以将图像处理效率提高到GPU的12倍。

关于智慧城市技术,阿里云表示,它先前使用40个传统GPU处理杭州市中心的视频,延迟为300毫秒。现在,该任务仅需要四个具有150ms较低延迟的Hanguang 800。张说,在不久的将来,该芯片还有望用于医学成像和自动驾驶。

在这一阶段,阿里巴巴没有直接向客户出售其汉光800芯片,就像谷歌没有出售其TPU。开发者可以在今天宣布的新AI云服务Aliyun上租用Hanguang 800时间,该服务要求开发者描述他们想使用该服务做什么,并请求一个云计算配额。阿里云表示,这项新服务比传统GPU更具成本效益100%。

汉光800发行版是阿里巴巴一系列技术公告中的最新成果:在8月于上海举行的世界人工智能大会(WAIC)上,Pingtouge推出了“无剑”(中文为“ No Sword”)–一种片上系统(SoC)用于AI和IoT场景的设计平台。

7月,Pingtouge推出了RISC-V(精简指令集计算机)处理器。Xuantie 910将用作生产高端基于边缘的微控制器(MCU),CPU和SoC的核心IP。该处理器是为5G,人工智能和物联网量身定制的,并将在不久的将来开源。

中国科技巨头华为,阿里巴巴和百度都跳上了AI加速器潮流。汉光800仅用于推理,而华为的新型Ascend 910 AI计算芯片可以处理AI模型的训练和推理,其性能是竞争对手NVIDIA Tesla v100的两倍。百度去年推出了其边缘到云芯片昆仑,其中包括训练芯片“ 818–300”和推理芯片“ 818–100”。14纳米Kunlun具有260 TOPS的性能,同时消耗100瓦的功率。

尽管汉光800的表现令人eye目结舌,但阿里巴巴·平图格仍然是半导体行业的雏形,在希望加入全球领先的芯片生产商之前,它还面临着漫长的技术历程。

文章来源: https://www.toutiao.com/group/6740876926929338894/