FPGA作为一种可编程逻辑器件,具有善长数据并行计算、更加灵活和低延迟的特点,随着云计算、人工智能时代的到来,已经从最初诞生时的电子设计外围器件,逐渐演变为数字系统的核心。目前全球主要FPGA厂商,如赛灵思、英特尔(Altera)等结合自身发展策略,使FPGA展现出不同的新趋势。
人工智能应用,FPGA市场4年增3倍
云计算、人工智能的应用发展,对芯片的计算力提出了更高要求,FPGA由于可以同时进行数据并行和任务并行计算,同时更务更大的灵活性,很多使用通用处理器或 ASIC难以实现的底层硬件控制操作, 利用 FPGA 可以很方便的实现。因此,近年来FPGA受到越来越多的关注和应用。
特别是这些年人工智能的崛起,依靠的是深度神经网络算法大型多层的网络模型,典型的有循环神经网络和卷积神经网络为代表。这样的模型一次推断(inference)通常需要数十亿甚至上百亿次的运算,而在线的服务系统的响应时间在毫秒量级。这就意味着每秒上万亿次(TFLOPS)甚至百万亿次的运算性能,同时对器件的体积、功耗还有一定的约束。这使得我们期待数据中心的高性能计算硬件应当具备如下优势:低延迟,低开销和规模化。在数据中心,FPGA 相比 GPU 的核心优势在于低延迟,使用 FPGA 来加速的话,只需要微秒级的 PCIe 延迟。对通信密集型任务,FPGA 相比 CPU、GPU 的优势就更大了。
因此,近年来FPGA的应用正在领域不断拓展,市场规模也不断扩大。研调机构Global Market Insights的报告称,2022年FPGA规模可望超过99.8亿美元。而Semico Research预测,仅在人工智能应用中,FPGA的市场规模将在未来4年内增长3倍,达到52亿美元。
赛灵思:异构计算平台化发展
面对越来越拓展的应用趋势,各FPGA厂商也在推出不同的解决方案。这些解决方案,既反应了不同厂商面对新市场需求所形成不同的发展策略,也对于FPGA的技术趋势形成不同影响。
去年,赛灵思在其2018开发者大会(XDF)上发布了业界首款7nm自适应计算加速平台 (ACAP)产品Versal。ACAP 的核心是新一代的 FPGA 架构,并结合了分布式存储器与硬件可编程DSP 模块、一个多核 SoC 以及一个或多个软件可编程且同时又具备硬件灵活应变性的计算引擎。从Versal ACAP的推出可以看出,赛灵思正在试图改变以往以FPGA为单一核心的状况,而是朝着异构计算平台化发展,希望以此将不同种类的算法分配到更合适的异构引擎当中。新平台可以支持更多应用,适应不同的开发者。正如赛灵思细分核心市场副总裁Yousef Khalilollahi所言:“单独一个计算体系结构,无法满足当今最苛刻的应用所需要的性能和功耗需求。在后摩尔定律时代,异构计算是唯一的发展之路。”
英特尔:面向云端提供综合性解决方案
对于英特尔来说,其对FPGA的发展策略则是更多地整合到多种处理器产品组合当中,面向云端提供综合性的计算解决方案。在日前举办的“英特尔公司中国媒体纷享会”上,英特尔中国研究院院长宋继强提出“超异构计算”概念,其中就包括了在未来芯片架构设计上进行灵活性的组合部署,实现CPU、FPGA、GPU等处理器的组合,显示了英特尔基于其在云计算上的强大实力,正将服务器CPU与FPGA的加速功能进行整合。FPGA正越来越深入的嵌入到英特尔云端处理解决方案当中。英特尔数据中心事业部副总裁Caroline Y. Chan也表示,随着5G网络的建设,像是快速部署无线网络、确保网络性能、建置虚拟化环境等,都是必须完成的工作。而FPGA的优势十分明显,在实现网络虚拟化加快当中势必会使用到它。另外,其可编程的特性也为网络新增功能提供了更多灵活性与可扩展性。
嵌入式FPGA:市场接受程度将大幅提升
Achronix公司是嵌入式FPGA(eFPGA)的代表性公司,虽然公司规模远远无法与前两者相比,但是依然代表一种发展方向。eFPGA是指将一个或多个FPGA以IP的形式嵌入ASIC,ASSP或SoC等芯片中的发展模式。eFPGA的特色之一是易用性,它降低了客户集成FPGA加速器的门槛。客户通过定制其逻辑、Ram和DsP资源需求,可以将多个IP进行组合,以便为特定的应用创建优化的可编程功能。
不同于CPU、GPU等在移动时代快速实现IP化的发展趋势,进而被嵌入到各种SoC当中。嵌入式FPGA一直没有成为市场的主流。不过,随着云计算、人工智能时代的到来,eFPGA的市场接受度有望进一步提升,成为FPGA产品的主要发展趋势之一。
近日,Achronix公司发布新的系列产品Speedster®7t,其力图将FPGA的可编程性与ASIC的布线结构和计算引擎相结合,通过对二维片上网络(2D NoC),以及高密度全新机器学习处理器(MLP)模块阵列等的集成,简化用户设计,以应对人工智能机器学习应用的需求。“Speedster7t系统将数学函数、存储器和可编程性整合到机器学习处理器中,再结合交叉芯片、二维NoC结构,可以确保整个器件中数据自由流动。而在人工智能机器学习应用中,内存带宽就是一切,Speedster7t在这方面可以提供令人印象深刻的性能指标。”Achronix Semiconductor总裁兼首席执行官Robert Blake表示。
Robert Blake同时还表示,公司可以提供Speedster®7t的IP,使该产品可以嵌入到用户的芯片产品当中。Robert Blake表示,FPGA是可以有效实现IP化的。eFPGA具有易用性,降低使用门槛,可以快速满足用户多样化的需求,无论是系统级还是芯片级都可以支持。这在人工智能时代非常重要,特别是在边缘侧计算中受到欢迎。事实上,现在有更多用户在寻问我们FPGA 的IP问题。相信未来将有越来越多IP化的FPGA被应用。
“eFPGA是令人兴奋的新工具,它使SoC架构师可以使他们的芯片更加灵活和可重新配置。” Robert Blake表示。