五问五答:光子AI芯片可替代高端FPGA芯片,但工具链制约着产业化

2019-05-10 00:00 来源:未知 编辑:admin

原标题:五问五答:光子AI芯片可替代高端FPGA芯片,但工具链制约着产业化

hello,大家好!我们新开设“五问五答”栏目,旨在通过问答精选的形式,帮助更多人解决困惑。

智东西公开课的每场直播,分为主讲、官方问答与自由问答三个环节,共计90分钟。每场直播讲解,除了例行的官方问答外,很多专业用户在讲解过程中,尤其是在自由问答环节,提出了不少自己在工作或学习中遇到的困惑。每个主讲导师也都认真地进行了回答。问与答的过程,是非常有价值的探讨,也是实用性很强的指导。

每期“五问五答”,都将摘选单场公开课直播中5个专业用户的问题,以及主讲导师的解答。第1期“五问五答”的问题与解答,均来自于光子算数CEO白冰主讲的《光子AI芯片架构创新与技术挑战》这场公开课,也是AI芯片设计系列课第一讲。

感谢清华大学光传感系统和光子神经网络博士研究生臧裕斌、中国电子工程设计院高级工程师沈洁、骨鱼科技CEO刘东峰、中兴通讯技术合作总监王建立、海康威视工程师郝扬的提问。

主讲导师

白冰

光子算数CEO

北京交通大学电子工程学院博士研究生,研究方向包括硅基光子集成器件、非线性光学材料、板卡级光电异构计算架构、光电混合神经网络模型等,参与承担多项国家自然科学基金项目,申请相关专利12项。

1

清华大学光传感系统和光子神经网络博士研究生臧裕斌:

1.从实现算法的复杂度、可重构性以及片上可训练的角度来说光神经网络目前都不是电神经网络的对手,那么做光神经网络的意义和优势何在呢?

2.除了用光子器件结构拟构NN的运算结构,现在这一领域水库计算算法也做的较为火热,不知演讲者对这一领域持何种看法?光AI芯片的未来是属于前者还是后者?此外,光AI结构一定要集成于芯片之上吗?

白冰博士:(1)目前光神经网络仅用于云端推理,追求的是低功耗,并不做训练。同时它有很高的可重构性,与FPGA进行异构处理时,是用FPGA在对非线性计算和网络结构上进行分可重构,光的部分是由很多个小矩阵阵列组成,可进行灵活的矩阵配置。

(2) 需要介绍一下水库计算。水库计算又称储备池计算,用于解决循环神经网络。传统上我们用光完成的是前传矩阵的部分,而循环的网络结构是通过电的控制实现的。但在本质上,如果能在全光内完成循环计算将会取得更好的效果。

目前我们对储备池计算也有一定的研究。储备池计算是一个用光作环路,并把得到的数据与之后做的数据进行光脉冲交叠来完成计算,等于用光来充当缓存的过程。

另外,储备池计算在通信中非常重要,可以用于进行传输计算一体化(传算一体)。具体来说,以前光纤通过收发芯片连接到基站上,把光信号通过接收芯片转化成电信号传给基站,再用基站中的DSP处理器进行后续信号的分析和处理;

而现在的方案是,我们将光学计算芯片加到光纤与接收芯片之间(与接收芯片集成在一起),这就相当于把计算域往前移,把本应该在基站内部电域处理的矩阵(如傅里叶变换)放到光域来完成。这样一来,就能直接将从远距离光纤(如上海到北京)来的信号在光学计算芯片上进行变换处理,完成了一部分的计算工作。

光本身是无源、低功耗、高速度的,其本身也没有电光转换的过程,因此这样处理后,再把它给接收芯片转化成电信号,在这个阶段中,DSP内只需要完成一小部分后续处理即可。这是属于储备池计算的一个主要应用,同时它是面向时序的,对直接接受这种光信号的场景也会非常好。我们把这叫做“传算一体”。

2

中国电子工程设计院高级工程师沈洁

1.硅光子芯片与波导模式有关吗?

2.在AI神经网络计算中,硅光子集成度能达到多少,集成度与电子芯片有优势吗?

3.是否涉及光子的量子效应、非线性效应的影响,如何克服这些影响?

白冰博士:(1)是有关的,目前我们也正使用基模进行计算,但后期会有高阶模,例如在实现全加器时会涉及到一些高阶模。

(2)事实上,硅光子的集成度与电子芯片的集成度是无法直接比较,而要比的应该是单位功耗里所提供的算力及单位成本。由于硅光子本身是无源计算,具备低功耗、加工制程低、价格便宜等特点,从这些方面来说是具有优势的,这也是我们一般评估的指标。

(3)首先,硅光子芯片并不涉及量子效应,已经落地的方案,是用已有的光通信基本单元去拼系统,而在波长和其他方面都不会进行如此调整,这样的目的是让它快速落地,将优化放在之后。

其次对于非线性效应,目前我们在进行相关的工作,比如硅基微环,利用泵浦光去做激活,相当于把一部分非线性也用光来处理。再比如PD(光电二极管),其本身是一个光电转换器,在一些区间也是非线性的,同样也可以用来作为激活函数。

3

骨鱼科技CEO刘东峰:

1.光子芯片最基本的运算单元是什么?传统半导体芯片,是与或非门,光子芯片,是不是也需要构成这样的门电路,或者说波导?

2. 对于光子芯片的设计,与传统半导体芯片的设计,有什么不同?

3. 光线折射和衍射,会有损耗,光子芯片如何解决这个问题?

白冰博士:(1)基本单元例如有MZ干涉仪、分束器、波分复用器、模式转换器等,都是传统光通信芯片里面用的器件,实际上通过通讯的方法来映射它的计算过程。

(2)与传统半导体芯片设计相比不同的是,在设计上它是一个模拟器件,而对于目前的模拟器件而言,除了用PDK,有些部分是需要进行凭借经验的手绘。

(3)对于折射和衍射损耗来说,评估到整体上的损耗在2到4dB/cm,但对于片上系统来说这并不是很重要的问题。

4

中兴通讯技术合作总监王建立:

1.光子AI芯片目前能达到多少算力?功耗与传统芯片相比,能改进多少?

2.当前光子AI芯片产业化的瓶颈在哪儿?

白冰博士:(1)实际上,目前光子AI芯片的算力是与FPGA进行对比的,在云端上以同样的算力基本上可以达到三到四分之一的功耗,这样可以替代一些高端的FPGA芯片。

(2)对于光子AI芯片产业化的瓶颈,我们认为这是一个工具链的问题,当光子AI芯片与FPGA进行异构时,其控制部分完全是在FPGA内完成,我们可以通过调度FPGA来调度光子AI芯片,它与FPGA一样,面临着工具链的问题。

与GPU相比,它的性能和功耗都有比较明显的优势,但目前需要按照项目去推进,比如在进行项目迁移时,需要的是底层的编程人员,而这方面的人才却是非常难找的,这也是光子AI芯片产业化存在的瓶颈所在。在之后具有足够的资金后,我们会开发AI层面的工具链。

5

海康威视工程师郝扬

光电异构计算用宽度替代深度,这样是否足够?

白冰博士:我们现有的光电混合板卡是面向现有的一些算法,主要都是一些深度网络。对网络结构来说,层数足够多和层宽度很大效果是一样的,但是后者对于并行线性计算要求会更高,这跟光计算的物理过程匹配。

另外,非线性计算可以由线性计算在局部做近似拟合,这样可以进一步减少光计算器件无法加速的非线性部分。