北京时间9月2日晚,华为在2017年德国柏林IFA 2017上发布华为首款人工智能(AI)芯片——麒麟970,这也是全球首款内置神经元网络单元(NPU)的智能芯片。
余承东透露,麒麟970将率先搭载在华为Mate 10上,Mate 10将于10月16日在德国慕尼黑发布,华为对德国也是爱得深刻。
其实早在IFA之前,关于华为将发布首款AI芯片的消息就不胫而走。余承东之前在朋友圈晒了一张图说自己会在IFA期间做一个主旨演讲,算是为发布麒麟970预热了。
麒麟970采用了台积电的10nm工艺制程,终于与高通、联发科看齐,高通骁龙835、联发科X30均采用了10nm工艺。
在近1cm²的面积内,麒麟970集成了55亿颗晶体管(骁龙835是31亿颗、苹果A10是33亿颗),内置了八核CPU,运用了Mali-G72MP12全新一代GPU以及全新升级自研ISP等。
麒麟970在核心配置上采用4*Cortex-A73+4*Cortex-A53的大小核设计,其中A73大核主频为2.4GHz,A53小核主频为1.8GHz。之所以使用的是ARM的Cortex-A73,而不是Cortex-A75,可能主要是基于成本的考量。
GPU为Mali-G72 MP12,在视频方面首次支持HDR10,支持4K@60fps视频解码,4K@30fps视频编码。相机双ISP,支持人工智能场景识别、人脸追焦、智能运动场景检测,夜拍效果得到加强。
基带方面,麒麟970支持Cat 18,最高下载速度达到1.2Gbps,它将搭载嵌入式安全引擎,支持TEE和inSE。
麒麟970最突出的特点就是首次集成NPU专用硬件处理单元,设计了HiAI移动计算架构,华为称其AI性能密度大幅优于CPU和GPU,“相较于四个Cortex-A73核心,在处理同样的AI应用任务时,新的异构计算架构拥有大约50倍能效和25倍性能优势。”
一个直观的感受是,在余承东演示的PPT中,在图像处理速度方面,麒麟970一分钟能处理2005张。同时,它也远超iPhone 7 Plus的487张/分钟、三星S8的95张。
有了NPU加持,当你举起手机拍照的时候,对焦速度更快,另外对照片美化的处理也可以同步进行,也就是说,你拍照结束,美化结束。
余承东在发布会结束后,发了一条朋友圈说:“那些所谓跑分软件,还无法支持NPU跑分计算,如果能够支持,那跑分根本不在一个量级上。NPU处理器AI处理性能比CPU高25倍,能效比高50%!”
根据外界猜测,麒麟970未来或许不仅仅用于手机,还可能用在自动驾驶、AR等领域,它可能把语音识别、自然语言处理和图像处理的API接口开放给第三方平台。
余承东在演讲中首次全面阐释了华为在AI方面的战略和理念:“未来的智慧终端想要不断的发展,相应的人工智能体系一定既要充分发挥终端自身的能力和价值,也要结合大数据和云技术带来的海量信息、服务和超强计算力,人工智能在未来终端上的实现必须通过端云协同,这也是我们当前战略布局的重点。”
余承东提出Mobile AI=On-Device AI + Cloud AI,他认为人工智能在未来终端上的实现必须通过端云协同,这样能有效解决实时、随时、稳定性和隐私方面的问题,实现端侧智能与云端智能的优势互补。
他表示,AI技术的核心是对海量数据进行处理,当前以CPU/GPU/DSP为核心的传统计算架构已经不能够适应AI时代对计算性能的海量需求。在手机端,由于具备随时性、实时性和隐私性等重要特点,AI本地处理能力就变得尤为重要,当前手机端的性能问题已经成为阻碍移动AI技术发展的最大掣肘。与服务器端AI设计不同的是,麒麟970选择了具有高能效的异构计算架构来大幅提升AI的算力,以应对与数据中心完全不同的挑战。
或许这也就部分解释了日前华为把Cloud BU提升至与三大BG并行的战略高度的用意了,通过自家的端侧先来验证可行性,通过不断优化提升华为在云计算方面的能力,最终从内部使用到外部推广。回到麒麟970身上,关于它的性能如何目前都还限于纸上谈兵,只有等到10月16日华为Mate 10发布后才能见真章。考虑到苹果将于9月12日发布iPhone 8,或许一个月后,余承东又要修改PPT,吊打iPhone 8了。(原标题:华为首款AI芯片麒麟970可每分钟处理2000张照片,是三星S8的20多倍)