9 月 25 日上午,华为在北京召开了麒麟 970 的媒体沟通会,这也是麒麟 970 在国内的首次亮相。和本月初在德国 IFA 电子展的首秀相比,在这一次的国内沟通会上,华为公布了麒麟 970 更多的技术细节和具体应用。
作为一款为手机设计的系统级芯片(System On Chip,即 SoC),麒麟 970 自然包含了常规的手机 SoC 该有的部件,比如 CPU、GPU、ISP、DSP、通讯基带,但和同类产品相比,麒麟 970 又多了一个所有同类产品都没有的东西——一颗为人工智能运算专门设计的 NPU。
下面我们就 SoC 的各个部件出发,全面地了解一下麒麟 970。
CPU、GPU:重点是降功耗
CPU 方面,麒麟 970 的参数相比麒麟 960 基本没有任何变化,依然是 8 颗核心,其中 4 颗为高性能的 ARM 公版 A73 架构,最高主频 2.4GHz(麒麟 960 是 2.36GHz),4 颗位低功耗的 ARM 公版 A53 架构,最高主频 1.8GHz(麒麟 960 是 1.84GHz)。有些遗憾的是,麒麟 970 并没有用上 ARM 在今年 5 月发布的新一代 Cortex-A75、Cortex-A55 架构以及为 AI 相关运算优化的 DynamiIQ 设计(麒麟 970 选择了另一种方法来提高 AI 运算)。当然了,考虑到 A75 和 A55 的发布时间、设计的复杂程度,麒麟 970 没用上也是可以理解的。
华为表示,表示麒麟 970 的能耗比提升了 20%(主要得益于全新的 10 纳米制程),至于实际的性能表现,不出意外的话,麒麟 970 应该和麒麟 960 处于同一段位,不会有非常明显的提升。当然,横向来看的话,麒麟 970 的 CPU 性能没提升其实不是什么大问题。从 GeekBench 4 等跑分软件的得分上看,麒麟 960 的分数和高通骁龙 835、三星 Exynos 8895 基本处于同一水准,明显强于联发科 Helio X30。因此,即使麒麟 970 的 CPU 性能不变,也依然是 Android 阵营里移动 SoC 的顶级水准,只是不再像麒麟 960 发布时那么领先。
相比起 CPU 上的保守,麒麟 970 在 GPU 上的「诚意」要显得更足一些。
首先,麒麟 970 则用上了 ARM 在今年 5 月刚刚发布的 Mali-G72 架构,理论性能相比麒麟 960 上的 Mali-G71 有所提升(ARM 的官方说法是相比 G71 性能提高 20%,功耗比提升 25%)。此外,在核心数上,麒麟 970 的 GPU 也从麒麟 960 的 8 核增加到了 12 核。
华为表示,相比起麒麟 960,麒麟 970 的性能有 20% 的提升,并且能效比提升了 50%。照理说,由于麒麟 970 的 GPU 核心架构比麒麟 960 更先进,核心数还多了 50%,并且制程更先进,GPU 性能提升的幅度应该远不止 20%。之所以出现这种情况,很可能是华为将麒麟 970 的 GPU 主频压得比较低,从而更好地降低功耗(于是就有了提升幅度高达 50% 的能效比)。
实际的表现也印证了我们的猜测,根据现场的介绍,麒麟 970 的 Mali-G72 最高主频为 700MHz,相比麒麟 960 的 900MHz(部分场景下会飙到 1000MHz 左右)有明显的下降,这种「多核 + 低频」的策略让麒麟 970 在性能有一定提升的同时,功耗得以大幅度降低。
通讯基带:比「千兆 LTE」更快
作为一家通讯行业有着多年积累的公司,华为海思在通讯基带上有着深厚的「家底」,特别是去年的麒麟 960,直接在 SoC 中集成了支持 LTE Cat.12/13 的 Balong 750 基带(最大下行速度 600Mbps,上行 150Mbps),并且支持 CDMA 网络,丝毫不逊色同期的高通骁龙 820、821。
在麒麟 970 上,华为海思更进一步,直接大跨步到了下行 LTE Cat.18(上行最高 Cat.13),最高下载速度飙到了 1.2Gbps,也就是比之前业界最快、骁龙 835 和 Exynos 8895「千兆 LTE」还要再快上 200Mbps。
麒麟 970 还终于支持了在同时使用两张 SIM 卡时,主副卡同时用 4G(上一代麒麟 960 的副卡只能支持 3G),任意一张卡都可以使用 VoLTE 通话。此外,麒麟 970 还特别针对高铁时的使用做了优化,信号更稳定,减少掉线。
不过话还是要说回来,虽然麒麟 970 的通讯基带的确是厉害,但和骁龙 835、Exynos 8895 等支持千兆 LTE 的 SoC 一样,普通用户想要真正体验到这种超高速 LTE 网络,还得过上相当一段时间。
ISP、DSP、Codec、协处理器
ISP 的全称是 Image Signal Processor(图像信号处理器),主要功能是处理相机传感器中收集到的数据。
麒麟 970 的 ISP 主要是一些「常规升级」,依然是双核设计,拥有更快的速度,更快地对焦,更优秀的降噪效果,并且对运动图像的捕捉做了优化。另外,针对目前很火的人像拍摄,麒麟 970 的 ISP 进行针对性的优化,可以根据不同肤色、帽子、眼睛、口罩、遮挡、侧脸等多种复杂的人脸场景进行优化,改善了人像的拍照效果。
在 DSP、配套 Codec 等方面,麒麟 970 也有所提升,其中配套的音频 Codec 可以支持 32bit/384k 的音频解码,过去几代华为高端机(Mate、P 系列)上表现乏善可陈的内放音质,有望在麒麟 970 这代产品上获得明显的提升,当然前提是 Mate 10 和 P11 系列还能保留 3.5 毫米耳机插孔。
另外,麒麟 970 依然搭载了 i7 协处理器(和牙膏厂的 i7 没啥关系),而 inSE(integrated secure element)和 TEE 安全引擎,在麒麟 970 上也都在。
在总线架构上,不出意外的话,麒麟 970 采用的应该是和 960 相同的 CCI-550。
10 纳米制程,比骁龙 835 还多的 55 亿个晶体管
制程上,不出意外,麒麟 970 用上了台积电(TSMC)最新的 10 纳米工艺,这应该是继苹果 A10X、联发科 Helio X30 之后,第三款采用台积电 10 纳米制程的移动 SoC。
通常来说,在芯片晶体管数量相同的情况下,更先进的制程可以降低芯片的核心面积,有助于降低成本,并且更加有效地控制发热和功耗。根据华为提供的数据,台积电的 10 纳米制程可以降低 20% 的能耗,将芯片核心面积缩小 40%。
不过有趣的是,麒麟 970 的核心面积并没有因为制程的进步而缩小,反而比麒麟 960 还要略大,这是因为麒麟 970 集成了高达 55 亿个晶体管,比麒麟 960 多出了 15 亿。作为对比,苹果的 A11 Bionic 芯片有 43 亿个晶体管,高通骁龙 835 有 31 亿个。
需要说明的是,虽然晶体管数量对性能有一定的影响,并且通常是越多越好,但在内部部件众多的、各家产品架构甚至内部组件都不太一样(比如 A11 Bionic 没有集成通讯基带和专门的 NPU)的移动 SoC 中,我们是无法简单地用晶体管数量来判断性能的。
NPU:首款内置在手机 SoC 中的人工智能芯片
终于到了麒麟 970 最特别的部分——NPU。
NPU 的全称是 Neural-network Processing Unit,也就是神经网络处理单元。关于这颗 NPU 的功能,大家可以简单理解为专门高效地进行 AI 相关计算定制的处理器,就像 GPU 之于图形处理相关的计算,ISP 之于成像相关的计算。
传统的 CPU(包括 x86 和 ARM)和 GPU 也是可以用来做深度学习计算的,但由于它们本身并不是专门为深度学习定制的,效率并不高。而麒麟 970 的这颗 NPU 采用了来自寒武纪(Cambricon)的 IP,专门为深度学习而定制,FP16 性能达到了 1.92 TFLOP,差不多是麒麟 960 的 3 倍(0.6 TFLOP 左右)。
在月初德国柏林的发布会上,余承东展示了一张在进行 AI 运算时,NPU 和 CPU、GPU 的对比。
可以看到,性能上,NPU 是 CPU 的 25 倍,GPU 的 6.25 倍(25/4),能效比上,NPU 更是达到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。
在这个 NPU 的基础上,华为打造了 HiAI 移动计算架构,大致的原理是通过一个统一的资源管理器,充分调用 CPU、GPU、ISP、DSP、NPU 等部分,app 开发者可以通过使用这个架构,提高 app 中和 AI 相关的应用的处理效率(官方数据是 25 倍的性能,50 倍的能效优势)。
在现场的演示中,华为展示了在进行照片识别时,麒麟 970 相比其他旗舰机具备明显的优势。
根据华为提供的数据,在包括 NPU 在内的 HiAI 架构的加持下,麒麟 970 每分钟可以识别约 2000 张,iPhone 8 Plus 可以识别 889 张,iPhone 7 Plus 为 487 张,三星 Galaxy S8 只有 95 张(注:测试过程中,iPhone 应该是调用了 GPU,三星 S8 应该只是在用骁龙 835 的 CPU 在跑)。
除了单纯在术层面的「秀肌肉」,发布会上,华为还展示了麒麟 970 的 AI 能力在日常生活中的实际应用,具体有下面几个。
第一个功能叫做「慧眼」。麒麟 970 可以脱离网络限制,直接在本地对物体进行精确地识别,现场的展示中,华为把葡萄、苹果等物体摆在搭载麒麟 970 的原型机之前,手机可以准确地完成识别,并根据识别结果计算出对应的卡路里。
第二个是 AI 降噪。大致的原理是通过深度学习算法,从而更有效地过滤周围环境的噪音。这个功能最适合的使用场景之一就是在车内等嘈杂的环境中进行语音唤醒,华为表示,搭载麒麟 970 的手机(应该就是 Mate 10 和 Mate 10 Pro 了)在车载场景下的语音识别率可以从 80% 提升到 92%。
第三个功能是 AI 美颜。这个功能和之前美图在部分手机上的美颜技术类似,都是自动检测人脸并根据机内算法进行美颜,不过有了麒麟 970 相关的 AI 优化,可以把这个美颜过程做得更加快速和精确。
第四个功能是智能自动回复及情绪识别。麒麟 970 能够对文本的内容进行提取,并根据文本内容智能地进行回复和提醒,比如说聊天中输入文字「今天发工资了」,手机可以自动联想出开心的表情,输入「敦刻尔克」,手机可以自动推荐附近影院的观影信息。类似的功能华为在荣耀 Magic 上就已经尝试过,在麒麟 970 的硬件平台下,理论上可以做得更加快速和智能。
AI 加持的手机 SoC
对于喜欢折腾手机的用户来说,手机 SoC 的性能可能永远都没有「过剩」的那一天,不过对于更多的「普通用户」来说,随着过去几年里 SoC 整体性能的不断提升,新款 SoC 在性能上带来的体验加成正在变得越来越小。在 5G 时代到来之前,在移动 VR 和 AR 应用取得突破之前,这种情况很可能会一直持续下去。
在这个背景下,今年的各大芯片厂商纷纷把注意力投向了 AI。
除了额外增加一颗专门为 AI 相关运算定制的芯片(NPU)、让手机本身具备更好的 AI 处理能力的华为海思,苹果在 A11 Bionic(中文名为「A11 仿生」)上,也重点强调了「每秒运算次数最高可达 6000 亿次的神经网络引擎」。在这之前,今年 5 月,ARM 在发布新一代 CPU 架构 Cortex-A75 和 A55 时,重点强调了提高 AI 运算能力的 DynamIQ 设计。今年 7 月,高通开放了自家的神经处理引擎(Neural Processing Engine,NPE)的 SDK,帮助开发者使用骁龙 SoC 进行 AI 相关的运算。在 AI 席卷整个科技圈的浪潮中,以麒麟 970 为代表的手机 SoC 在 AI 上的探索只是一个开始。
当然,相比起这些技术和概念,用户更关心的可能是 AI 究竟能给智能手机体验带来多少变化,而对于麒麟 970 来说,我们需要等待的是即将在 10 月 16 日发布的华为 Mate 10 系列手机。