智能手机导入专用的神经网络引擎

随着人工智能(AI)需求的增加,芯片制造商正在努力生产更强大和高效的处理器。他们的目标是采用更好、更便宜的解决方案,以适应神经网络的需求,同时保证足够的灵活性来满足算法的演进。在Hotchips 2017会议上,发布了许多新的深度学习和人工智能技术,其中既有业内领先的科技公司,也不乏初露头角的初创公司。

By Yair Siegel,CEVA细分市场总监

01 人工智能的未来是移动设备

Hotchips会议提出了一些很酷的东西,比如深入分析了谷歌第二代矢量处理单元(TPU v2),它被开发出来执行高效的神经网络训练。同时微软也展出了“脑电波(Project Brainwave)”项目,这是一个“软”FPGA深层神经网络处理单元(DNN)。这些解决方案都是针对繁重的数据中心,执行基于云的AI处理,但是……

虽然数据中心很重要,但人工智能最有趣的应用场景还是移动设备。因为不是所有的移动场景都可以依赖于云计算,一些AI处理需要在设备上运行,或者边缘处理。类似于虚拟现实应用面临一系列的移动挑战,人工智能也必须解除禁锢,发挥其全部潜力。在本专栏的其余部分我们会探讨一些实例,清楚地表明人工智能的未来是移动设备。

02 智能手机拍照技术突飞猛进

去年我预测智能手机拍照的未来将会是结合双摄像头和深度学习生成增强的图像。现在三星将它落实了,意识到双摄像头比单个更强,所以可以肯定地说我的预言实现了。三星最新发布的Galaxy Note 8旗舰机是三星第一款采用后置双摄的智能手机。而另一种智能手机上的体现是采用前置双摄像头,以最大限度地提高自拍的质量,比如两个新的华硕Zenfone型号。华硕刚刚发布的的六个新款机型中有五个配备了前置或后置双摄像头。

 

智能手机摄像头在质量和效果上取得了巨大的进步,但仍有很多可以改进的地方。结合人工智能比如人脸识别和跟踪技术,同时采用先进照相功能比如自动对焦将会产生惊人的定制化效果。例如你可以让相机自动识别自己的孩子们,拍照时随时自动对焦他们。另外,同样的技术可以在照片中自动删除非家庭成员。再加上采用虚化效果模糊背景,每次都可以捕捉到令人惊叹的照片。这样一来真的重新定义了“傻瓜相机”的概念!

所有这些智能处理必须在设备上进行。除了隐私问题,还有捕捉稍纵即逝的时刻所需的拍照速度,使其难以在云端实现。这意味着智能手机拍照时必须能够有效地执行深度学习的任务,同时不消耗电池的电量。

03 语音接口将智能地进行边缘分析

随着虚拟语音助手的出现,语音接口已经普及起来。智能音箱和智能手机一样,大部分的语音分析是在云端执行的。所以同样面临很多问题,比如隐私和延迟等等,甚至有些是可以离线处理的简单事情。随着虚拟助手功能的改善和变得无处不在,用户越来越习惯于使用自己的声音作为主要交互接口。执行边缘处理允许本地实现一些功能,同时避免云处理的所有问题,打造了一个无缝对接而且方便的用户接口。

04 深度学习同样驱动增强现实

人工智能也是增强现实(AR)的核心功能。风靡全球的手机游戏《精灵宝可梦GO》(Pokemon GO)证明了AR的理想场景是运行在手机上,任何人可以在任何地方使用它。但是它还必须高效运行,以便设备仍然可以用于其他事情,比如——我不知道——打电话吗?自从《精灵宝可梦GO》首次面市以来,增强现实技术得以改善,用户开始期待能有更多更好的应用程序发布出来。

在今年早些时候的苹果全球开发者大会(WWDC)上,他们宣布了AR开发工具包,ARKit。它可以在所有运行iOS 11(系统将会在今年发布)的设备上使用。同时,谷歌抢先发布了类似的增强现实平台,ARCore,可以运行在Android上。和project tango不同(tango所需的硬件不是每个电话都具有),ARCore是一个可以在任何Android智能手机上运行的平台,它将有可能成为世界上最大的AR技术平台。

最近在德国柏林举行的2017年国际消费电子展(IFA)上,华为宣布他们的新旗舰处理器将包括神经处理单元,加速人工智能计算。我认为这是一个安全的赌注,其他公司将会随之效仿。我们可能不会看到一个手机版的TPU出现在即将发布的Google Pixel 2中,但是我相信未来几年内,谷歌、三星和其他厂商将在他们的智能手机中内置一个专用的深度学习引擎,并利用这些引擎实现许多新的热点应用。

例如未来可能会出现这样的对话:

用户:“OK Camera,正在过马路的人身上的衣服上写了些什么?”

相机:“这是一件NBA勇士队的球衣。它是最后一个AI-free年——2020年的冠军。”

用户:“这是什么意思?”

相机:“这是没有AI辅助投篮的最后一年,现在投篮命中率平均增加了18.5%”……

2018年1月9-12日 拉斯维加斯