探讨机器视觉中球面CNNs的重要性


  深度学习中的技术进展帮助机器能像人类一样世界,这是人工智能研究中最具吸引力的部分之一。目前,一种突破性技术将让机器能够通过被称为球面卷积神经网络(sphericalConvolutionalNeuralNetworks,缩写CNNs)的处理,去看到并识别三维空间中的物体。从识别极小分子的机器到分析外太空最庞大结构的工具,我们对这项新发现的能力所能实现的种种可能的想象才刚刚开始。当然,这其中还包括了许多介乎两者之间的用例,比如指导机器人在人群中安全导航。

  球面CNNs为什么重要

  为了理解球面CNNs的重要性,我们介绍一些背景:过去几年,深度学习——尤其是CNNs——已彻底变革了AI,语音识别、视觉对象识别、自然语言处理及其他领域均出现突破性成果。CNNs很擅长分析线性信号,例如音频或文本、图像、或视频,因其具备可识别模式的内在能力,而不管其空间或时间位置如何。这能支持CNNs学习并识别如视觉对象,无论它在图像中位于什么位置,并无需在深度学习模型训练阶段观看同一对象的多个移动版本。但在最近受到关注的多个应用中,我们都希望学习的信号留存在球体上,如汽车、无人机和其他机器人拍摄其整个周边环境的球面图像所使用的全向摄像头。在科学应用中也存在大量球面信号,从地球科学到天体物理学都有相关案例。

  分析此类球面信号的一个方法是把信号投影到平面上,并借助CNN来分析结果。但根据制图学,任何此类地图投影都会导致扭曲失真,让部分区域看起来比实际尺寸更大或更小。这会使CNN变得无效,因为随着对象在球体上移动,它们看上去不仅只是在地图上移动,而且还会显得缩小和拉伸。

  如何使用球面CNNs

  球面CNNs在物联网(IoT)、机器人、自动驾驶汽车、增强现实(AR)和虚拟现实(VR)领域都有诸多应用。如今,自动驾驶无人机已向消费者出售,或许有一天它将能在几分钟内把包裹送到你的家门口,这就是球面CNNs可改善物体侦测与识别,以及视觉运动分析的一个自然应用。在AR方面,一整组摄像头所拍摄的360度房间全景可融入至单球面图像中,借助球面CNN的高效分析,精确覆盖虚拟物体。

  来源:中国传动网

 


快速链接

展商精选

nepconchina

我们使用cookies来运作该网站, 并改进其可用性。 关于我们使用的cookies、 如何使用和您如何管理它们的详细信息可通过阅读隐私声明获取。 请注意使用本网站意味着您同意使用cookies.