您现在的位置是:首页 >生活 > 2021-04-24 17:41:38 来源:
配上AI的手机所拍出来的照片真的能和单眼相机一较长短吗
目前,出现在新一代智慧型手机上的3D感应器,只是机器学习所引发的摄影技术浪潮的冰山一角,该类技术将不仅仅修正智慧型手机照片的缺点,还将为摄影带来一些令人惊叹的新元素。
摄影在智慧型手机时代已经发生了改变,不仅拍摄姿势不同(比如自拍),手机镜头捕捉光线的整个过程也变得完全不一样了。镜头不再只是一个透镜和感应器,它们还整合了一组演算法,这些演算法可以立即处理图像,瞬间就能获得PC软体耗费数小时才能实现的照片效果,摄影已然成为运算领域的一门学问。
人工智慧机器学习形式持续不断的进步将会带来更多的功能,让今天的智慧型手机照片变得过时。
外媒认为,体现当今手机的尖端摄影技术的最新例子包括:Alphabet子公司Goolge的Pixel 3智慧型手机照片,以及Apple iPhone X的照片。在Pixel 3上,Goolge使用机器学习在低光照条件下捕捉更多的细节,使得夜景看起来像白天。这些根本不是自然界中曾经存在过的镜头,它们完全是超解析度的图片。
从2017年推出iPhone X开始,Apple公司添加了「bokeh」,巧妙地模糊了焦点之外的元素,这并不是像传统摄影那样透过镜头本身的某些方面来实现的,而是透过在捕捉到图像后对像素进行运算调整来实现的。
我们预测,2019年和2020年的突破性发展很有可能是透过操控图像的视角来改善,希望这能修正智慧型手机摄影中固有的失真问题,这些失真使得智慧型手机在数位单眼(DSLR)相机照片面前相形见绌。
事实上,它们可以达到类似于「移轴」相机的效果。在移轴相机中,镜头所成的角度可弥补一个人站在相机前的角度,进而修正由于个人与场景之间的角度造成的图像失真。单眼相机使用者可以在由不同的供应商提供的各种可拆卸镜头中实现移轴功能。
一般的手机镜头都有一个非常小的透镜镜筒,因此它所捕捉到的一切东西都是扭曲的。在现实世界中,没有什麽形状是恰到好处的。大多数人可能不会注意到,又或者可能不会在意,因为他们已经习惯了Instagram上的自拍。但如果能改善这些畸变就更好了。这一点能做到的话,那麽它将会是来自Goolge、Apple 等公司的下一轮智慧型手机主推的一个卖点。
iPhone和其它品牌的手机将越来越多地搭载带有3D感应器的后镜头。这些感应器由Lumentum Holdings和其他的晶片供应商等公司製造,透过发出光束并计算它们在物体反弹后如何返回手机,来测量手机周围环境的深度。「飞行时间」等技术可以让手机详细测量周围环境的3D结构。
那些感应器可以利用的是,近年来为瞭解2D图像和现实世界之间的关係而进行的大量统计工作。
人们做了大量的统计工作来实现移轴镜头那样的物理特性,不管是有特殊摄影装置的,还是没有特殊摄影装置的。例如,一项名为「随机抽样一致性」(RANSAC)的技术可以追溯到1981年,专门用于寻找3D世界中的地标,这些地标可以映射到2D图像平面上的点,以便瞭解2D图像与3D现实世界之间的关係。使用这种技术,可以更好地理解2D呈现是如何与现实世界相对应的。
2015年,佛罗伦斯大学的一组研究人员在RANSAC技术的基础上,透过对相机拍摄的照片进行逆向推理,推导出了一种泛倾斜变焦相机的结构,他们能够透过软体来分析相机位置的不同在什麽程度上引发了失真,进而有效地将控制相机的执行机构调至最佳状态,他们可以将这种技术用于影片,而不仅仅是用于静止的图像。
2017年,德国爱尔朗根-纽伦堡大学和伍兹霍尔海洋学研究所的研究人员展示了一个名为CameraTransform的Python库,该库可让人们通过对拍摄的图像进行逆向运算,来估算物体在现实世界中的真实尺寸。
去年,德国慕尼黑工业大学和佳能公司的研究人员表示,只需拍一张图片就可以推断出被另一个物体遮挡的场景中有什麽。这种技术被称为「分层深度图像」,可以透过从照片中移除一个物体来创建新的场景,呈现相机从未见过的背景,但这是透过图像运算实现的。该方法使用了许多神经网路应用中常见的编码-解码器方法来估计场景的深度,也使用了「生成对抗网路」(GAN)来构造场景中在拍摄照片时从未实际出现在视野裡的部分。
所有的这些研究正在不断涌现,并将在下一代配备3D感应器的智慧型手机镜头上达到高潮,带来一些不可思议的功能特性。这种研究应该会带来令人惊叹的成果。至少,人们可以想像,用智慧型手机拍摄出的人像不再会出现怪异的面部扭曲。超解析度的建筑图片将有可能透过消除镜头上的所有扭曲而形成平行线。随著手机变得能够大量产生精确度和逼真度皆十分惊人的照片,智慧型手机行业将能够在与单眼相机的交锋中取得又一场胜利。
但是,智慧型手机摄影的长期趋势当然是远离现实主义,而转向取得更引人注目的效果。这在计算摄影诞生之前是无法想像的。因此,我们可能会看到3D传感技术的应用趋向于超现实主义。
举例来说,移轴相机可以用来创造一些出奇漂亮的效果,比如缩小景深到一个极端的程度,这会使得风景看起来就像玩具模型,但效果还是出奇的好,有些手机应用程式也能做到类似的事情,但将3D感应器与人工智慧技术结合起来的效果,将远远超出那些应用程式所能达到的效果,Photoshop中有实现移轴的技术,但是每次按下快门按钮,相机都会产生同样的效果,毫无疑问会让人更加心满意足。
光靠人工智慧可行吗?
未来,在推进机器学习技术方面,会有另一个重要的阶段。我们有可能会放弃使用3D感应器,而仅仅使用卷积神经网路(CNN)来推断物体在空间中的坐标,这将节省在手机中安装感应器的费用。
然而,就像微软的研究人员和学术合作者在本週发表的一份报告中所讨论的那样,目前这种只使用软体的方法收效甚微。他们写道,只使用软体的方法被称为「绝对姿态回归」(absolute pose regression),在经过训练后它并未能推而广之,这意味著无论卷积神经网路掌握了什麽技术,在用新图像进行测试时,它都无法准确估量几何图形。
该报告的作者认为,他们的研究是对纯软体方法的「一项重要的合理性检查」。他们的结论是,「姿态回归方法要变得切实可行,还长路漫漫。」
这项工作将如何完成呢?不仅仅依靠研究人员。它将需要许许多多的智慧型手机使用者的参与。有了带有3D感应器的新型手机,他们将能够拍摄出令人印象深刻的3D感应增强图像。当他们这样做的时候,他们的设备,或者云端,将会跟踪现实世界的几何结构与2D图像之间的关係。
换句话说,它将利用所有的这些活动来持续进行学习,总有一天,只要有足够的3D图像,卷积神经网路或任何其它被使用的演算法都能足够聪明地观察这个世界,即使没有3D感应器帮助提供深度感知能力,也能准确地知道这个世界是什麽样的。