搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

CMU博士造出像素级自动对焦相机,开辟成像新范式

2025-12-26 06:58:08
来源:

猫眼电影

作者:

邓艳梅

手机查看

  猫眼电影记者 肖恩康纳莱 报道首次登录送91元红包

未来,相机或可彻底告别模糊照片!

无论是拍照、显微成像,还是自动驾驶摄像头,大多数成像系统数百年来受限于同一个物理规则:

一片透镜,在同一时刻,只能形成一个统一的焦平面。

这意味着相机必须在大光圈、景深、分辨率之间不断妥协——景深可以扩大,但代价是亮度下降、衍射变糊。长久以来,这条规则定义了相机的结构,也限制了相机的能力。

近日,来自美国卡内基梅隆大学 CMU 的一项研究彻底突破了这一规则。研究团队提出了一个全新的成像范式:Spatially-Varying Autofocus 空间可变自动对焦。该成果获得 ICCV2025 最佳论文荣誉提名奖。论文一作 CMU 博士生秦颖思向 DeepTech 介绍道:

“我们构建了首个能够在单次曝光中,实现像素区域级自动对焦的成像系统。”

图 | 秦颖思(来源:https://yingsiqin.github.io/)

这项技术让相机第一次摆脱“只有一个焦平面”的限制——把对焦从一个平面升级为可自由编程、可随场景变化的焦曲面。

图|空间可变自动对焦(来源:https://imaging.cs.cmu.edu/svaf)

具体来说,它能做到哪些过去相机做不到的?

它可以让相机在任何复杂、起伏剧烈的三维场景中做到真正的“全场景清晰”。无论深度多么不规则,相机都能在一次曝光中让各区域自动对到正确的位置,让对焦成为一个可编程的维度,不再受光圈与景深的物理限制,可以自由、直观地交互调控。

(来源:https://imaging.cs.cmu.edu/svaf)

它可以让相机“看穿”前景的小遮挡。比如,拍人像时,如果前面有铁丝网、树枝,传统相机会把它们拍进去。而新系统可以让这些遮挡在光学上直接变得极其模糊甚至不可见,只聚焦在主体与背景。

(来源:https://imaging.cs.cmu.edu/svaf)

它可以让你进行创意虚化。告诉相机“让凯旋门和远方楼群清晰对焦,其他地方都要模糊”,相机就能直接拍出这种效果,无需任何后期处理。

(来源:https://imaging.cs.cmu.edu/svaf)

核心突破来自光学与算法的共同创新

秦颖思告诉 DeepTech:“这一系统级突破由两大核心创新共同支撑:在光学硬件层面,我们实现了首个可对不同传感器像素赋予不同焦距的可编程光学结构。在算法层面,我们同样首次提出了能够驱动不同图像区域进行独立自动对焦的算法框架。”

正是这两项各自具备首创性的硬件与算法的结合,才产生了这个首个具备像素区域级独立自动对焦能力的成像系统,而“自动”这一关键特性,正是由上述算法所驱动的。

图|原型机(来源:https://imaging.cs.cmu.edu/svaf)

总的来说,这一成果让相机拥有了任意控制不同图像区域的对焦距离的能力,首次实现了一种能让相机不同像素同时对焦在不同深度上的成像系统。

(来源:https://imaging.cs.cmu.edu/svaf/static/pdfs/Spatiall

它成功地将焦平面拓展为可自由编程的焦曲面,能够根据场景的实际深度分布,动态调整并让光学系统直接适配不同区域的焦距,从而在保持大光圈和高通光量的前提下,一次性光学捕获整个场景都清晰的高分辨率图像,无需依赖后期合成。

给相机的每个像素装上专属“智能眼镜”

秦颖思表示,本次这项空间可变自动对焦的研究,是光学与算法上的综合提升,而其核心的光学技术创新其实源自她之前在 VR 显示的一项研究工作:Split-Lohmann 多焦面 3D 显示技术。

在显示领域,一个场景的 RGB-D 信息(即颜色与深度)是已知的,显示的目标是输出信息,将场景的不同像素光学聚焦到不同深度,最终呈现到人眼中。

而同样的光学创新也可以应用于成像系统,只不过方向相反,即从“输出信息”转变为“输入信息”,也就是要捕捉现实世界的信息。

研究团队利用光路可逆这一概念,将显示技术中的光学突破,应用到成像系统中。于是,一个新型成像系统诞生了。

此次研发的核心光学结构名为“Split-Lohmann 计算透镜”——它打破了传统镜头只能产生单一焦平面的限制,把焦距变成可像素区域级控制的维度。这个结构的核心是两个特殊的镜片即立方相位板,以及一块名为空间光调制器(SLM,Spatial Light Modulator)的“智能画布”。

当两面特殊镜片以特定方式组合时,它们的功能就相当于一个焦距可变的透镜。而“智能画布”能够通过编程,精确地控制它穿过不同区域的光线的聚焦。

在这套系统中,相机传感器的每一个像素点,都能对应到“智能画布”上的一个特定区域。通过编程可以对画布不同区域施加不同的影响。这就等于给相机的每一个像素点都配了一副独一无二的“眼镜”。

假如你要给朋友拍摄一张他站在樱花树下的照片,使用这一相机时等于给靠近你朋友的像素点戴上了“看近处”的眼镜,而拍摄远处花朵的像素点则戴上了“看远方”的眼镜。通过此相机实现了空间变焦,即在同一张照片里不同地方的焦点可以完全不同。

图|光学系统(来源:https://imaging.cs.cmu.edu/svaf)

相机如何学会对焦?

只有可以空间变焦的智能透镜是远远不够的,相机还得知道照片里的每个东西到底距离它有多远,只有这样才能给对应的像素分配合适的眼镜。就像人类的眼睛需要先判断物体的远近,大脑才能指挥眼球肌肉进行对焦一样。为此,秦颖思给这台相机设计了两种自动对焦算法。

第一种算法是对比度探测法(CDAF),它可以让相机边试边找。这种方法有点像我们在黑暗中摸索开关。具体来说,相机会首先在整个焦距范围内拍摄三张略有不同对焦深度的照片。然后,它会分析照片中每个小区域的对比度也就是颜色和明暗的反差,而对比度最高的位置往往对应最佳对焦深度。

随后,相机会把搜索范围减半,再在更小的范围内试拍并比较新一组图像。通过这样逐步收缩范围、每次拍摄三张左右的方式,相机可以在极少的试拍次数内迅速收敛到最佳对焦深度,而不需要像传统方法那样做全面穷举式扫描,最终为每个小区域找到那个能让它变得最清晰的对焦深度。

图|CDAF 介绍(来源:https://imaging.cs.cmu.edu/svaf)

第二种算法是相位探测法(PDAF),能为相机带来一眼看穿的能力。这个方法需要一种双像素传感器,这种传感器的每个像素点(微透镜)下面都有两个眼睛(光电二极管),能够同时捕捉到略有视差的两个图像。当物体清晰对焦的时候,这两个图像是完美重合的。

如果物体模糊了,这两个图像就会错开。通过计算错开的距离和方向,相机就能判断出物体距离和对焦距离之间差了多少,从而瞬间自动对焦。

图|PDAF 介绍(来源:https://imaging.cs.cmu.edu/svaf)

秦颖思表示:“这两种方法的根本任务都是精确计算场景深度,它们与 AI 或主动感知等方法并非互斥,未来完全可以相互结合、互补,以进一步提升结果的精度、物理可靠性和鲁棒性。”

实时全场景动态对焦成为可能

值得强调的是,这并非停留在静态场景上的成像系统,研究团队的相位探测法原型机已经实现了 21FPS 的实时全场景动态对焦。

(来源:https://imaging.cs.cmu.edu/svaf)

或将创业进行产品孵化

据秦颖思介绍,在那些需要对整个场景清晰成像和信息获取的领域,本次技术将发挥至关重要的作用。

一个典型的应用是自动驾驶。在自动驾驶中,我们需要实时感知周围环境的所有动态。大家都不希望因为一个行人从车前走过,相机的自动对焦发生改变,导致模糊忽略了远方正快速驶来的车辆。

自动驾驶需要确保环境感知的全面性和连续性。传统自动对焦难以实现这一点,常在两者之间来回切换,导致延迟。而本次成果全场景聚焦技术正好可以满足这一需求,避免对焦延迟可能带来的风险。

另一个重要应用是显微成像,实现一次性看清厚样本。对于具有厚度的组织样本,传统显微镜必须逐层扫描再后期合成。而这台相机可以让整个厚样本同时变得清晰,为观察动态样本、实时监测生物过程提供可能。

此外,在监控安防领域,对于监控摄像头而言全面掌握整个场景的清晰细节和信息是核心需求,本次系统能够确保画面中的所有区域始终聚焦,满足安防对信息完整性的高要求。

最后,在医疗成像和机器人远程手术中,医生通过远程操控机器人进行精密操作时,对视觉反馈的清晰度和准确性要求极高。本次相机则能提供实时全场精准对焦的画面,为手术的“稳”与“准”提供关键的技术支持。

秦颖思表示,团队已围绕核心技术布局全球专利,美国专利正在申请中。她说:“随着工程推进,我相信这项技术会自然进入那些需要高可靠视觉的应用场景,成为下一代视觉系统的底层能力。同时,应用层面的反馈与需求也能反过来驱动科研,持续提升性能。我期待在未来推动这项技术成为产品落地,改善和提升大家的生活。”

参考资料:

研究论文:Spatially-Varing Autofocus

论文地址:https://imaging.cs.cmu.edu/svaf/static/pdfs/Spatially_Varying_Autofocus.pdf

项目网站:https://imaging.cs.cmu.edu/svaf/

作者网站:https://yingsiqin.github.io/

演讲视频:https://www.youtube.com/watch?v=kbIFbTkv1l0

运营/排版:何晨龙

 时事1:澳门手机银河

  12月26日,中央经济工作会议:把常态化帮扶纳入乡村振兴战略统筹实施,克瑞尼什旗下另一只投资中国内地科技股的交易所交易基金,今年同样实现规模增长。其持仓涵盖寒武纪、澜起科技以及中微公司等芯片制造商。,澳门九五至尊网上。

  12月26日,安永报告:中国在扩大可再生能源规模与绿色技术创新中展现大国担当,他在谈及激烈的中美科技博弈时称:“这种赛道竞争的紧迫感,反而为相关企业带来了发展红利。”,优博app平台,欧宝登录地址,MG真人快速登陆。

 时事2:金沙视讯中心

  12月26日,长春各界悼念南京大屠杀死难同胞与抗战英烈,5月4日,游客在福州连江县晓沃镇的一处海滩游玩,踩进了村民的蛏田。网传游客被村民“索赔”3万元,引起广泛热议。,365体育亚洲官方入口,最大赌场网址是多少,乐竞体育官网登录。

  12月26日,用好税收优惠,提前规划养老——盛世优享红26助您“节税养老”双赢,中国与中亚五国的友好交往源远流长,古丝绸之路上留下了张骞出使西域等交流融合的佳话。中亚五国脱离苏联独立后,中国是最早承认其独立并与之建交的国家之一。,1分钟一期彩票下载,OD官方下载,bet亚洲官网手机版。

 时事3:世爵娱乐

  12月26日,残特奥会即将开幕,这些观赛礼仪你知道吗?,据The Drive网站“战区”栏目5月10日报道,私营太空服务公司LeoLabs表示,其数据显示,中国一架可重复使用试验航天器在最近长达276天的轨道飞行中展示了良好的太空机动性能,该航天器在轨期间多次与一个单独的轨道物体对接或以其他方式捕获一个物体。具有这种能力的高机动性太空飞行器可用于检索或以其他方式与己方航天器进行互动,或监视,破坏和直接攻击对手的天基资产。,买球网平台注册,世界杯买球疟bs18·me棘,网赌真人ag国际厅。

  12月26日,华为新款手机开售 有款式溢价超千元,2025年12月17日,中国证监会一纸《行政处罚决定书》震动资本市场——江苏诺泰澳赛诺生物制药股份有限公司(以下简称“诺泰生物”)因在2021年年度报告中虚增营业收入3000万元、虚增利润总额2595.16万元,并在2023年公开发行可转债文件中编造重大虚假内容,被处以合计4740万元罚款;公司实际控制人及多名高管合计被罚2880万元,总罚金高达7620万元。,bti体育外围投注,2026世界杯投注宝典,森林舞会网页版。

 时事4:亚星体育平台

  12月26日,中国教育部要求减少中小学日常考试测试频次,佛山拥有全球最大的泛家居和建材产业链集群制造基地,陶瓷、酱油、电风扇、微波炉、消毒柜、铝型材产量世界第一。鲜明的产业底色,撑起了佛山3万亿元的工业规模。但在遭遇外部环境影响时,佛山新兴产业又尚未形成气候。,皇冠信用网,最新体球网即时比分,必发网址是多少。

  12月26日,北京:“兽首迎新 海晏河清——圆明园文化艺术展”开幕,相比于总资产持续扩张,净资产则处于波动状态。2012年受增资影响出现大幅上涨至27.92亿元后,随后一直处于波动。净资产最高值为2021年43.98亿元。今年三季度为36.76亿元,超过2023年与2024年的净资产规模。,beplay2体育,m88官网,世界杯买球as83·me权威。

责编:靳钰泽

审核:吴礼鹏

责编:别克昂克拉

相关推荐 换一换