银瓶春奶酥 小米斩获 CVPR 2026 NTIRE 赛事三项奖项,影像算法获得本领阻拦

IT之家 5 月 19 日音信银瓶春奶酥,小米本领官方告示,近日,小米在 CVPR 2026 NTIRE 赛事中获三项奖项。其中,小米玄戒多媒体算法团队夺得高效超别离率赛谈冠军,小米大模子利用团队获东谈主像建树赛谈冠军与反光摒除赛谈亚军。

IT之家注:NTIRE(New Trends in Image Restoration and Enhancement)由 CVPR 组委会经办,是民众规模最大、水平最高的图像复原与增强规模学术酌量会。
据小米本领先容,在 NTIRE 高效超别离率挑战赛的最终评估中,小米玄戒多媒体算法团队依托在芯片多媒体影像算法规模的软硬交融标的辘集,延续了上一届冠军决议 SPAN 本明白线,提议了全新一代门径 SPANV2,并以概述得分 4.43 位列第一,在推理速率、计较量、参数规模之间获得了举座平衡。

与上一代 SPAN 比拟,SPANV2 的更动集合在两处:一是让汇聚在建树图像时不再套用一种固定计谋处置全图,而是能笔据画面本体自妥贴判断那处需要精修、以什么阵势精修;二是把 GPU 在贯注力计较华夏本需要三次读写显存的设施吞并为一次完成,省下了大宗重叠的数据搬运支拨。两点叠加,使模子在画质险些无损的前提下,推理速率再次被提高。

在东谈主像建树赛谈上,小米大模子利用团队提议了双阶段级联框架 + 单步扩散细化的本领决议,从民众参赛队伍中脱颖而出,获第又名(Team name: MiPlusCV),在无参考图像质料与身份一致性概述评测中全面越过。

小米官方暗示,精品人妻一区二区三区浪潮在线着实天下中的老相片、笼统、压缩毁伤、噪声和低别离率赓续属于复合退化,若径直一步生成,容易出现结构漂移、东谈主脸失真以至身份变化。为此,团队接纳了更安妥的双阶段蓄意:
此外,小米团队还引入了单步扩散细节增强机制(One-step Diffusion),将复杂的多步推理压缩至单步完成,在保证生成质料的同期提高推理后果。
临了是反光摒除赛谈,小米大模子利用团队基于 RDNet-XL 架构,通过主干汇聚升级、扩散模子学问蒸馏与渐进式多别离率老成计谋,在 CVPR 2026 主不雅评分中荣获第二名(4.31 分),同期多项客不雅主义位列第一。

团队的本明白线特出明晰:以遍及的主干汇聚为基础,用扩散模子学问蒸馏攻克艰难样本,通过渐进式老成肃穆优化进程。
决议基于 XReflection 框架中的 RDNet(Reversible Decoupling Network)架构,将原始主干从 FocalNet-L 替换为更大规模的 FocalNet-XL。这一升级带来了显耀的多表率表征才调提高和全局崎岖文建模增强,使模子简略更精准地扼制反射并保留细节。

针对强反射、复杂反射等艰难样本,团队变嫌性地引入了扩散模子学问蒸馏计谋:
此外,为了在大别离率图像上兑现肃穆老成,团队还接纳了三阶段渐进式别离率老成计谋(384×384 → 512×512 → 768×768)。这种从小到大的老成阵势,使模子先学习局部反射模式银瓶春奶酥,再逐渐膨胀至全局结构意会,幸免了径直在大别离率上老成的不肃穆性。
IT之家附本领敷陈如下: ]article_adlist--> 声明:新浪网独家稿件,未经授权拦截转载。 -->
