<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
    <channel>
        <title>AWB - Tag - 花花世界</title>
        <link>https://shuweiyue.com/tags/awb/</link>
        <description>AWB - Tag - 花花世界</description>
        <generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Wed, 14 Jan 2026 00:00:00 &#43;0800</lastBuildDate><atom:link href="https://shuweiyue.com/tags/awb/" rel="self" type="application/rss+xml" /><item>
    <title>ISP论文解读：三星高饱和光源色彩校正（WACV 2026）</title>
    <link>https://shuweiyue.com/articles/0114-samsung-saturated-light-wacv2026/</link>
    <pubDate>Wed, 14 Jan 2026 00:00:00 &#43;0800</pubDate>
    <author>岳书威</author>
    <guid>https://shuweiyue.com/articles/0114-samsung-saturated-light-wacv2026/</guid>
    <description><![CDATA[<p style="font-size: 0.85em; color: #666; margin-bottom: 1.5em;">💡 微信公众号「ColorWorld花花世界」排版更佳，欢迎关注获取更好阅读体验</p>
<p>📖 阅读提示</p>
<ul>
<li>本文是专业解读，适合了解AWB/CCM的读者</li>
<li>关于CCM是啥，可以参考我7年前写的一篇文章（浏览器搜索：颜色校正矩阵（CCM）的算法设计)</li>
</ul>
<h3 id="前言">前言</h3>
<p>大多数 ISP 中的 AWB 估计，采用的是一套非常工程化的范式：先在多个典型色温（通常 6–8 个）下完成标定，再以这些光源为中心，在色度空间中划定经验区域，最后统计落入该区域内的白点，用于计算 AWB gain。</p>
<p>稍微先进一些的方案，会使用 DNN 来预测白点位置，但其本质并没有发生变化——仍然是在 <strong>传统统计框架之上做加权或回归</strong>，并未改变问题的建模方式。</p>
<p>这一范式会遇到一个corner case：
<strong>真实光源并不总是落在这些经验区域之内</strong>。就是所谓的 <em>off-the-planckian</em> 情况，比如，高饱和 LED 光源（i.e., 舞台灯光）。</p>
<p>此种情况下，一方面，AWB 估计会因为&quot;超出标定空间&quot;而产生明显误差；另一方面，这个误差会继续传递到 CCM 阶段，最终导致整体色彩还原出现系统性偏差。</p>
<p>本文的重点是 <strong>CCM 阶段本身的建模问题</strong>。
作者的motivation是：1. 传统 CCM 依赖 CCT 的1D插值，本身信息量不足；2. 也没有针对 <em>off-the-planckian</em> 光源进行任何显式建模。</p>
<p>因此，论文提出了一种 <strong>2D 建模CCM的思路</strong>。
简单来说就是：他们收集了大量高饱和光源数据，用光源在 uv 空间中的位置作为输入，通过 MLP 学习一个 3×3 的颜色校正矩阵，并将其融合进传统 CCM 流程中。</p>
<p>从结果上看，在受控条件下，这一策略确实能够改善高饱和光源下的颜色还原。</p>
<p></p>]]></description>
</item>
<item>
    <title>ISP 论文解读 | 三星: Beyond RGB: A Real World Dataset for Multispectral Imaging in Mobile Devices (WACV 2024)</title>
    <link>https://shuweiyue.com/articles/0820-milti-awn-samsung/</link>
    <pubDate>Wed, 20 Aug 2025 00:00:00 &#43;0800</pubDate>
    <author>岳书威</author>
    <guid>https://shuweiyue.com/articles/0820-milti-awn-samsung/</guid>
    <description><![CDATA[<blockquote>
<p>就应用而言，<strong>理解算法的边界，往往比理解算法本身更重要</strong>。</p></blockquote>
<h2 id="-阅读提示">📖 阅读提示</h2>
<p>潜在读者</p>
<ul>
<li>图像/ISP算法（调试）工程师，研究人员</li>
<li>对计算摄影、颜色科学感兴趣的科研和技术人员</li>
</ul>
<p>推荐时长</p>
<ul>
<li>1min–30min</li>
</ul>
<p>原文下载</p>




<div class="pdf-download-container">
  <a href="/pdf/Beyond.pdf" class="pdf-download-link" target="_blank" rel="noopener noreferrer">
    <i class="fas fa-file-pdf"></i> Beyond RGB: A Real World Dataset for Multispectral Imaging in Mobile Devices
  </a>
</div> 
<hr>
<blockquote>
<p>这是多光谱AWB系列文章的第二篇，第一篇可以参考“多光谱色彩复制技术”</p></blockquote>
<h2 id="快速导读">快速导读</h2>
<p>面阵多光谱，是和单点多光谱传感器的对应说法，他们一般是有一些分辨率，比如150w的红枫，大概有9通道数据。类似的技术OPPO在其丹霞原彩系列中也已使用。工业界如火如荼，但是学术界发展很缓慢，其中一个核心原因是：<strong>缺乏真实的数据集</strong></p>
<p></p>
<p>目前开源的大部分都是纯粹做多光谱研究的——这个方向和我们说的面阵多光谱不完全一样，他们的一个重要假设是：多光谱是用来真实成像的，而不是辅助测光的，而面阵多光谱，在手机成像成像领域，是辅助测光，不参与成像——我认为这是两个领域的核心区别。</p>
<p>非常幸运的，现在说的这篇论文，提出了一个很有价值的数据集，它太过重要，以至于都可以直接拿来当标题：</p>
<p></p>
<p>这是该数据集的简介：</p>
<ul>
<li>16 通道多光谱数据 ，分辨率648x484，使用分光光度计测量得到的36维，380-730nm的真实光谱作为ground truth</li>
<li>总共 1680 场景(自然光472，人造光1208)</li>
<li>为了验证和手机成像结合光谱信息有没有提升，还在上述场景中，分别使用Samsung和OPPO手机采集了带色卡的RAW-RGB数据</li>
</ul>
<p>那么，如何使用这些数据集，如何证明多光谱能够比单独的RGB估计的更加精准，我们看看他的具体算法。</p>
<ul>
<li>基线把 CCC 平移到 ISE：把 16 通道拆成多组三通道跑 CCC，再用 CNN 回归整条光源光谱。</li>
<li>三层评测：光谱域（ΔAHS）、MS 传感器域（ΔAMS）、XYZ 感知域（ΔAXYZ）。</li>
<li><u>结论一句话：MS 明显优于 RGB-only，MS+RGB 融合小幅更稳。</u></li>
<li>注意：单点光谱 GT、全局光源假设，对空间多光源不直接友好。</li>
</ul>
<h3 id="01-方法">01 方法</h3>
<p>{=.center}</p>]]></description>
</item>
<item>
    <title>ISP 论文解读 | 联发科: Generative AWB (CVPR 2025)</title>
    <link>https://shuweiyue.com/articles/0815-generative-awb-copy/</link>
    <pubDate>Fri, 15 Aug 2025 00:00:00 &#43;0800</pubDate>
    <author>岳书威</author>
    <guid>https://shuweiyue.com/articles/0815-generative-awb-copy/</guid>
    <description><![CDATA[<blockquote>
<p>就应用而言，<strong>理解算法的边界，往往比理解算法本身更重要</strong>。</p></blockquote>
<h2 id="-阅读提示">📖 阅读提示</h2>
<p>潜在读者</p>
<ul>
<li>图像/ISP算法（调试）工程师，研究人员</li>
<li>对计算摄影、颜色科学感兴趣的科研和技术人员</li>
</ul>
<p>推荐时长</p>
<ul>
<li>1min–30min</li>
</ul>
<p>原文下载</p>




<div class="pdf-download-container">
  <a href="/pdf/Gene-AWB.pdf" class="pdf-download-link" target="_blank" rel="noopener noreferrer">
    <i class="fas fa-file-pdf"></i> GCC:Generative Color Constancy via Diffusing a Color Checker
  </a>
</div> 
<hr>
<h2 id="本期导读">本期导读</h2>
<figure class="article-image-figure" style="text-align: center; margin: 2.5rem 0; padding: 0;"><a href="/articles/images/0815/title.png" class="lightgallery" title="联发科 CVPR 2025 Generative AWB" data-sub-html="<h2>联发科团队在CVPR 2025发表的生成式AWB算法</h2><p>联发科 CVPR 2025 Generative AWB</p>">
                
            </a><figcaption class="image-caption" style="text-align: center; margin-top: 1rem; padding: 0 1rem; font-size: 0.9rem; color: #666; line-height: 1.4;">联发科团队在CVPR 2025发表的生成式AWB算法</figcaption>
    </figure>
<p>上一篇文章 <em>ISP论文解读 | Time-aware AWB（ICCV 2025）</em> 中，我们聊到了未来 AWB 的三种技术路径：<strong>多通道 / 生成式 / 多模态</strong>。<br>
这是技术视角，但背后其实是更本质的问题视角——成像系统色彩还原绕不开以下痛点：</p>]]></description>
</item>
<item>
    <title>ISP 论文解读 |三星: Time-Aware AWB (ICCV 2025)</title>
    <link>https://shuweiyue.com/articles/0811-time-aware-awb/</link>
    <pubDate>Mon, 11 Aug 2025 00:00:00 &#43;0800</pubDate>
    <author>岳书威</author>
    <guid>https://shuweiyue.com/articles/0811-time-aware-awb/</guid>
    <description><![CDATA[<h2 id="阅读提示">阅读提示</h2>
<p>潜在读者</p>
<ul>
<li>ISP/图像算法（调试）工程师，研究人员</li>
<li>对计算摄影，颜色科学等感兴趣的技术人员</li>
</ul>
<p>推荐时长</p>
<ul>
<li>5min-30min</li>
</ul>
<p>原文下载</p>
<ul>
<li>



<div class="pdf-download-container">
  <a href="/pdf/Time-aware-AWB.pdf" class="pdf-download-link" target="_blank" rel="noopener noreferrer">
    <i class="fas fa-file-pdf"></i> Time-Aware Auto White Balance in Mobiel Photography
  </a>
</div> </li>
</ul>
<hr>
<h2 id="本期导读">本期导读</h2>
<p>先下一个结论，当前以及<strong>未来五年AWB</strong>的发展将遵循以下两种技术路径：</p>
<p>1.<strong>多光谱/通道 AWB</strong>，或者叫面阵多光谱（主要是为了和之前的单点色温传感器做区分），典型代表是HUAWEI的红枫系列和OPPO的分区色温系列（二者本质上是一回事）</p>
<blockquote>
<p>即便是当前多通道还存在各种问题，比如信噪比问题导致在一些场景会失效影响稳定性，但是其基于第一性原理的测光方案，能够相当程度上解决纯色，多光源，模组之间的不一致性等核心问题，而且一旦量产上去，这些问题迭代起来也很快！</p></blockquote>
<p>2.<strong>生成式模型革新传统ISP</strong>，比如直接对coarse sRGB做增强</p>
<p>比如，长焦下的人像肤色，我觉得就很适合用大模型来做，而不是在ISP前端的AWB侧做色彩还原</p>
<p>3.<strong>多模态AWB</strong></p>
<p>就是充分利用camera甚至其他传感器的各种信息。长期依赖工业界其实或多或少走了多模态路线，比如使用色温传感器测色温来辅助AWB和CCM，比如使用曝光来区分indoor/outdoor来辅助AWB，比如使用多帧来做AWB。我说的多模态在此基础上可能更多，比如ISO，time&amp;location信息（判断经纬度,从而直接获取此时此地的天气状况），姿态信息（俯仰角，来判定是否是天空），甚至是未来的深度信息等等</p>
<blockquote>
<p>这实在是很本质的方案，因为我们人类感知世界的方式就是多模态的，color constancy这个能力，实际上就包含了人类视觉第一步初级的色适应+高级大脑皮层的物体识别，记忆色等综合感知</p></blockquote>
<p>现在要讲的论文就是结合了时间——比如拍摄时间，ISO, Shutter Speed, Flash status等exif信息。</p>
<blockquote>
<p>camera的EXIF信息，即 Exchangeable Image File Format缩写，大概包含：</p>
<ul>
<li>拍摄时间和日期/曝光参数/焦距和镜头型号/白平衡模式/色温/闪光灯状态/GPS信息/软件版本/还有自己厂家的私有标签，比如湿度温度什么的</li>
</ul></blockquote>
<p>其效果看起来很好，如下图所示，每张图的中间部分表示使用了exif中的信息得到的结果：</p>
<figure class="article-image-figure" style="text-align: center; margin: 2.5rem 0; padding: 0;"><a href="/articles/images/0811/motivation.png" class="lightgallery" title="时间感知AWB效果对比" data-sub-html="<h2>时间感知AWB效果对比</h2><p>时间感知AWB效果对比</p>">
                
            </a><figcaption class="image-caption" style="text-align: center; margin-top: 1rem; padding: 0 1rem; font-size: 0.9rem; color: #666; line-height: 1.4;">时间感知AWB效果对比</figcaption>
    </figure>
<hr>
<h2 id="技术原理">技术原理</h2>
<p>非常直接，既然这些exif的信息有用，那么就加进去，最好能够端到端训练，于是，设计了如下的pipeline:</p>
<figure class="article-image-figure" style="text-align: center; margin: 2.5rem 0; padding: 0;"><a href="/articles/images/0811/pipeline.png" class="lightgallery" title="算法整体流程图" data-sub-html="<h2>算法整体流程图</h2><p>算法整体流程图</p>]]></description>
</item>
<item>
    <title>ISP专题|华为: 多光谱图像颜色复制（WACV 2025）</title>
    <link>https://shuweiyue.com/articles/0421-multispectral-color-copy/</link>
    <pubDate>Thu, 09 May 2024 00:00:00 &#43;0800</pubDate>
    <author>岳书威</author>
    <guid>https://shuweiyue.com/articles/0421-multispectral-color-copy/</guid>
    <description><![CDATA[<h2 id="阅读提示">阅读提示</h2>
<p>潜在读者</p>
<ul>
<li>图像/ISP算法（调试）工程师，研究人员</li>
<li>对计算摄影，颜色科学感兴趣的科研和技术人员</li>
</ul>
<p>推荐时长</p>
<ul>
<li>5min-30min</li>
</ul>
<p>原文下载</p>




<div class="pdf-download-container">
  <a href="/pdf/Li_Multi-Spectral_Image_Color_Reproduction_WACV_2025_paper.pdf" class="pdf-download-link" target="_blank" rel="noopener noreferrer">
    <i class="fas fa-file-pdf"></i> Multi Spectral Image Color Reproduction
  </a>
</div> 
<h2 id="本期导读">本期导读</h2>
<figure class="article-image-figure" style="text-align: center; margin: 2.5rem 0; padding: 0;"><a href="/articles/images/0421/multispectral-cover.jpg" class="lightgallery" title="多光谱成像示意图" data-sub-html="<h2>多光谱成像示意图</h2><p>多光谱成像示意图</p>">
                
            </a><figcaption class="image-caption" style="text-align: center; margin-top: 1rem; padding: 0 1rem; font-size: 0.9rem; color: #666; line-height: 1.4;">多光谱成像示意图</figcaption>
    </figure>
<p>自动白平衡（AWB）和颜色校正矩阵（CCM）是相机链路（ISP）中颜色成像的关键步骤。这些步骤通过基于拍摄的照片估计场景的光源，从而调整照片中的颜色，使照片内的物体颜色接近于人眼观察到的颜色。</p>
<p>然而，传统基于RGB的成像系统受到一些特定场景的制约。例如，一些没有灰点的场景，它可以是大面积单色，也可以是多色，工业中统称为干扰色（如图1所示），传统基于图像的统计算法就会失效，导致偏色偏差。为了解决这个问题，多光谱摄像头提供了一个可能的解决方案，它能够采集更多的光谱信息来改善颜色校正。然而如何如何高效利用多光谱去做颜色复制，不是一件容易的事情。</p>
<figure class="article-image-figure" style="text-align: center; margin: 2.5rem 0; padding: 0;"><a href="/articles/images/0421/multispectral-fig1.png" class="lightgallery" title="图1. 干扰色场景示意图" data-sub-html="<h2>图1. 干扰色场景示意图</h2><p>图1. 干扰色场景示意图</p>">
                
            </a><figcaption class="image-caption" style="text-align: center; margin-top: 1rem; padding: 0 1rem; font-size: 0.9rem; color: #666; line-height: 1.4;">图1. 干扰色场景示意图</figcaption>
    </figure>
<p>为此，中科大的研究人员与华为诺亚团队联合提出了一种创新方案：使用多光谱（MSI）成像对传统ISP中的AWB+CCM过程进行end2end联合训练，直接输出最终的CIE1931 XYZ。该研究近期以论文形式发表于2025IEEE WACV会议。</p>]]></description>
</item>
</channel>
</rss>
