AI 视觉连载3:RGB与通道

作者:董章鱼是个攻城狮日期:2026/2/11

2、灰度与色彩的最后,给出了一个由彩色图片转成灰度图的示例,并且通过 color_image.mode获取了图片的格式:彩色图片获取到的格式为 RGBA,灰度图为 L。

这一节再介绍一下 RGB 图片以及通道的概念。

通道这个概念,在 深度学习 中很重要,并且极为重要。

举个例子——

在很多时候,对AI神经网络中的一些算法做工程化实现,或者做性能优化,除了关注算法本身之外,还会关注数据存储格式。

一般在 pytorch 中(一个AI模型框架),数据的存储格式 NCHW, C指代的就是通道(channel), 如此一来,对于需要在通道维度做归一化(如 reduce)的算法,是很不友好的。

因为数据在通道维度不连续,导致取到完整的通道维度信息要跨越很大的地址范围,CPU 或其他 xPU 对于这类的数据寻址性能都是很差的,至少要比连续寻址差。

此时就需要对通道维度做其他的变换。

以上举了在实际 AI 算法开发中会遇到的一类问题:通道维度数据在存储器中摆放不连续导致某些算法运算性能不好,这里暂时了解即可,无需深究,涉及到的内容会在专栏后面有详述。

本节的目的只有一个:只需要了解通道这个概念是什么就行了。

先看下 RGB 图像

你可能知道,色彩通常由红色(Red,R)、绿色(Green, G)、蓝色(Blue, B)三种基本颜色组成,这种颜色表示方式被称为彩色 RGB 模型。

在这个模型中,每个像素的颜色由这三种基本颜色组合而成。

因此,一个图像在二维平面上看似只有一个像素,实际是由三个不同颜色(不同通道)的像素混合组成。

这里的 R/G/B 三种颜色,就认为是彩色图片的三个通道,如下图所示。

(一张彩色RGB图片按照通道维度(C)堆叠)

来调一下颜色

通过调整红、绿、蓝三个通道的值,你可以混合出各种颜色。

和灰度图一样,在 RGB 模型中,每个通道的颜色也是用三个数值(0-255 范围内的整数)来表示,分别代表红、绿、蓝三个通道的强度。

你可以使用计算机的画图软件轻松的模拟调色的过程:例如,红色和绿色通道同时存在会产生黄色。

而红色和蓝色通道同时存在则会呈现洋红色。

如果3种颜色都有,则为白色。

RGB 分量

彩色图片有 RGB 三个通道,如果将三张分别为红色通道、绿色通道、蓝色通道的图片进行融合,那么就可以构成一幅色彩斑斓的图片。

同样的,也可以通过一定的方法,将三个通道的分量图像分别提取出来进行展示。

下图左侧是一张彩色原图,后面是分别提取的每个通道的分量绘制而成的图片:将原图的绿色/红色/蓝色通道分量都提取出来了。

RGB 图像在计算机中的占用大小

通常情况下,你可能会认为分辨率为 1920 x 1080 的图片,代表在图片的长、宽两个方向上有 1920 x 1080 个像素。

但是,在学习了本节的彩色 RGB 模型之后,你需要知道:一张彩色图像,除了长、宽方向之外还存在另外一个方向,那就是通道方向。

也就是说,彩色图像应该用三维数据来表示,而不是二维。

举个例子,一张 3 通道的 RGB 图像,长和宽分别为 1920 x 1280 个像素,需要表示该图像的形状为 1920 x 1280 x 3(或者用 [1920, 1280, 3] 的方式来表示)。

当然也可以表示为 3 x 1920 x 1280([3, 1920, 1280]) 来表示,这两种表示方法取决你把通道数放在长和宽的前面还是后面。

一张 1920 * 1280 的 RGB 图片, 在计算机存储时所需要的数据大小为——

1920 x 1280 x 3 x 1 Bytes = 7MB

也就是大约 7M 的数据量。

在实际存储时,受到图片压缩算法的影响,在计算机磁盘中看到的图片大小可能会小于这个数值,但是不影响通过这种方法来估算图片在计算机中的内存占用。

通道的意义

在后面深度学习章节中,我会经常提到通道的概念。

基于计算机视觉的 AI 神经网络在进行模型推理时,无论是卷积算法还是其他算法,计算的绝大部分是图像特征图中通道的关系。

特征图是一种神经网络中间层输出的图,其通道数有多有少,多则几千,少则几十。在特征图中,一个通道中的数据就可以粗略的认为代表了原始图像中的一个特征。

假设某一层特征图只有两个通道,那么将这两个通道的特征可视化之后,可能呈现出来的分别是“轮廓”特征,或者“嘴巴”的特征。

回到 RGB 的图像,因为 RGB 图像有 3 个通道,如果把彩色图片当做特征图的话,那就可以说 RGB 图片有 3 个特征通道。

每个通道或多或少的保留着原始图像的某些细节和轮廓特征,就像上面的三张分量图片一样,当然最主要的特征便是颜色:比如 R 通道,有着 B 通道没有的红色特征。


AI 视觉连载3:RGB与通道》 是转载文章,点击查看原文


相关推荐


自组织特征映射(SOM)的数据聚类程序。 matlab程序 数据格式为excel
NBhhbYyOljP2026/2/2

自组织特征映射(SOM)的数据聚类程序。 matlab程序 数据格式为excel。 打开MATLAB准备搞点数据魔法?今天咱们整点有意思的——用自组织特征映射(SOM)给Excel数据自动分群。这玩意儿就像给数据画美食地图,让相似的样本自动抱团取暖。 先来点准备工作。把Excel数据塞进MATLAB最直接的方式就是readtable函数: data = readtable('你的数据.xlsx'); raw_data = table2array(data(:,2:end)); % 假设第


iOS 常用调试工具大全-打造你的调试武器库
sweet丶2026/1/24

还记得你第一次使用NSLog(@"Hello, World!")的时刻吗?那是调试的起点。但随着应用复杂度呈指数级增长,我们需要的工具也经历了革命性进化: 第一代:基础输出(NSLog、print) 第二代:图形化界面(Xcode调试器、Instruments) 第三代:运行时动态调试(FLEX、Lookin) 第四代:智能化监控(性能追踪、自动化检测) 今天,一个成熟的iOS开发者工具箱中,至少需要掌握3-5种核心调试工具,它们就像外科医生的手术刀——精准、高效、各有所长。 一、运行时调试


SpringCloud Gateway 集成 Sentinel 详解 及实现动态监听Nacos规则配置实时更新流控规则
普通网友2026/1/15

目录 一、前言二、版本选择和适配 2.1、本文使用各组件版本2.2、官方推荐版本 三、部署sentinel-dashboard 3.1、下载 sentinel-dashboard jar包3.2、启动 sentinel-dashboard 四、Gateway 集成 Sentinel实现控制台配置流控规则测试 4.1、添加Gateway 集成 Sentinel 包4.2、添加 Gateway 服务启动JVM参数 4.2.1、配置说明4.2.2、


一文讲清:主流大模型推理部署框架:vLLM、SGLang、TensorRT-LLM、ollama、XInference
智泊AI2026/1/7

本文系统性梳理当前主流的大模型推理部署框架,包括vLLM、SGLang、TensorRT-LLM、Ollama、XInference等。 随着大语言模型技术的迅猛演进,推理部署框架作为贯通模型能力与落地应用的核心枢纽,其战略价值正持续攀升。本文旨在对当前业界广泛采用的 vLLM、SGLang、TensorRT-LLM、Ollama 与 XInference 等主流推理框架展开系统性归纳,围绕核心技术路径、系统架构设计、关键性能指标及典型适用场景等多维度进行深度剖析,为大模型在生产环境中的选型决策


HarmonyOS官方模板集成创新活动-流蓝卡片
万少 VIP.5 如鱼得水2025/12/30

HarmonyOS官方模板集成创新活动-流蓝卡片 ​ 介绍 ​ ​ 流蓝卡片是一款适配了的鸿蒙6-API20的HarmonyOS应用,目的在于给用户提供方便、简单的方式创建好看的卡片,用于将卡片发布到各种社交平台上。 实现过程 ​ ​ 目前是AI Codeing的时代,流蓝卡片其实也是基于AI Coding的产物,人工参与代码部分不超过5%。 ​ 这款应用用到的亮点技术有:GLM4.6 + Gemini-3-pro + 智谱图片生成 + command line 构建鸿蒙工程。 ​ 这套技术组


应对企业微信客户端频繁更新的 RPA 兼容性方案
天空属于哈夫克32025/12/20

一、 引言(Introduction) 核心痛点: 企业微信几乎每月都会进行版本迭代。UI 布局的微调、控件名称的修改、甚至弹窗逻辑的变化,都会导致原本稳定的 RPA 脚本瞬间失效。 研发挑战: 开发者无法阻止客户端更新,但可以通过架构设计,让脚本具备“韧性”,减少因版本更新带来的重复开发工作。 本文目的: 分享如何构建一套版本感知与解耦的 RPA 框架,实现“一次编写,多版本适配”。 二、 兼容性问题的常见类型 UI 属性变更: 某个按钮的 Name 从“发送”变成了“确认发送


AI+虚仿破解实训难题,为无人机火灾救援教学增效赋能
恒点虚拟仿真2025/12/12

在职业教育深化改革的浪潮中,人工智能与虚拟仿真技术的融合正为专业教学带来革命性变化。充分响应政策号召,无人机火灾救援“AI+虚仿”虚实融合创新实训室,为培养高素质应急救援技术技能人才提供全新解决方案。 传统培养模式痛点:实训难实现、教学低效率 传统无人机火灾救援实训长期面临高危场景难复现、设备成本高昂、教学评价主观性强等痛点。尤其在教学管理层面,教师往往需要投入大量时间进行课前准备、课中指导与课后评估,难以实现规模化、精准化人才培养。 智能教学新范式:AI数字教师实现个性化精准指导 实训


doc文件?【图文详解】docx文件?xls/xlsx/ppt/pptx/pdf等办公文件怎么打开?
极智-9962025/12/3

一、问题背景         有时候电脑里蹦出个 “XX.docx” 文件,想打开却懵圈 —— 这后缀名跟 “XX.doc” 就差个 x,到底有啥不一样?存表格时纠结存成 “xls” 还是 “xlsx”,怕选错了下次打不开;看到 “ppt” 和 “pptx” 更是犯嘀咕,明明都是演示文稿,为啥名字尾巴不一样?还有 PDF,明明跟 Word 都能存文字,却死活改不了内容,这又是为啥?         其实啊,这些长得像 “小尾巴” 的后缀名,就是办公文件的 “身份证”!咱们每天用电脑处理工作、


C# WPF canvas中绘制缺陷分布map并实现缩放
zls3653652026/2/19

1、前台xaml 这里把canvas包裹在scrollviewer里面是为了避免滚轮缩放时canvas超出划定的区域,导致显示异常。 2. 后台代码: -. canvas load事件,主要用来获取控件的长度和宽度 -. canvas_mousewheel(object sender,MouseWheelEventArgs e)这个事件主要功能是为了实现通过鼠标进行canvas控件的缩放 -. 这里的逻辑主要为了实现缺陷分布图上的缺陷通过x进行标注 -.深度拷


三月,我只想做好这四件事
修己xj2026/2/28

今天是二月的最后一天,也是春节后上班第一周的收官之日。 在我们中国人的观念里,只有过完春节,新的一年才算真正开始。往年的这个时候,我总会兴致勃勃地立下一堆flag,制定满满当当的年度计划。虽然年终盘点时发现大部分都没实现,但来年依旧乐此不疲——仿佛只要把计划写得够漂亮,生活就会自动变好。 但今年不一样了。 家里添了一位新成员,我的身份悄然发生了改变。抱着怀里这个两个月大的小家伙,我突然不想再立那些宏大的flag,也不想做那些看似充实却往往落空的计划了。 一年很长,长到要数着日历过365个日夜;

首页编辑器站点地图

本站内容在 CC BY-SA 4.0 协议下发布

Copyright © 2026 XYZ博客