计算机十万个为什么--数据库索引

作者:无限大6日期:2025/12/8

计算机十万个为什么--数据库索引

大家好,欢迎来到最新一期的无限大博客。

突然发现自己对数据库相关的内容掌握不够扎实,于是就去学习了一下,顺便也将自己的理解写成了一篇博客。

希望这篇文章能对大家有所帮助

数据库索引:给数据仓库装个"智能导航系统" 🧭

想象一下,你走进一个占地 1000 平方米的超级图书馆 📚,里面塞满了几十万本书,却连个分类牌都没有。老板忽然喊你找一本《数据库从入门到放弃》,你是不是当场想表演一个原地消失术?😱

这就是没有索引的数据库的日常!每次查询都像蒙眼找书,全表扫描就是那个被蒙住眼睛的倒霉蛋,只能一本本摸过去。而今天我们要聊的 数据库索引 ,就是给这个混乱图书馆装上的智能导航系统 🧭,让你秒变图书馆馆长,想找哪本书就找哪本书!

为什么"like '%关键词%'"会让索引当场罢工?

先看个灵魂拷问:下面两条 SQL,性能可能差 1000 倍!你猜哪个快?

1-- 语句 A
2SELECT * FROM books WHERE title LIKE '数据库%';
3
4-- 语句 B
5SELECT * FROM books WHERE title LIKE '%数据库%';
6

答案是语句 A 可能快到飞起,语句 B 可能慢到想砸键盘

原因就藏在那个小小的百分号里。

🌰 蒙眼找书现场还原

假设我们给 title 字段建了索引,就像图书馆按书名首字母排序的分类架。当你执行 LIKE '数据库%' 时,索引会开心地带你直奔 "数" 字区,从 "数据库入门" 找到 "数据库原理",一气呵成 🚀。

但如果写成 LIKE '%数据库%',相当于你告诉图书管理员:"我要找所有书名里包含'数据库'的书,但我不告诉你它在开头还是结尾"。这时候索引直接懵了 😵,因为它的排序规则是按首字母来的,现在关键词可能出现在任何位置,就像让你在所有书里找 "包含'的'字的书" 一样——索引完全帮不上忙!

全表扫描警告 ⚠️:数据库只能开启"蒙眼摸书"模式,逐行检查每条记录。如果表中有 100 万条数据,就像让你在 100 万本书里一本本翻开找,画面太美我不敢看 🥶。

image.png

避坑指南:3 个让索引失效的经典操作

错误写法 🔴正确姿势 🟢性能差距
LIKE '%关键词%'LIKE '关键词%' 或使用全文索引可能差 100~1000 倍
WHERE age + 1 = 25WHERE age = 24索引直接失效
WHERE SUBSTR(title, 3) = '数据库'WHERE title LIKE '__数据库%'函数操作导致索引失效

B+树索引 vs 哈希索引:新华字典 vs 快递柜

现在你决定给图书馆装导航系统了,但市场上有两种方案:

  • 方案 A :像《新华字典》那样的目录 📖(B+树索引)
  • 方案 B :像快递柜那样的编号系统 📦(哈希索引)

到底选哪个?这得看你平时怎么找书!

📖 B+树索引:新华字典的智慧

翻开你的新华字典,会发现它有两种目录:拼音索引和部首索引。B+树索引就像拼音索引,它把数据按顺序排好,并且只在叶子节点存储完整数据,中间节点都是"指路牌"。

1graph TD
2    A[根节点] -->|1-100| B[中间节点]
3    A -->|101-200| C[中间节点]
4    
5    B -->|1-50| D[叶子节点: 1,3,5...50]
6    B -->|51-100| E[叶子节点: 51,53...100]
7    
8    C -->|101-150| F[叶子节点: 101...150]
9    C -->|151-200| G[叶子节点: 151...200]
10    
11    D -->|链表指针| E
12    E -->|链表指针| F
13    F -->|链表指针| G
14

image.png 适用场景

  • 范围查询(比如找 "价格在 10-50 元的书")📊
  • 排序操作(比如 "按出版日期倒序排列")🔄
  • 前缀匹配(比如 LIKE '数据库%')🎯

📦 哈希索引:快递柜的暴力美学

哈希索引就像快递柜,每个 key 都通过哈希函数计算出一个唯一编号,直接定位到存储位置。比如查询 id=100 的数据,哈希函数算出来是 8 号柜,直接拉开 8 号柜就能找到!

适用场景

  • 等值查询(比如 WHERE id=100)⚡
  • 键值对数据库(如 Redis)🚀

image.png

灵魂对比表格 👇

特性B+树索引哈希索引
查找速度O(log n) 稳定O(1) 但有哈希冲突风险
范围查询✅ 天生支持❌ 完全不支持
排序✅ 叶子节点链表天然有序❌ 无序存储
内存占用中等(可存磁盘)较高(通常内存存储)
经典应用MySQL InnoDB 主键索引Redis、Memcached 键值存储

MySQL InnoDB 聚簇索引:叶子节点里藏着大秘密!

如果你用 MySQL 的 InnoDB 引擎,那你必须知道这个惊天大秘密 💣:

它的主键索引叶子节点直接存着整行数据!就像你查新华字典时,翻到 "数" 字不仅能看到拼音,还能直接把整页字典撕下来带走 📄。

聚簇索引 vs 非聚簇索引:冰箱 vs 储物柜

  • 聚簇索引 (主键索引):就像家里的冰箱 🧊,门(索引)打开直接看到食物(数据),不用再跑一趟。
  • 非聚簇索引 (二级索引):就像储物柜的标签 🏷️,上面写着"零食在冰箱第三层",你还得再去冰箱拿。
1graph TD
2    subgraph 聚簇索引 B+树
3        A[根节点: 主键范围 1-1000]
4        B[中间节点: 1-500]
5        C[中间节点: 501-1000]
6        D[叶子节点: 1-100, 包含整行数据]
7        E[叶子节点: 101-200, 包含整行数据]
8    end
9    A --> B
10    A --> C
11    B --> D
12    B --> E
13    D --> E --> F[...更多叶子节点]
14

image.png

实战:如何检测索引失效?

给大家分享一个我压箱底的索引失效检测 SQL 🕵️‍♂️,执行它就能知道查询有没有用到索引:

1EXPLAIN
2SELECT * FROM books
3WHERE title LIKE '%数据库%'  -- 这个会失效
4  AND price > 50;           -- 这个可能有效
5

结果解读 👇: -- 重点看 type 列: -- ✅ ref/range/index:索引有用 -- ❌ ALL:全表扫描,索引失效!

避坑神技 ✨:如果必须用 %关键词% 模糊查询,可以考虑用 全文索引

1-- 创建全文索引
2CREATE FULLTEXT INDEX idx_title_ft ON books(title);
3
4-- 高效查询包含关键词的记录
5SELECT * FROM books
6WHERE MATCH(title) AGAINST('数据库' IN NATURAL LANGUAGE MODE);
7

索引设计的三大灵魂拷问

  1. 是不是索引越多越好?

答:NO!索引像图书馆的分类架,太多了反而难找,而且每次增删改数据都要维护索引,就像每次新书入库都要重新贴标签 贴到崩溃。

  1. 主键为什么最好是自增 ID?

答:InnoDB 聚簇索引如果用随机 ID,会导致叶子节点频繁分裂,就像你整理好的书架忽然插进新书,整个架子都要重排 🗄️。

  1. 为什么不建议用 UUID 做主键?

答:UUID 是随机字符串,索引树会变成"歪脖子树" 🌳,查询效率暴跌!不信你试试给图书馆的书按 UUID 排序?


结语:索引不是银弹,但没有索引是真的完蛋

最后送大家一句我奶奶都能听懂的话:索引就像给自行车装变速器 🚲,平时通勤(简单查询)可能感觉不到,但遇到爬坡(复杂查询)时,有没有变速器直接是两个物种!

但记住,没有万能的索引设计,最好的实践是:用 EXPLAIN 分析 SQL,用监控工具观察慢查询,让数据告诉你答案 📊。

祝大家都能写出飞一般的 SQL,再也不用对着全表扫描掉头发!💇‍♂️💨

(如果觉得有用,记得点赞收藏哦~ 👇)


计算机十万个为什么--数据库索引》 是转载文章,点击查看原文


相关推荐


失业7个月,我把公司开起来了:一个程序媛的“野蛮生长”
后端小肥肠2025/11/28

大家好,我是小肥肠。 4月被裁,11月注册公司。 这7个月,我一个人赚回了以前一年的工资,也攒够了人生第一台CC的首付。今天不讲技术,聊聊这半年一个程序媛的野蛮生长。 1. 半年了我开起了公司 从4月到现在已经创业半年多了(7个月),这7个月以来,我从一个一无所有的失业人到现在攒够了一台cc的首付(赚的比以前上班一年还多),我的共学社群实现了从0到现在的300多人。 其中有很多和我一样的程序员,他们都是被我的文章吸引来共学群一起成长,也有很多小白进来一步一步成长为可以自行搭建自己的智能体。 在这


【项目踩坑实录】并发环境下,Glide缓存引起的图片加载异常
Lei_official2025/12/16

在现实主义者身上,并不是奇迹产生信仰,而是信仰产生奇迹。——《卡拉马佐夫兄弟》 背景简述 在维护智能手表主题管理功能时,我遇到过一个十分有趣的bug,从测试首次发现问题时感到十分困惑且不解,到自己我不断尝试并成功复现,直至最终找到根本原因与解决方案,历经一周左右时间。虽然是存在已久的历史问题,但仍有记录和总结的意义,同时也警醒自己在设计并发模块时,一定要心存敬意、考虑周全。 问题现象 问题的表现如上,用户编辑相册表盘后,返回到表盘列表页,预期是可以展示出新设置的相册表盘的预览图,但实际效果


面向课堂与自习场景的智能坐姿识别系统——从行为感知到可视化部署的完整工程【YOLOv8】
我是杰尼2025/12/24

面向课堂与自习场景的智能坐姿识别系统——从行为感知到可视化部署的完整工程【YOLOv8】 一、研究背景:为什么要做“坐姿识别”? 在信息化学习与办公环境中,久坐与不良坐姿已成为青少年与上班族普遍面临的健康问题。长期驼背、前倾、低头等坐姿行为,容易引发: 脊柱侧弯、颈椎病 注意力下降、学习效率降低 视觉疲劳与肌肉劳损 传统的坐姿管理主要依赖人工监督或简单硬件传感器,不仅成本高、实时性差,而且难以规模化推广。 随着计算机视觉与深度学习技术的发展,基于摄像头的坐姿自动识别系统逐渐成为一种可行且低成


fmtlib/fmt仓库熟悉
LumiTiger2026/1/2

一、仓库(fmtlib/fmt)依赖/用到的开源库 fmt 核心设计为无外部运行时依赖(self-contained),仅在特定功能/实现中引用少量开源算法/工具(非链接依赖): Dragonbox: 内嵌该开源算法(https://github.com/jk-jeon/dragonbox),用于实现 IEEE 754 浮点数的高性能格式化(保证正确舍入、短长度、往返一致性),是 fmt 浮点格式化的核心实现基础。构建/测试类工具(非业务依赖): CMake:跨平台构建系统;oss-f


JNI是什么?
自由生长20242026/1/11

JNI是什么? JNI(Java Native Interface,Java本地接口)是Java平台自1.1版本起提供的标准编程接口,它是一套强大的编程框架,允许运行在Java虚拟机(JVM)中的Java代码与用C、C++等其他编程语言编写的本地代码进行交互。 核心特点 功能扩展:允许Java程序调用本地代码,实现标准Java类库无法支持的功能 性能优化:对于性能敏感的计算密集型任务(如图像处理、音视频编解码、复杂数学运算),本地代码通常比Java实现更高效 代码复用:可以重用已有的C/C++


ooder-agent v0.6.2 升级实测:SDK 封装 + Skill 化 VFS,AI 一键生成分布式存储应用
OneCodeCN2026/1/19

作为一名深耕分布式Agent框架的开发者,我踩过最多的坑,就是分布式存储的配置复杂、断网数据丢失、自定义应用开发成本高这三大难题。 直到上手 ooder-agent v0.6.2 版本,我才发现原来分布式存储应用可以这么简单——这次升级直接把两个核心痛点连根拔起:agent-sdk 深度封装降低开发门槛,skill-vfs 变身完整Skill程序适配复杂网络场景,更关键的是,AI一句话就能生成存储应用,零代码自动部署。 今天就从技术角度,聊聊这次升级的两大核心亮点和实际使用价值。 一、核心升级1

首页编辑器站点地图

本站内容在 CC BY-SA 4.0 协议下发布

Copyright © 2026 XYZ博客