贝利信息

mysql中使用前缀索引与性能优化技巧

日期:2026-01-11 00:00 / 作者:P粉602998670
前缀索引长度应通过计算区分度确定:用COUNT(DISTINCT LEFT(col,N))/COUNT(*)≥0.95为基准,再结合EXPLAIN验证key_len和rows;必须显式指定长度,不支持ORDER BY/GROUP BY;复合索引中需注意字段顺序与区分度。

前缀索引到底该取多长?别猜,用 SELECT 算出来

前缀索引长度不是拍脑袋定的。太短,重复值多,索引失效;太长,浪费空间、拖慢写入。关键看字段值的**区分度**——即前 N 个字符能区分多少行数据。

实操步骤:

SELECT
  COUNT(*) AS total,
  COUNT(DISTINCT LEFT(email, 5)) AS prefix5,
  COUNT(DISTINCT LEFT(email, 8)) AS prefix8,
  COUNT(DISTINCT LEFT(email, 12)) AS prefix12
FROM users;

ALTER TABLE ... ADD INDEX 加前缀索引时,必须显式指定长度

MySQL 不允许对 TEXT/VARCHAR 类型字段直接建普通索引(除非你设了 innodb_large_prefix=ON 且行格式支持),但更常见的是加前缀索引。漏写长度会报错:ERROR 1071 (42000): Specified key was too long

正确写法:

前缀索引不支持 ORDER BYGROUP BY 的完整排序/分组

这是最容易踩的坑:前缀索引只加速“查找”,不保存完整字段值,所以无法用于排序或去重逻辑。

比如:

如果你依赖 ORDER BY email 性能,要么建完整长度索引(注意长度限制),要么在应用层缓存排序结果。

复合索引里混用前缀索引,顺序和长度都影响命中率

前缀索引可以作为复合索引的一部分,但它的“有效信息量”比完整索引低,容易让优化器放弃使用整个索引。

例如建了 (status, email(10), created_at)

建议:把高区分度字段放前面;前缀字段尽量控制在区分度 ≥ 0.9;必要时用 FORCE INDEX 验证,但别在线上滥用。

前缀索引不是银弹——它省空间、快查询,但代价是丧失排序能力、增加评估成本。真正难的不是怎么建,而是判断“这里值不值得建”。每次加之前,先跑一遍 SELECT COUNT(DISTINCT ...),再看 EXPLAIN,比凭经验靠谱得多。