贝利信息

Python编写函数去掉字符串中的空格_自定义函数去除字符串空格

日期:2026-01-08 00:00 / 作者:星降
replace()最快删ASCII空格但不处理制表符、换行符及全角空格;re.sub()可统一清除所有Unicode空白包括全角空格;translate()速度最快但需预定义字符集;split()+join()会丢失原始分隔结构且性能差。

replace() 最快去掉所有空格,但要注意它不处理制表符和换行符

如果只是想把普通空格(ASCII 32)全删掉,replace() 是最直接的选择,性能也最好。它不会动其他空白字符,比如 \t\n\r,这点要心里有数。

re.sub() 精确控制“哪些空白要删”,适合复杂清洗场景

当你要统一清除所有 Unicode 空白字符(包括空格、制表、换行、全角空格、不间断空格等),正则更可靠。关键是别写错模式 —— \s 匹配所有空白,但默认不包含全角空格;要覆盖更广,得显式列出或用 [\s\u3000]

import re
def remove_all_whitespace(s):
    return re.sub(r'[\s\u3000]+', '', s)  # \s + 中文全角空格

str.translate() 去除固定字符集,速度最快但灵活性低

如果你明确只删空格、制表、换行这几种,且追求极致性能(比如处理 GB 级日志),translate()replace() 和正则都快。但它不能写逻辑,只能靠查表映射。

WHITESPACE_TABLE = str.maketrans('', '', ' \t\n\r\f\v\u3000')
def remove_whitespace_fast(s):
    return s.translate(WHITESPACE_TABLE)

别直接用 split() + join(),它会连多个空格之间的语义也抹掉

常见误区是写 ' '.join(s.split())''.join(s.split())。前者压缩空格成单个,后者看似去空格,实则会把所有空白(包括换行)全转成空字符串再拼,中间无分隔 —— 看似结果对,但逻辑错位,且性能差。

立即学习“Python免费学习笔记(深入)”;

真正需要“去掉空格”时,先问清楚:只要 ASCII 空格?还是要清掉所有空白?是否保留原始分隔语义?选错方法,后面 debug 时才发现数据被静默破坏,就晚了。