sql中的regexp与like区别


💖The Begin💖点点关注,收藏不迷路💖

1、REGEXP

  • 用途:高级字符串匹配,使用正则表达式。
  • 特点:灵活性强,能进行复杂模式匹配(如开头、结尾、字符集等)。
  • 基本语法
SELECT column_name FROM table_name WHERE column_name REGEXP 'pattern';

其中,column_name是要进行匹配的列名,table_name是要查询的表名,pattern是要匹配的正则表达式模式。

  • 正则表达式元素

以下是一些常见的正则表达式元素及其含义:

  • .:匹配任意单个字符(除了换行符)。
  • ^:匹配字符串的开始位置。
  • $:匹配字符串的结束位置。
  • []:指定一个字符集合,匹配其中的任意字符。例如,[abc]匹配abc
  • [^]:指定一个不匹配的字符集合。例如,[^abc]不匹配abc
  • |:逻辑“或”操作符,匹配左边的模式或右边的模式。例如,pattern1|pattern2匹配pattern1pattern2
  • ():用于组合模式,以便它们被视为一个整体。
  • *:匹配前面的模式零次或多次。
  • +:匹配前面的模式一次或多次。
  • ?:匹配前面的模式零次或一次。
  • {n}:匹配前面的模式恰好n次。
  • {n,}:匹配前面的模式至少n次。
  • {n,m}:匹配前面的模式至少n次且不超过m次。

使用示例:

  1. 查找包含特定单词的行

    SELECT column_name FROM table_name WHERE column_name REGEXP 'a';
    
  2. 查找以特定单词开头的行

    SELECT column_name FROM table_name WHERE column_name REGEXP '^a';
    
  3. 查找以特定单词结尾的行

    SELECT column_name FROM table_name WHERE column_name REGEXP 'a$';
    
  4. 查找包含特定字符集合的行

    SELECT column_name FROM table_name WHERE column_name REGEXP '[abc]';
    
  5. 查找不包含特定字符集合的行

    SELECT column_name FROM table_name WHERE column_name REGEXP '[^abc]';
    
  6. 查找包含多个模式之一的行

    SELECT column_name FROM table_name WHERE column_name REGEXP 'pattern1|pattern2';
    

2、LIKE

  • 用途:简单字符串匹配,使用通配符%_

  • 特点:性能较好,适合简单模式匹配(如包含某字符)。

  • 基本语法

SELECT column_name FROM table_name WHERE column_name LIKE pattern;

其中,pattern 可以包含文字字符、%(代表任意数量的字符,包括零个字符)和 _(代表一个任意字符)。

使用示例:

  1. 查找包含特定文本的行

找出 column_name 中包含 “text” 的所有行,你可以这样写:

SELECT * FROM table_name WHERE column_name LIKE '%a%';
  1. 查找以特定文本开头的行

    如果你想找出 column_name 以 “prefix” 开头的所有行,你可以这样写:

    SELECT * FROM table_name WHERE column_name LIKE 'a%';
    
  2. 查找以特定文本结尾的行(注意:LIKE 本身不直接支持以特定文本结尾的匹配,但可以通过反转字符串和模式来实现):

例如,在 MySQL 中,可以使用 REVERSE() 函数(如果可用)来反转字符串和模式,然后进行匹配:

SELECT * FROM table_name WHERE REVERSE(column_name) LIKE REVERSE('%a');

这种方法可能不是所有数据库系统都支持的,且可能不如直接使用 REGEXP 或其他数据库特定的函数高效。

  1. 查找包含特定字符(但不是任意字符)的行

    如果你想查找 column_name 中第二个字符是 “a” 的所有行,你可以使用 _ 来表示第一个任意字符,然后紧跟 “a”:

    SELECT * FROM table_name WHERE column_name LIKE '_a%';
    

注意事项:

  • LIKE 匹配是区分大小写的,除非数据库或查询被设置为不区分大小写(这取决于数据库的实现和配置)。
  • 使用 %_ 时要小心,因为它们会显著影响查询的性能,特别是当它们出现在模式的开始位置时。因为数据库需要扫描更多的行来找到匹配项。
  • 考虑使用 REGEXP 替代 LIKE,以获得更强大的匹配能力和灵活性。但是, REGEXP 可能会比 LIKE 更慢,特别是在处理大量数据时。

3、区别与选择

  • 性能LIKE通常更快,REGEXP在处理复杂模式时可能较慢。
  • 灵活性REGEXP更高,LIKE适合简单匹配。
  • 选择:根据需求选择,复杂匹配用REGEXP,简单匹配用LIKE

在这里插入图片描述


💖The End💖点点关注,收藏不迷路💖
Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐