史上最全的正则表达式-匹配

技术博客 (289) 2023-09-16 15:39:10

在做项目的过程中,使用正则表达式来匹配一段文本中的特定种类字符,是比较常用的一种方式,下面是对常用的正则匹配做了一个归纳整理。

1、匹配中文:[\u4e00-\u9fa5]

2、英文字母:[a-zA-Z]

3、数字:[0-9]

4、匹配中文,英文字母和数字及下划线:^[\u4e00-\u9fa5_a-zA-Z0-9]+$
同时判断输入长度:
[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}

5、
(?!)  不能以开头
(?!.*?$)  不能以结尾
[a-zA-Z0-9_\u4e00-\u9fa5]+  至少一个汉字、数字、字母、下划线
$  与字符串结束的地方匹配

6、只含有汉字、数字、字母、下划线,下划线位置不限:
^[a-zA-Z0-9_\u4e00-\u9fa5]+$

7、由数字、26个英文字母或者下划线组成的字符串
^\w+$

8、2~4个汉字
“^[\u4E00-\u9FA5]{2,4}$”;

9、最长不得超过7个汉字,或14个字节(数字,字母和下划线)正则表达式
^[\u4e00-\u9fa5]{1,7} |[\dAZaz]1,14 | [ \dA − Z a − z ] 1 , 14

10、匹配双字节字符(包括汉字在内):[^x00-xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

11、匹配空白行的正则表达式:ns*r
评注:可以用来删除空白行

12、匹配HTML标记的正则表达式:<(S*?)[^>]>.?|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力

13、匹配首尾空白字符的正则表达式:^s*|s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式

14、匹配Email地址的正则表达式:^[a-zA-Z0-9][\w.-][a-zA-Z0-9]@[a-zA-Z0-9][\w.-][a-zA-Z0-9].[a-zA-Z][a-zA-Z.]*[a-zA-Z]$

评注:表单验证时很实用

15、手机号:^((13[0-9])|(14[0-9])|(15[0-9])|(17[0-9])|(18[0-9]))\d{8}$

16、身份证:(^\d{15} )|(\d17([09]|X|x) ) | ( \d 17 ( [ 0 − 9 ] | X | x ) )

17、匹配网址URL的正则表达式:[a-zA-z]+://[^s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求

18、匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用

19、匹配国内电话号码:d{3}-d{8}|d{4}-d{7}
评注:匹配形式如 0511-4405222 或 021-87888822

20、匹配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10000开始

21、匹配中国邮政编码:[1-9]d{5}(?!d)
评注:中国邮政编码为6位数字

22、匹配身份证:d{15}|d{18}
评注:中国的身份证为15位或18位

23、匹配ip地址:d+.d+.d+.d+
评注:提取ip地址时有用

24、匹配特定数字:
^[1-9]d* //[19]d / / 匹 配 正 整 数 − [ 1 − 9 ] d ∗   //匹配负整数
^-?[1-9]d* //[19]d|0 / / 匹 配 整 数 [ 1 − 9 ] d ∗ | 0   //匹配非负整数(正整数 + 0)
^-[1-9]d*|0 //+0[19]d.d|0.d[19]d / / 匹 配 非 正 整 数 ( 负 整 数 + 0 ) [ 1 − 9 ] d ∗ . d ∗ | 0. d ∗ [ 1 − 9 ] d ∗    //匹配正浮点数
^-([1-9]d*.d*|0.d*[1-9]d*) //?([19]d.d|0.d[19]d|0?.0+|0) / / 匹 配 负 浮 点 数 − ? ( [ 1 − 9 ] d ∗ . d ∗ | 0. d ∗ [ 1 − 9 ] d ∗ | 0 ? .0 + | 0 )   //匹配浮点数
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0 //+0(([19]d.d|0.d[19]d))|0?.0+|0 / / 匹 配 非 负 浮 点 数 ( 正 浮 点 数 + 0 ) ( − ( [ 1 − 9 ] d ∗ . d ∗ | 0. d ∗ [ 1 − 9 ] d ∗ ) ) | 0 ? .0 + | 0   //匹配非正浮点数(负浮点数 + 0)
评注:处理大量数据时有用,具体应用时注意修正

25、匹配特定字符串:
^[A-Za-z]+ //26[AZ]+ / / 匹 配 由 26 个 英 文 字 母 组 成 的 字 符 串 [ A − Z ] +   //匹配由26个英文字母的大写组成的字符串
^[a-z]+ //26[AZaz09]+ / / 匹 配 由 26 个 英 文 字 母 的 小 写 组 成 的 字 符 串 [ A − Z a − z 0 − 9 ] +   //匹配由数字和26个英文字母组成的字符串
^w+$  //匹配由数字、26个英文字母或者下划线组成的字符串

26、
在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下:
只能输入数字:“^[0-9]* ndn ” 只 能 输 入 n 位 的 数 字 : “ d n
只能输入至少n位数字:“^d{n,} mndm,n ” 只 能 输 入 m − n 位 的 数 字 : “ d m , n
只能输入零和非零开头的数字:“^(0|[1-9][0-9]*) [09]+(.[09]2)? ” 只 能 输 入 有 两 位 小 数 的 正 实 数 : “ [ 0 − 9 ] + ( . [ 0 − 9 ] 2 ) ?
只能输入有1-3位小数的正实数:“^[0-9]+(.[0-9]{1,3})? +?[19][09] ” 只 能 输 入 非 零 的 正 整 数 : “ + ? [ 1 − 9 ] [ 0 − 9 ] ∗
只能输入非零的负整数:“^-[1-9][0-9]* 3.3 ” 只 能 输 入 长 度 为 3 的 字 符 : “ . 3
只能输入由26个英文字母组成的字符串:“^[A-Za-z]+ 26[AZ]+ ” 只 能 输 入 由 26 个 大 写 英 文 字 母 组 成 的 字 符 串 : “ [ A − Z ] +
只能输入由26个小写英文字母组成的字符串:“^[a-z]+ 26[AZaz09]+ ” 只 能 输 入 由 数 字 和 26 个 英 文 字 母 组 成 的 字 符 串 : “ [ A − Z a − z 0 − 9 ] +
只能输入由数字、26个英文字母或者下划线组成的字符串:“^w+ :[azAZ]w5,17 ” 验 证 用 户 密 码 : “ [ a − z A − Z ] w 5 , 17 ”正确格式为:以字母开头,长度在6-18之间,
只能包含字符、数字和下划线。
验证是否含有^%&’,;=?"等字符:“[^%&',;=? "等字符:“[^%&',;=? x22]+”
只能输入汉字:“^[u4e00-u9fa5],{0,}$”
验证Email地址:“^w+[-+.]w+)@w+([-.]w+).w+([-.]w+)*$”
验证InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)? 1518d15|d18 ” 验 证 身 份 证 号 ( 15 位 或 18 位 数 字 ) : “ d 15 | d 18
验证一年的12个月:“^(0?[1-9]|1[0-2]) 010911231((0?[19])|((1|2)[09])|30|31) ” 正 确 格 式 为 : “ 01 ” − “ 09 ” 和 “ 1 ” “ 12 ” 验 证 一 个 月 的 31 天 : “ ( ( 0 ? [ 1 − 9 ] ) | ( ( 1 | 2 ) [ 0 − 9 ] ) | 30 | 31 )
正确格式为:“01”“09”和“1”“31”。
匹配中文字符的正则表达式: [u4e00-u9fa5]
匹配双字节字符(包括汉字在内):[^x00-xff]
匹配空行的正则表达式:n[s| ]*r
匹配HTML标记的正则表达式:/<(.)>.|<(.*) />/
匹配首尾空格的正则表达式:(^s*)|(s*$)
匹配Email地址的正则表达式:w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*
匹配网址URL的正则表达式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

^(?![0-9]+ )(?![azAZ]+ ) ( ? ! [ a − z A − Z ] + )[0-9A-Za-z]{8,16}$

分开来注释一下:
^ 匹配一行的开头位置
(?![0-9]+ )(?![azAZ]+ ) 预 测 该 位 置 后 面 不 全 是 数 字 ( ? ! [ a − z A − Z ] + ) 预测该位置后面不全是字母
[0-9A-Za-z] {8,16} 由8-16位数字或这字母组成
$ 匹配行结尾位置

注:(?!xxxx) 是正则表达式的负向零宽断言一种形式,标识预该位置后不是xxxx字符。

THE END

发表回复