`
cuishuangjia
  • 浏览: 150886 次
  • 性别: Icon_minigender_1
  • 来自: 沈阳
社区版块
存档分类
最新评论
阅读更多
^       The caret (^) tells the regular expression that the character must not match the characters to follow.
        比如要匹配所有除了a或b的字符,字符类可以这么写[^ab]
^      定位符规定匹配模式必须出现在目标字符串的开头
        那是否说^ 在[ ] 里面 就表示排除(负向类) , 在[ ] 前面 就表示要在开头 ?
$      定位符规定匹配模式必须出现在目标对象的结尾

-        范围类,如要匹配a到z的所有字母,字符类可以这么写[a-z]

{n}   出现多少次

/^[0-9]{7}$/    匹配的就是一个仅包含7个数字的字符串


7.1 RegExp 对象可以有一个或两个参数.
      var reCat = new RegExp ("cat")                      //这个表达式只会匹配字符串中出现的第一个"cat"
      var reCat = new RegExp ("cat","g")               //匹配所有出现的"cat"

     正则表达式字面量
     var reCat = /cat/gi ;   注意字面量不需要放在引号里

     判断某个字符串是否匹配指定的模式
     RegExp.test(str)                   如果给定的字符串匹配这个模式,返回true ,否则返回false .   reCat.test("cat")   //返回true

     RegExp. exec(str)                 返回一个数组 ,数组中第一个元素是匹配字符串,其他是反向引用 . 如果没有找到匹配,返回null
                                               返回的数组有一个index 属性,这个属性的值是匹配字符串中第一个字符在原字符串中的下标
                                              var toMarch6 = "1 3";
                       var regExp6 = /(\d+)\s*(\d+)/;
                       var result = regExp6.exec(toMarch6);
                       dwr(result);//1 3,1,3
                                              dwr(RegExp.$1 +" "+RegExp.$2);//1 3
                                              当正则表达式加上了参数g ,这个正则表达式会从正则表达式对象的lastIndex 属性指定的位置开始查找,如果找到一个匹配,
                                              会将lastIndex 属性设置为匹配字符串后面一个位置的下标.
                       var toMarch7 = "1 3 4 5";
                       var regExp7 = /(\d+)\s*(\d+)/g;
                       var result7
                       while((result7= regExp7.exec(toMarch7)) !=null){
                         dwr(result7);//分别为1 3,1,3 和 4 5,4,5
                         dwr(regExp7.lastIndex);//分别为3和7
                       }
     String.match(reCat)            返回一个包含在字符串中的所有匹配 的数组
                                               var toMatch = "a bat, a cat, a fAt baT, a faT cat";
                                               var reAt = /at/gi; //如果不加参数g,返回的数组只会包含一个匹配元素
                                               var arrMatchs = toMatch.match(reAt);
                                               返回一个数组["at","at","At","aT","aT","at"]

     String.search(reCat)           与indexOf 类似,返回在字符串中出现的第一个 匹配的位置 ,全局匹配表达式g 在这里不起作用    toMatch.search(reAt);//输出3

     String.replace(matchStr, replaceStr)            
                                               用第二个参数替换 某个子串(第一个参数)的所有匹配 . 第一个参数 既可以是匹配的字符串 ,也可以是用于匹配的一个正则表达式 ,
                                               返回是替换后的整个字符串
                                               var sToChange = "The sky is red";
                                               var reRed = /red/;
                                               sToChange.replace(reRed,"blue" );    //输出The sky is blue   

     String.split(reCat)              将字符串分割 成子串,作为数组 返回
                                              var sColor = "red, blue, yellow";
                                              var reExp = /\,/;
                                              var arrs = sColor.split(reExp);    //得到一个数组["red","blue","yellow" ]   注意逗号 在正则表达式有
                                                                                                                        特殊含义 ,这边需要转义              

7.2  简单模式(元字符 ,字符类 ,量词 )
元字符      11个   ( ) [] {} \ ^ $ |  ? * + .       要匹配字符串中的元字符,需要转义   /\^/
注意var reMark = new RegExp("\\^"); 当正则表达式以非字面量的形式 表示时,所有的反斜杠"\" 都要用两个反斜杠"\\" 来替换.
因为javascript字符串解析器会按照翻译\n 的方式尝试翻译\?.为了保证不会出现这个问题,在元字符的前面加上两个反斜杠,
我们称之为双重转义 .(不太懂这个解释,我的理解是\ 本身也是元字符,先要对它转义得到 "\" ,然后再用这个"\" 对接下来的元字符转义)

预定义的特殊字符

\t


制表符

\n


换行符

\r


回车符

\f


换页符

\a


Alert 字符

\e


Escape 字符

\cX


与 X 相应的控制字符

\b


回退字符

\v


垂直制表符

\o


空字符




字符类   将一些字符放入方括号中 .

1, 简单类    
   var toMatch = "a bat, a cat, a fAt baT, a faT cat";
   var reg = /[bcf]at/gi ;
   var arrs = toMatch.match(reg);     返回的数组[“bat”, “Cat”, “fAt”, “baT”, “faT”, “cat”]

2,负向类      可以指定要排除的字符 ,^ 要在[ ] 里面
   匹配除了 a 和b 以外的所有字符,那么这个字符类为[^ab] . 脱字符^ 告诉正则表达式字符不能匹配后面 跟着的字符
   只想获得包含at但不能以b或c开头的字符, /[^bc]at/gi

3, 范围类
   [a-z] 匹配所有小写字母
   结合负向类可以排除给定范围内的所有字符 , 例如要排除字符1~4,可以使用类[^1-4]

4, 组合类
   [a-z1-9\n]

5, 预定义类
代码                  等同于                            匹配
.                      [^\n\r]                         除了换行回车意外的任意字符
\d                   [0-9]                             数字
\D                   [^0-9]                           非数字
\s                   [ \t\n\r\x0B\f]         空白字符
\S                   [^ \t\n\r\x0B\f]       非空白字符
\w                   [a-zA-Z_0-9]               单词字符(所有字母,数字和下划线)
\W                   [^a-zA-Z_0-9]             非单词字符


6, 量词
用于指定某个特定模式出现的次数
?                     出现0次或1次
*                     出现0次或多次(任意次)
+                     出现1次或多次(至少出现一次)
{n}                 一定出现n次
{n,m}             至少出现n次但不超过m次
{n,}               至少出现n次

贪婪的,惰性的,支配性的量词
贪婪量词 先看整个字符串是否匹配,如果没有发现匹配,它去掉该字符串中最后一个字符,并再次尝试.重复这个过程直到发现匹配或者字符串不剩任何字符.
             结合下面会见到的两个例子, 实际过程可能是这样的:
             第一步按上面的描述执行, 如果字符串不剩任何字符还是没有找到一个匹配, 那么删除字符串的第一个字符, 重复第一步.
惰性量词 先看字符串中第一个字符是否匹配.如果单独这个字符还不够,就读入下一个字符,组成两个字符的字符串.如果还是没有发现匹配,惰性量词继续从
             字符串中添加字符直到发现匹配或者整个字符串都检查过也没有匹配.与贪婪量词的工作方式正好相反.
支配量词 只尝试匹配整个字符串.如果整个字符串不能产生匹配,不做进一步尝试.(IE不支持,Mozilla把支配量词当做贪婪的)

贪婪              惰性                  支配                 描述
?                   ??                    ?+                    零次或一次出现
*                   *?                     *+                    零次或多次出现
+                   +?                     ++                    一次或多次出现
{n}               {n}?                 {n}+               恰好n次出现
{n,m}           {n,m}?             {n,m}+            至少n次之多m次出现
{n,}             {n,}?               {n,}+              至少n次出现


7.3 复杂模式
1, 分组
分组是通过一系列括号包围一系列字符,字符类以及量词来使用的.
/(dog){2}/g       匹配dogdog
/{[bd]ad?}*/     匹配ba, da, bad, dad 等
去掉开头结尾的空白字符
String.prototype.trim = function(){
   //注意, 分组里面.*?一定要是惰性的,不然这个分组会把最后的空白字符也匹配进去
   var reExtraStr = /^\s+(.*?)\s+$/ ;
   return this.replace(reExtraStr,"$1");
}

2, 反向引用
在表达式计算完成之后,每个分组都被存放在一个特殊的地方以备将来使用.这些存储在分组中的特殊值,我们称之为反向引用( backreference).
反向引用是按照从左到右遇到的左括号字符的顺序进行创建和编号的.

反向引用的几种不同使用方法:
* 使用正则表达式对象的test(), exec()方法后,反向引用的值可以从RegExp对象的构造函数中获得
var toMarch = "#12345";
var regExp = /#(\d*)/;
regExp.exec(toMarch);
dwr(RegExp.$1);
* 还可以直接在定义分组的表达式中包含反向引用,这可以通过使用特殊转义序列如 \1 , \2 等实现.
var toMarch2 = "dogdog";
var regExp2 = /(dog)\1/;
dwr(regExp2.test(toMarch2));
* 反向引用可以用在String对象的replace()方法中
var toMarch3 = "123123123 3211231231";
var regExp3 = /(\d+)\s*(\d+)/;
var sNew = toMarch3.replace(regExp3,"$2 $1 "); //注意replace不改变原来的字符串,而是返回一个替换后的新字符串
dwr(sNew);

3, 候选
用一个管道符(| ),它放在两个单独的模式之间.
var toMarch4 = "dog";
var toMarch5 = "cat";
var regExp4 = /dog|cat/;
dwr(regExp4.test(toMarch4));//true
dwr(regExp4.test(toMarch5));//true

OR模式的一种通常用法是从用户输入中删除不合适的单词.
var userInput = "badWord1asdasdandBadWord2";
var toMarch6 = /badword1|badword2/gi;
var newStr = userInput.replace(toMarch6, function(march){
    return march.replace(/./g,"*");
});
dwr(newStr); //********asdasdand********

string.replace(regexp, replacement)
replacement 既可以是一个替换的字符串,也可以是一个function
如果是function的情况, 这个function会为每一个匹配执行一次,这个function的返回值作为最终替换的字符串.
传给function的第一个参数是第一个匹配的字符串;
第二个参数是匹配字符串在原始字符串中的位置;
第三个参数是原始字符串本身.

4, 非捕获性分组
创建反向引用的分组称为捕获性分组, 非捕获性分组不会创建反向引用.
在较长的正则表达式中存储反向引用会降低匹配的速度.
要创建非捕获性分组,只要在左括号后面紧跟一个问号和冒号.
var str = "#123456";
var regE = /#(?: 123456)/;
regE.test(str);
dwr(RegExp.$1); //""

//去除所有的HTML标签
String.prototype.skipHTML = function(){
   var regExp = /<(?:.|\s)*?>/g ;
   return this.replace(regExp,"");
}

5, 前瞻
表示当某个特定的字符分组出现在另一个字符串之前时才去捕获它.
前瞻分正向前瞻 和负向前瞻 , 正向前瞻检查的是接下来出现的是不是某个特定的字符集. 而负向前瞻则是检查接下来的不应该出现的特定字符集.
正向前瞻需要将模式放在(?= 和 ) 之间,注意这不是分组,虽然它也用到括号. 负向前瞻需要将模式放在(!= 和 ) 之间.
var toMarch1 = "bedroom";
var toMarch2 = "bedding";
var bedReg = /(bed(?=room))/;
dwr(bedReg.test(toMarch1)); //true
dwr(bedReg.exec(toMarch1)); //bed,bed 因此这个正则表达式返回的第一个匹配是bed,而不是bedroom,但是它只会去匹配后面跟着 room的bed,有点搞
dwr(RegExp.$1); //bed
dwr(bedReg.test(toMarch2)); //false

6, 边界
边界用于正则表达式中表示模式的位置.
^                    行开头
$                    行结尾
\b                  单词的边界
\B                  非单词的边界

查找一个出现在行尾的单词:
var toMarch3 = "Important word is the last one.";
var regExp3 = /(\w+)\.$/ ; //这边结合上面对贪婪量词的解释,有点不明白为何能匹配one?.
regExp3.test(toMarch3);
dwr(RegExp.$1);//one

查找一个出现在行首的单词:
var toMarch4 = "Important word is the last one.";
var regExp4 = /^(\w+)/ ; //或者var regExp4 = /^(.+?)\b/;
regExp4.test(toMarch4);
dwr(RegExp.$1);

抽取出所有的单词
var toMarch5 = "First Second Third Fourth Fifth Sixth";
var regExp5 = /\b(\S+?)\b/g ; //或者 /\b(\S+)\b/g 和 /(\w+)/g
var sArr = toMarch5.match(regExp5);
dwr(sArr);//First Second Third Fourth Fifth Sixth
注意这边如果用/(\w+?)/g 是不行的,这样得到的是一个一个的字母F,i,r,s,t,S...

==========================================================================================
与上面疑问类似的一个问题
例子代码,如下:
str = "abbb1234abbbaabbbaaabbb1234";
re = /.*bbb/g;
alert(str.match(re));    //结果为abbb1234abbbaabbbaaabbb
re = /.*?bbb/g;
alert(str.match(re));    //结果为abbb,1234abbb,aabbb,aaabbb
re = /a*bbb/g;
alert(str.match(re));    //结果为abbb,abbb,aabbb,aaabbb
re = /a*?bbb/g;
alert(str.match(re));    //结果为abbb,abbb,aabbb,aaabbb

对于第一、第二和第四个打印结果容易理解:
第一个str.match(re),贪婪量词先匹配整个字串,若不匹配去掉一个尾字符,继续匹配;
第二个str.match(re),惰性量词从第一个字符开始递加去匹配,直到匹配成功,清空字串,从下一个字符继续匹配。
第四个str.match(re),同第二个。

但第三个就不知道如何解释,如果按照第一个的方式去理解:
先匹配整个字串,发现不匹配,去掉尾字符,继续匹配...到最后,结果应该是abbb;
而其结果却为abbb,abbb,aabbb,aaabbb

以下为论坛解释
对于第三个正则,就是这样来执行的;
首先清楚了是用了简单量词(*),而我们知道了*是贪婪量词:
贪婪量词执行过程。正好楼主所说的那样。“先匹配整体,若不匹配则去掉尾字符继续匹配,直到成功或者结束”
这样说应说只能得到第一被匹配的对象。
javascript 中的match返回的是所有匹配。
对于要返回所有匹配。
它还有第二个步:就是匹配成功后, 从最近的一个匹配后的下一个字符开始重新贪婪模式匹配。 重新执行它的步骤;
例:
str = "abbb1234abbbaabbbaaabbb1234";
re = /a*bbb/g;
alert(str.match(re));

它的执行过程:
第一步:首先整个字符串("abbb1234abbbaabbbaaabbb1234")匹配,发现匹配不成功,
接着。删除最后一个字符("4"),成了("abbb1234abbbaabbbaaabbb123"),这样依次执行下去;
执行...最后, 发现("abbb")可以被匹配了..所以生成第一个匹配值。

但在这个match方法中是返回所有匹配。所以..
第二步:从最近的一个匹配(这里就是第一次匹配了)后的下一个字符开始重新贪婪模式匹配.得到字符串是
("1234abbbaabbbaaabbb1234"),然后。就按第一步执行。。

执行完第一步后。
然后就从最近一次(这里就是第二次匹配了)

....后面的过程就是重复一二步了。。

但第二步时若继续按正则/a*bbb/g 去匹配“1234abbbaabbbaaabbb1234” 的话,应该是匹配不到才对吧?
---------------------------------------------------
怎么匹配不到呢。。
正则表达式执行的时候。首先得找到前导字符(a), a是一个普通字符。普通字符,搜索的顺序为从左到右。。
所以搜索 “1234abbbaabbbaaabbb1234”字符串时,
得先匹配出a字符来"abbbaabbbaaabbb1234”,
而解析器又发现了a后面是一个贪婪字符。就按贪婪模式去匹配(从右到左)

注意: /a*bbb/g 用到了全局匹配, 以上分析的症结所在可能就是因为一个"g"
==========================================================================================

7, 多行模式
一下代码中的正则表达式想要匹配行末的一个单词.它只会匹配最后的Sixth, 但实际上这个字符串包含两个换行符,因此, Second, Fourth也应该匹配出来,因此引入了多行模式
var toMarch6 = "First Second\nThird Fourth\nFifth Sixth";
var regExp6 = /(\w+)$/g;
var sArr6 = toMarch6.match(regExp6);
dwr(sArr6);
要引入多行模式,需要在正则表达式后面添加m 选项, 这会让$边界匹配换行符(\n) 和字符串真正的结尾.
var regExp6 = /(\w+)$/gm;

判断日期的正则表达式:
function isValidDate(s){
    var reDate = /(?:[1-9]|0[1-9]|[12][0-9]|3[01])\/(?:[1-9]|0[1-9]|1[0-2])\/(?:19\d{2}|20\d{2})/;
    return reDate.test(s);
}
分享到:
评论

相关推荐

    常用java正则表达式

    如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一...

    正则表达式验证工具,正则表达式校验工具

    正则表达式验证工具 V1.0 本软件主要用于检测正则表达式是否正确。 运行环境:本软件为绿色软件,无需安装,但需要Microsoft .NET Framework 4 支持,如果没有请前去下载(下载路径:...

    学习正则表达式-Michael+Fitzgerald.pdf

    《学习正则表达式》从正则表达式的基本概念讲起,到编写完整的sed和Perl脚本,再到转换HTML文件,将这种强大的工具解释得清晰透彻。...《学习正则表达式》适合对正则表达式感兴趣的程序员和互联网从业者。

    《学习正则表达式》高清扫描版 PDF

    正物色一本学习正则表达式的入门图书?恭喜,《学习正则表达式》非常适合你!本书提供大量经典简洁的示例,从零开始教你逐步掌握正则表达式。通过匹配特定单词、字符和模式,读者很快就可以自己动手使用正则表达式...

    正则表达式验证正则表达式验证

    正则表达式正则表达式正则表达式正则表达式 验证程序

    正则表达式经典实例

    《正则表达式经典实例》讲解了基于8种常用的编程语言使用正则表达式的经典实例。书中提供了上百种可以在实战中使用的实例,以帮助读者使用正则表达式来处理数据和文本。对于如何使用正则表达式来解决性能不佳、误报...

    wps表格excel正则工具,excel正则表达式替换/匹配/查找/搜索/提取数字

    让 Office Excel、WPS 表格支持正则表达式的免费插件:「Excel 正则工具」顾名思义,需要使用 “正则表达式(PCRE)” 的知识来进行操作,对于完全没有接触过正则的朋友也许有一定的入门门槛,但正则实在是太过强大...

    csharp正则表达式参考手册

    正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 许多程序设计语言都支持利用...

    正则表达式整理汇总(参考学习)

    正则表达式整理汇总,含以下内容 [1]里面在包括一个正则表达式测试小程序 RegexTester.exe [2]正则表达式30分钟入门教程.pdf] [3]正则表达式规则.doc [4]正则表达式30分钟入门教程.mht 自己整理用的,现在...

    常用正则表达式 正则表达式

    常用正则表达式 正则表达式 常用正则表达式 正则表达式

    正则表达式大全 - 收集的最常用正则表达式

    常用正则表达式大全: 匹配中文字符的正则表达式 匹配空白行的正则表达式 匹配HTML标记的正则表达式 匹配Email地址的正则表达式 匹配网址URL的正则表达式 匹配国内电话号 匹配中国邮政编码 匹配身份证 匹配ip地址 ...

    java正则表达式.zip

    java,正则表达式,详解,java正则表达式,PDF

    ASP.NET 中的正则表达式

    Microsoft®.NET Framework 对正则表达式的支持是一流的,甚至在 Microsoft® ASP.NET 中也有依赖正则表达式语言的控件。本文介绍了深入学习正则表达式的基础知识和推荐内容。 本文主要面向对正则表达式知之甚少或...

    精通正则表达式(第3版)(含awz3 mobi epub)

    随着互联网的迅速发展,几乎所有工具软件和程序语言都支持的正则表达式也变得越来越强大和易于使用。本书是讲解正则表达式的经典之作。本书主要讲解了正则表达式的特性和流派、匹配原理、优化原则、实用诀窍以及调校...

    Java正则表达式 Java 正则表达式

    Java正则表达式Java正则表达式Java正则表达式Java正则表达式

    正则表达式(日期校验)

    正则表达式日期校验 正则表达式日期校验 正则表达式日期校验

    C语言正则表达式库

    C语言正则表达式库,兼容perl的正则表达式库,使用简介、方便

    正则表达式教程和配套测试工具regextester

    非常棒的正则表达式速成教程,号称30分钟叫你学会正则表达式常用用法。我本人学了一下,感觉不赖,不过俺比较笨,30分钟的东西学了3个多小时,已经从什么都不会变成会编各种复杂的正则筛选条件了^^!这个教程是配合...

    UE正则表达式、UE正则表达式

    UE正则表达式、UE正则表达式

    日期正则表达式(很实用)

    日期正则表达式(很实用) 日期正则表达式(很实用)日期正则表达式(很实用)日期正则表达式(很实用)

Global site tag (gtag.js) - Google Analytics