<< Back to man.ChinaUnix.net

USR_27

*usr_27.txt*    For Vim version 6.3.    最近更新:2005年3月

                     VIM 用户手册 - Bram Moolenaar 著
                  译者: Chimin Yen http://vimcdoc.sf.net

                             查找命令及模式


在第三章里,我们曾经提到过几个简单的查找模式 |03.9|。Vim 能够胜任复杂得多的查
找。本章将解释那些最常用到的模式。详细的说明可以查阅: |pattern|

|27.1|  忽略大小写
|27.2|  在文件尾折返
|27.3|  偏移
|27.4|  匹配重复性模式
|27.5|  多择一
|27.6|  字符域
|27.7|  字符类
|27.8|  匹配换行符
|27.9|  举例

       下一章: |usr_28.txt|  折叠
       前一章: |usr_26.txt|  重复
         目录: |usr_toc.txt|


*27.1*  忽略大小写

默认情况下,Vim 的查找是大小写敏感的。因此,"include","INCLUDE",和 "Include"
为三个各不相同的词,而一次查找将仅仅匹配其中的一个。
   现在设定 'ignorecase' 选项:

        :set ignorecase

再查找 "include",现在它将匹配 "Include","INCLUDE" 和 "InClUDe"。(设定
'hlsearch' 选项可以快速查看哪儿有模式的匹配。)
   你可以这样撤销这个选项:

        :set noignorecase

但是我们且保留这个设定,并查找 "INCLUDE"。它匹配的文本就跟查找 "include" 时
一模一样。现在我们设定 'smartcase' 选项:

        :set ignorecase smartcase

如果你采用的模式里至少有一个大写字母,查找就成了大小写敏感的。可以这样理解,你
不必键入大写字母,也能查找到含有大写字母的词,所以,你若键入大写字母,必然是因
为你要大小写敏感的匹配。聪明!
    设定了这两个选项,你会找到以下匹配:

        模式                  匹配  
        word                    word,Word,WORD,WoRd,等。
        Word                    Word
        WORD                    WORD
        WoRd                    WoRd


单 个 模 式 里 的 大 小 写

如果你仅想忽略一个特定的模式里的大小写,那么,在模式前添加 "\c" 字符串就行了。
添加 "\C" 将使该模式的匹配大小写敏感。这排除了 'ignorecase' 和 'smartcase'
选项的影响,当 "\c" 或 "\C" 起作用时,它们设成什么值无关紧要。

        模式                  匹配  
        \Cword                  word
        \CWord                  Word
        \cword                  word,Word,WORD,WoRd,等。
        \cWord                  word,Word,WORD,WoRd,等。

采用 "\c" 和 "\C"
的好处在于它粘附在所用的模式上。因此,重复查找历史记录里的某个模式会产生同样
的结果。'ignorecase' 或 'smartcase' 是否更改部影响结果。

        备注:
        在查找模式中使用以 "\" 开头的项,其效果取决于 'magic' 选项。在本章中,
        我们将假定 'magic' 为真。这也是标准和建议的设定。如果你把它改了,
        那么,许多查找模式就会突然变得无效了。

        备注:
        如果你查了好久,超过了你预计的时间,你可以中断查找,在 Unix 上用
        CTRL-C,而在 MS-DOS 和微软视窗上则用 CTRL-Break

*27.2*  在文件尾折返

在默认情况下,正向查找从当前光标位置开始,查找特定的字符串。然后它就遇到了文
件尾。如果那个时候还没找到那个字符串,它就从头来过,从文件开头一直查到光标处。
   记住,当你不断以 "n" 命令查找下一个匹配时,你最终回到第一个匹配。如果你不
注意,你将永远找下去! 为了提醒你,Vim 显示如下信息:

        search hit BOTTOM,continuing at TOP 

如果你使用 "?" 命令按相反方向查找,你得到的信息是这样的:

        search hit TOP,continuing at BOTTOM 

可是,你还是不知道你何时回到了第一个匹配。一种办法是设定 'ruler' 选项:

        :set ruler

Vim 将把光标位置显示在窗口的右下角 (如果使用了状态条的话,会显示在那里)。看起
来像这样:

        101,29       84% 

第一个数字是光标所在的行号。在你开始查找的时候记住行号,那样你就能检查是否越
过了该位置。


无 折 返 查 找

要取消查找折返功能,请用以下命令:

        :set nowrapscan

现在当查找遇到文件末尾,一个出错信息就会显示出来:

        E385: search hit BOTTOM without match for: forever 

这样,你只要用 "gg" 命令回到文件开头,并一直查到你看到以上信息,你就能找到所
有的匹配。
   如果你用 "?" 从相反方向查找,你将得到:

        E384: search hit TOP without match for: forever 


*27.3*  偏移

在默认情况下,查找命令让光标停留在匹配的模式的开始。你可以指定一个偏移,告诉
Vim 将光标停留在别的位置上。在正向查找命令 "/" 中指定偏移,就是在模式后面附加
一个斜线符 (/) 以及偏移值:

        /默认/2

这个命令查找模式 "默认"。找到后使光标越过匹配的模式而前移两行,并停留在该行的
行首。把这个命令用于以上段落中,Vim 在第一行找到词 "默认"。接着光标再往下移两行,
落在 "一个" 的 "一" 上。

如果该偏移为一简单数字,那么光标就会被放置在距离匹配那么多行的那一行的行首。
该偏移值可为正数或负数。如果它是正数,光标会向前移该数表示的行; 若为负数,则往
回退该数表示的行。


字 符 偏 移

偏移符 "e" 表示一个偏移从匹配末尾算起。它把光标移到匹配的最后一个字符上。命令:

        /const/e

把光标放到单词 "const" 的 "t" 上。
   加一个数字,光标就从该位置再前移该数字指定的那么多个字符。下面这个命令会将
光标移到匹配后面第一个字符:

        /const/e+1

一个正数使光标右移,负数使其左移。例如:

        /const/e-1

会把光标移到单词 "const" 的 "s" 字符上。

如果偏移以 "b" 开头,那么光标就移到匹配模式的首位。因为不用 "b" 光标也一样会被
移到首位,所以单独使用时没什么意义。在将它与一个加上或减去的数字合起来时,就很
有用了。光标就会前移或后移那么多个字符。例如:

        /const/b+2

会把光标移到匹配的首位,再往右移两个字符。因而落在字符 "n" 上。


重 复

当你重复前一次使用过的查找模式,只是偏移不同时,你可以把模式省略了:

        /that
        //e

等于:

        /that/e

再以同样的偏移重复查找:

        /

命令 "n" 具有同样的作用。要取消一个以前用过的偏移可以用:

        //


反 向 查 找

命令 "?" 以相同的方式使用偏移,但你必须以 "?" 来分隔模式和偏移,而非 "/":

        ?const?e-2

偏移符 "b" 和 "e" 的用途是一样的。它们并不因为使用了 "?" 而改变方向。


起 始 位 置

查找时,通常从光标位置开始。当你规定的是一个行偏移,这可能造成麻烦。例如:

        /const/-2

这个命令找到下一个单词 "const",然后上移两行。如果你用命令 "n" 再找,Vim 就
从当前位置开始,找到同一个 "const" 匹配。然后再一次在偏移的作用下,回到开始
的地方。你给套住了!
   还有比这更糟糕的: 假定下一行另有一个 "const" 匹配。那么,重复正向查找就会
找到这个匹配,并上移两行。这样你实际上把光标往回移了!

当你规定的是一个字符偏移,Vim 将为其作调整。因此,查找会向前或向后跳过几个字
符再开始,以便同一个匹配不至于再出现。


*27.4*  匹配重复性模式

星号项 "*" 规定在它前面的项可以重复任意次。因此:

        /a*

匹配 "a","aa","aaa",等等。但也匹配 "" (空字串),因为零次也包含在内。
   星号 "*" 仅仅应用于那个紧邻在它前面的项。因此 "ab*" 匹配 "a","ab","abb",
"abbb",等等。如要多次重复整个字符串,那么该字符串必须被组成一个项。组成一项的
方法就是在它前面加 "\(",后面加 "\)"。因此这个命令:

        /\(ab\)*

匹配: "ab","abab","ababab",等等。而且也匹配 ""。

要避免匹配空字串,使用 "\+"。这表示前面一项可以被匹配一次或多次。

        /ab\+

匹配 "ab","abb","abbb",等等。它不匹配 后面没有跟随 "b" 的 "a"。

要匹配一个可选项,用 "\="。 例如:

        /folders\=

匹配 "folder" 和 "folders"。


指 定 重 复 次 数

要匹配某一项的特定次数重复,使用 "\{n,m}" 这样的形式。其中 "n" 和 "m" 都是数字。
在它前面的那个项将被重复 "n" 到 "m" 次 (|inclusive| 包含 "n" 和 "m")。例如:

        /ab\{3,5}

匹配 "abbb","abbbb" 以及 "abbbbb"。
  当 "n" 省略时,被默认为零。当 "m" 省略时,被默认为无限大。当 ",m" 省略
时,就表示重复正好 "n" 次。例如:

        模式          匹配次数 
        \{,4}           0,1,2,3 或 4
        \{3,}           3,4,5,等等
        \{0,1}          0 或 1,同 \=
        \{0,}           0 或 更多,同 *
        \{1,}           1 或 更多,同 \+
        \{3}            3


匹配尽可能少的字符

迄今为止,我们所讨论过的都试图匹配尽可能多的字符。若要匹配尽可能少的字符,请
用 "\{-n,m}"。它的用法跟 "\{n,m}" 一样,唯一的区别在于,它采用尽可能少的字符。
   例如,以下命令:

        /ab\{-1,3}

将匹配 "abbb" 中的 "ab"。实际上,因为没理由匹配更多,所以它永远不会匹配超过
一个 b。它需要其它的来强制它超过其下限规定次数,而匹配更多的重复。
   这些同样的规则也适用于省略 "n" 和 "m" 的情形。甚至可以把两个都省略,只剩
"\{-}"。这个项匹配其前项的重复,重复次数尽可能少,可以等于或大于零。这个项如
单独使用,则总是匹配前项的零次重复。当它跟与其它的模式合起来时,用处就大了。
例如:

        /a.\{-}b

这个命令匹配 "axbxb" 中的 "axb"。如果采用了下面这个模式:

        /a.*b

由于 ".*" 匹配尽可能多的字符,整个 "axbxb" 都会被匹配。


*27.5*  多择一

在一个查找模式中,"或" 运算符是 "\|"。例如:

        /foo\|bar

这个命令匹配了 "foo" 或 "bar"。更多的抉择可以连在后面:

        /one\|two\|three

匹配 "one","two" 或 "three"。
   如要匹配其多次重复,那么整个抉择结构须置于 "\(" 和 "\)" 之间:

        /\(foo\|bar\)\+

这个命令匹配 "foo","foobar","foofoo","barfoobar",等等。
   再举个例子:

        /end\(if\|while\|for\)

这个命令匹配 "endif","endwhile" 和 "endfor"。

一个与此相关的项是 "\&"。它要求两个抉择都与同一位置的文本相符。而最终匹配的则
是最后面的那个抉择。例如:

        /forever\&...

这个命令匹配 "forever" 中的 "for" (译者: 因为第二抉择要求三个字符)。它将不匹
配,比如说 "fortuin" (译者: 不符合第一抉择)。


*27.6*  字符域

你可以用 "/a\|b\|c" 来匹配 "a","b" 或 "c"。当你需要匹配自 "a" 至 "z" 所有的
字母时,以这样的方式表达就嫌长了。这里有个比较简短的表达方式:

        /[a-z]

方括号结构 [] 匹配单个字符。你在括号内指定哪些字符可以匹配。你可以把一系列字
符包含在内,像这样:

        /[0123456789abcdef]

这个命令将匹配其中的任何一个字符。你可以为一系列连续字符规定一个字符域。"0-3"
表示 "0123"。"w-z" 表示 "wxyz"。因此,上面那个命令可以缩短为:

        /[0-9a-f]

若要匹配字符 "-" 本身,就得把它放在字符域的第一或最后的位置上。Vim 会识别下面这
些特殊字符,以便在 [] 字符域里使用它们较为方便 (它们实际上可被用于任何查找模
式的任何地方):

        \e      <Esc>
        \t      <Tab>
        \r      <CR>
        \b      <BS>

还有若干特殊场合用得上 [] 字符域,参阅 |/[]| 以了解全部用法。


补 域

为了避免匹配到一个特定的字符,在字符域首位使用 "^"。这样方括号项 [] 就会匹配
任何括号内不包括的字符。例如:

        /"[^"]*"

         "        双引号
          [^"]    双引号以外的任何字符
              *   尽可能多个
               "  又一个双引号

这个命令匹配 "foo" 和 "3!x",包含双引号在内。


预 定 义 的 域

有些字符域使用得很频繁。Vim 为这些字符域提供了一些捷径。例如:

        /\a

这个命令找寻字母字符。这相当于使用 "/[a-zA-Z]"。下面还有几个这样的字符域:

        项     匹配                  相当于 
        \d      数码                  [0-9]
        \D      非数码                       [^0-9]
        \x      十六进制数         [0-9a-fA-F]
        \X      非十六进制数              [^0-9a-fA-F]
        \s      空白字符            [       ]     (<Tab><Space>)
        \S      非空白字符         [^      ]     (非 <Tab><Space>)
        \l      小写字母            [a-z]
        \L      非小写字母         [^a-z]
        \u      大写字母            [A-Z]
        \U      非大写字母         [^A-Z]

        备注:
        使用这些预定义的字符域要比使用它们所表示的那个字符域快很多。
        这些项不能用于 [] 方括号内。因此 "[\d\l]" 不能用来匹配一个数字或一个
        小写字母。请换用 "\(\d\|\l\)"。

|/\s| 包括一个这类域的完整的列表。


*27.7*  字符类

一个特定的字符域匹配一组固定的字符。一个字符类与字符域相似,不过有个本质的区
别: 一个字符类代表的那组字符可以重新定义而无须改动查找模式。
   例如,查找这个模式:

        /\f\+

其中 "\f" 项表示文件名字符。因而这个命令匹配一个由可用作文件名的字符字符组成
的序列。
   哪些字符可以用来组成文件名取决于你所使用的系统。在微软视窗上,反斜线符可
以,而在 Unix 上却不行。文件名字符由 'isfname' 选项来规定。在 Unix
上,该选项的默认值为:

        :set isfname
        isfname=@,48-57,/,.,-,_,+,,,#,$,%,~,=

在其它系统上,其默认值各不相同。因此你可以用 "\f" 组成一个查找模式,以匹配一
个文件名。该查找模式将自动调整以适应你所使用的系统。

        备注:
        实际上,Unix 允许在文件名里使用几乎所有的字符,包括空格字符。把这些字
        符包括在 'isfname' 里,在理论上是没错的。但那样就无法在文本中发现一个
        文件名在哪儿结束。因此选项 'isfname' 的默认值是个折衷方案。

字符类有如下这些:

        项     匹配                          选项 
        \i      标识符字符                 'isident'
        \I      类似于 \i,但不包括数字
        \k      关键词字符                 'iskeyword'
        \K      类似于 \k,但不包括数字
        \p      可打印字符                 'isprint'
        \P      类似于 \p,但不包括数字
        \f      文件名字符                 'isfname'
        \F      类似于 \f,但不包括数字


*27.8*  匹配换行符

Vim 能找寻含有换行符的模式。你需要指定换行符在哪儿出现,因为迄今为止所有我们
曾经提到过的项,都不匹配换行符。
   用 "\n" 项可以在一个特定的位置查验一个换行符:

        /the\nword

这个命令将在一行以 "the" 结尾,而下一行以 "word" 开头的地方找到匹配。如果还
要匹配 "the word",那么你需要匹配一个空格或一个换行符。这可以用 "\_s" 表示:

        /the\_sword

若要允许任意数量的空格:

        /the\_s\+word

这个命令也匹配 "the  " 在行尾,及 "   word" 在下一行行首的情形。

"\s" 匹配空格字符,"\_s" 匹配空格字符或一个换行符。同理,"\a" 匹配一个字母字
符,而 "\_a" 匹配一个字母字符或一个换行符。其它字符类和字符域都可以通过插入一
个 "_" 来更改其范围。

很多别的项也可以在前面加 "\_" 以匹配一个换行符。例如: "\_." 匹配任意字符或一
个换行符。

        备注:
        "\_.*" 匹配任何字符,直至文件结束。要小心,它会使查找命令执行得非常缓慢。

另一个例子是 "\_[]",一个包含了换行符的字符域:

        /"\_[^"]*"

这个命令找寻位于一对双引号之间,可能分隔成数行的文本。


*27.9*  举例

这儿有几个查找模式,你也许会觉得有用。本节向你演示如何综合使用前面提及的那些
用法。


寻 找 一 个 加 州 驾 驶 牌 照

有一个驾驶牌照号码为 "1MGU103"。它有一个数字,三个大写字母,然后三位数字。直
接把这个号码放入查找模式:

        /\d\u\u\u\d\d\d

另一种方法是用一个计数器来指定其中有三个数字和三个字母:

        /\d\u\{3}\d\{3}

换用 [] 字符域方法:

        /[0-9][A-Z]\{3}[0-9]\{3}

这些方法之中你应该使用哪一种? 挑那种你记得住的。你记得住的简单方法要比你记不
住的华丽方法快得多。如果你能把它们都记住,那么避免使用最后那种,因为它要打的
字多,而且执行起来慢。


寻 找 一 个 标 识 符

在 C 程序里 (以及其它很多计算机程序) 一个标识符以字母开头,其余部分由字母和数
字组成。下划线字符也可以。这样一个标识符可以用下面的命令找到:

        /\<\h\w*\>

"\<" 和 "\>" 用来寻找那些完整的词。"\h" 表示 "[A-Za-z_]",而 "\w" 则表示
 [0-9A-Za-z_]"。

        备注:
        "\<" 和 "\>" 取决于 'iskeyword' 选项。如果这个选项包括 "-" 的话,那么
         "ident-" 就不匹配了。在这种情况下,请用:

                /\w\@<!\h\w*\w\@!

        这个命令查验是否 "\w" 不匹配标识符之前或之后的字符。
        参见 |/\@<!| 和 |/\@!|。


下一章: |usr_28.txt|  折叠

版权: 参见 |manual-copyright|  vim:tw=78:ts=8:ft=help:norl:

Generated by vim2html on Wed Mar 2 23:09:27 GMT 2005