*:任意长度的任意字符

?:任意单个字符

[]:匹配指定范围内的任意单个字符

     [abc], [a-m], [a-z], [A-Z], [0-9],[a-zA-Z], [0-9a-zA-Z]

     [:space:]:空白字符

     [:punct:]:标点符号

     [:lower:]:小写字母

     [:upper:]: 大写字母

     [:alpha:]: 大小写字母

     [:digit:]: 数字

     [:alnum:]: 数字和大小写字母

    

一、文件名匹配

文件名匹配使得您不必一一写出名称,就可以指定多个文件。您将用到一些特殊的字符,称为通配符(wildcards)。

假设您想用'rm'命令删除目录下所有以字符串'.bak'结尾的文件。除了在'rm'后跟上所有文件名作为参数,您还可以用通配符'*':

rm *.bak

 

'*'可匹配一个或多个字符。在本例中,您告诉shell 将命令'rm'的参数扩展到"所有以'*.bak'结尾的文件",shell就将扩展后的参数告诉'rm'命令。

您将看到,shell 在命令执行前,就将读取并解释命令行。正是因为这个,您才可以将通配符用于shell 命令的参数中。

让我们更进一步地来认识通配符'*'。假定您有个目录,其中含文件'124.bak'、'346.bak'及'583.bak'。您想只保留文件'583.bak',可以用:

rm *4*.bak

 

shell 就将'*4*.bak'扩展成"所有含'4'并以'.bak'结尾的字符串"。

注意到 rm 4*.bak 无法工作,因为这匹配的是以'4'开头的文件。由于目录中没有这样的文件,shell 将这个模式扩展为空的字符串,故'rm'将返回出错信息:

rm: cannot remove `4*.bak': No such file or directory

 

如果您想保留文件'345.bak',而删除'124.bak'和'583.bak'。这看起来有些难度,因为被删文件的名称除了后缀其他都不同。但幸运的是,您可以用不含有来指定文件:

rm *[!6].bak

 

这将被读为:除了以'6.bak'结尾的文件,删除其他所有以'.bak'结尾的文件。您必须将取反号(negation sign)与取反字符(这里是 6)放到括号中,不然的话,shell 会将惊叹号(exclamation mark)解释成历史记录替换的开始(the beginning of a history substitution)。取反号在本篇介绍的所有匹配模式中都有效。

请注意:通配符'*'与取反号连用,很容易产生问题。猜猜

rm *[!6]*.bak

表示什么?这个命令将删除所有文件,甚至包括名称中包含'6'的文件。如果您将通配符'*'放到了取反号前面和后面,实际上取反号将失效,因为 shell 将其解释为"所有名称中任何位置都不含该字符的文件"。在我们的例子里,只有文件'666.bak'不符合该模式。

第二个通配符是问号(question mark):'?'。在匹配时,一个问号只能代表一个字符。为了示范其用途,我们在上例的假设中添加两个新文件:'311.bak~'和'some.text'。现在,列出所有在点号后有四个字符的文件:

ls *.????

 

问号通配符能够有效地避免上面提到的'取反号陷阱'(negation trap):

rm *[!4]?.*

 

将扩展成"所有除了点号前倒数第二个字符为'4'的文件",也就是只保留文件'346.bak'。

您可能会问,有没有其他匹配方式?到目前为止,您只看到了在指定位置匹配唯一字符的方法。但其实您也可以这样:

ls [13]*

 

将列出所有以字符'1'或'3'开头的文件;在我们的例子中,文件'124.bak'、'311.bak~'和'346.bak'匹配。注意到您必须用中括号将匹配的模式括起来,否则模式只匹配以字符串'13'开头的文件。

接下来,您将高兴地看到还可以定义匹配的范围:

ls *[3-8]?.*

 

将列出所有点号前倒数第二个字符落在'3'到'8'范围的文件。在我们的例子中,匹配的文件是'346.bak'和'583.bak'。

二、引用 shell 的特殊字符

但是,上面的那些机制存在一个缺点:shell总在命令执行前,试着进行扩展。有时候,会变得很棘手:

l 文件名包含特殊字符。假设您在那个目录中还有一个名为'!56.bak'的文件。下面试图进行模式匹配:
rm !*
rm
rm: too few arguments

 

shell 将'!*'解释成历史记录的替换(加入前一个命令的所有参数),而不是匹配方式。

l 命令本身带特殊字符作参数。一些Linux 下的命令行工具,比如 (e)grep、sed、awk、find 及 locate ,都使用自己的正则表达式(regular expressions)。这些表达式与模式匹配看起来惊人地相似,但在某些地方又有所不同。

但为了使这些特殊命令生效,shell 就不能先将其当作模式匹配来解释:

find . -name [1-9]* -print
find: paths must precede expression

应该是:
find . -name '[1-9]*' -print
./346.bak
./124.bak
./583.bak
./311.bak~

 

您可以通过反斜线(back slash)来引用特殊字符,比如 ! 、$ 、? 或空格:

ls /!*
!56.bak

 

或者用(单)引号:

ls '!'*
!56.bak

 

请注意,要看清楚引号应该放在什么位置。命令 ls '!*' 将查找名为'!*'的文件,这是由于通配符也在引号间,所以只能依照字面来解释。

三、输出重定向

Unix 的理念是汇集许多小程序,每个东东都有特殊的专长。复杂的任务不是由大型软件完成,而是运用 shell 的机制,组合许多小程序共同完成。重定向就在其中发挥着重要的作用。

1、在多个命令间重定向

这要通过管道(pipe),由管道符号|来标识。语法是:

command1 | command2 | command3 等等

 

这种格式您一定已经见到过了。管道经常将一个程序的输出送到'more'或'less'来阅读。

ls -l | less

 

其中,第一个命令提供目录内容,第二个则将其以翻页的方式显示。更复杂的例子如:

rpm -qa | grep ^x | less

 

第一个命令给出所有已安装的 RPM 包,第二个则将其过滤(filter:'grep'),只剩下以'^x'开头的包,第三个命令则将结果以翻页的方式显示。

2、重定向至文件

有时,您希望将命令的输出结果保存到文件中,或以文件内容作为命令的参数。这可以通过'>'和'<'来实现。

command > file

 

将 command 的输出保存到 file 中,这将覆盖 file 中的内容:

ls > dirlist

 

将当前目录的内容保存到'dirlist'文件。

command < file

 

将 file 内容作为 command 的输入:

sort < dirlist > sdirlist

 

将文件'dirlist'的内容送到命令'sort',然后再将排序后的结果送到文件'sdirlist'。当然,您也可以一步到位:

ls | sort > sdirlist

 

一种特殊的方式是'command 2> file'。这将 command 执行的出错信息送到 file 中。这个您到时候会需要……

另一种操作符是'>>',这将输出添加到已存在的文件中:

echo "string" >> file

 

将 string 加到文件 file 中。这是不打开文件而完成编辑的好办法!

但是,'<'和'>'操作符都有一个重要的限制:

command < file1 > file1

 

将删除 file1 的内容,而

command < file1 >> file1

 

却可以很好地工作,将加工过的 file1 内容加回到文件中。