*:任意长度的任意字符
?:任意单个字符
[]:匹配指定范围内的任意单个字符
[abc], [a-m], [a-z], [A-Z], [0-9],[a-zA-Z], [0-9a-zA-Z]
[:space:]:空白字符
[:punct:]:标点符号
[:lower:]:小写字母
[:upper:]: 大写字母
[:alpha:]: 大小写字母
[:digit:]: 数字
[:alnum:]: 数字和大小写字母
一、文件名匹配
文件名匹配使得您不必一一写出名称,就可以指定多个文件。您将用到一些特殊的字符,称为通配符(wildcards)。
假设您想用'rm'命令删除目录下所有以字符串'.bak'结尾的文件。除了在'rm'后跟上所有文件名作为参数,您还可以用通配符'*':
rm *.bak
'*'可匹配一个或多个字符。在本例中,您告诉shell 将命令'rm'的参数扩展到"所有以'*.bak'结尾的文件",shell就将扩展后的参数告诉'rm'命令。
您将看到,shell 在命令执行前,就将读取并解释命令行。正是因为这个,您才可以将通配符用于shell 命令的参数中。
让我们更进一步地来认识通配符'*'。假定您有个目录,其中含文件'124.bak'、'346.bak'及'583.bak'。您想只保留文件'583.bak',可以用:
rm *4*.bak
shell 就将'*4*.bak'扩展成"所有含'4'并以'.bak'结尾的字符串"。
注意到 rm 4*.bak 无法工作,因为这匹配的是以'4'开头的文件。由于目录中没有这样的文件,shell 将这个模式扩展为空的字符串,故'rm'将返回出错信息:
rm: cannot remove `4*.bak': No such file or directory
如果您想保留文件'345.bak',而删除'124.bak'和'583.bak'。这看起来有些难度,因为被删文件的名称除了后缀其他都不同。但幸运的是,您可以用不含有来指定文件:
rm *[!6].bak
这将被读为:除了以'6.bak'结尾的文件,删除其他所有以'.bak'结尾的文件。您必须将取反号(negation sign)与取反字符(这里是 6)放到括号中,不然的话,shell 会将惊叹号(exclamation mark)解释成历史记录替换的开始(the beginning of a history substitution)。取反号在本篇介绍的所有匹配模式中都有效。
请注意:通配符'*'与取反号连用,很容易产生问题。猜猜
rm *[!6]*.bak
表示什么?这个命令将删除所有文件,甚至包括名称中包含'6'的文件。如果您将通配符'*'放到了取反号前面和后面,实际上取反号将失效,因为 shell 将其解释为"所有名称中任何位置都不含该字符的文件"。在我们的例子里,只有文件'666.bak'不符合该模式。
第二个通配符是问号(question mark):'?'。在匹配时,一个问号只能代表一个字符。为了示范其用途,我们在上例的假设中添加两个新文件:'311.bak~'和'some.text'。现在,列出所有在点号后有四个字符的文件:
ls *.????
问号通配符能够有效地避免上面提到的'取反号陷阱'(negation trap):
rm *[!4]?.*
将扩展成"所有除了点号前倒数第二个字符为'4'的文件",也就是只保留文件'346.bak'。
您可能会问,有没有其他匹配方式?到目前为止,您只看到了在指定位置匹配唯一字符的方法。但其实您也可以这样:
ls [13]*
将列出所有以字符'1'或'3'开头的文件;在我们的例子中,文件'124.bak'、'311.bak~'和'346.bak'匹配。注意到您必须用中括号将匹配的模式括起来,否则模式只匹配以字符串'13'开头的文件。
接下来,您将高兴地看到还可以定义匹配的范围:
ls *[3-8]?.*
将列出所有点号前倒数第二个字符落在'3'到'8'范围的文件。在我们的例子中,匹配的文件是'346.bak'和'583.bak'。
二、引用 shell 的特殊字符
但是,上面的那些机制存在一个缺点:shell总在命令执行前,试着进行扩展。有时候,会变得很棘手:
l 文件名包含特殊字符。假设您在那个目录中还有一个名为'!56.bak'的文件。下面试图进行模式匹配:rm !*rmrm: too few arguments
shell 将'!*'解释成历史记录的替换(加入前一个命令的所有参数),而不是匹配方式。
l 命令本身带特殊字符作参数。一些Linux 下的命令行工具,比如 (e)grep、sed、awk、find 及 locate ,都使用自己的正则表达式(regular expressions)。这些表达式与模式匹配看起来惊人地相似,但在某些地方又有所不同。
但为了使这些特殊命令生效,shell 就不能先将其当作模式匹配来解释:
find . -name [1-9]* -printfind: paths must precede expression
应该是:find . -name '[1-9]*' -print./346.bak./124.bak./583.bak./311.bak~
您可以通过反斜线(back slash)来引用特殊字符,比如 ! 、$ 、? 或空格:
ls /!*!56.bak
或者用(单)引号:
ls '!'*!56.bak
请注意,要看清楚引号应该放在什么位置。命令 ls '!*' 将查找名为'!*'的文件,这是由于通配符也在引号间,所以只能依照字面来解释。
三、输出重定向
Unix 的理念是汇集许多小程序,每个东东都有特殊的专长。复杂的任务不是由大型软件完成,而是运用 shell 的机制,组合许多小程序共同完成。重定向就在其中发挥着重要的作用。
1、在多个命令间重定向
这要通过管道(pipe),由管道符号|来标识。语法是:
command1 | command2 | command3 等等
这种格式您一定已经见到过了。管道经常将一个程序的输出送到'more'或'less'来阅读。
ls -l | less
其中,第一个命令提供目录内容,第二个则将其以翻页的方式显示。更复杂的例子如:
rpm -qa | grep ^x | less
第一个命令给出所有已安装的 RPM 包,第二个则将其过滤(filter:'grep'),只剩下以'^x'开头的包,第三个命令则将结果以翻页的方式显示。
2、重定向至文件
有时,您希望将命令的输出结果保存到文件中,或以文件内容作为命令的参数。这可以通过'>'和'<'来实现。
command > file
将 command 的输出保存到 file 中,这将覆盖 file 中的内容:
ls > dirlist
将当前目录的内容保存到'dirlist'文件。
command < file
将 file 内容作为 command 的输入:
sort < dirlist > sdirlist
将文件'dirlist'的内容送到命令'sort',然后再将排序后的结果送到文件'sdirlist'。当然,您也可以一步到位:
ls | sort > sdirlist
一种特殊的方式是'command 2> file'。这将 command 执行的出错信息送到 file 中。这个您到时候会需要……
另一种操作符是'>>',这将输出添加到已存在的文件中:
echo "string" >> file
将 string 加到文件 file 中。这是不打开文件而完成编辑的好办法!
但是,'<'和'>'操作符都有一个重要的限制:
command < file1 > file1
将删除 file1 的内容,而
command < file1 >> file1
却可以很好地工作,将加工过的 file1 内容加回到文件中。