linux学习日记九 正则表达式介绍 |
||||||||||||||||||||||||||||||||||||||||||||||
本文标签:正则表达式 正则表达式就是处理字符串的方法,它以行为单位来进行字符串的处理行为,正则表达式通过一些特殊符号的辅助,可以让用户轻易达到查找、删除、替换某特定字符串的处理程序 。 正则表达式基本上就是一种“表示法”,只要工具程序支持这种表示法,那么该工具程序就可以利用正则表达式处理字符串 。例如vi,grep,awk,sed等 。 正则表达式和之前的bash通配符是两个完全不同的东西,两者毫无关系,这个要注意下 。 # grep [-A] [-B] [--color=auto] ‘string’ filename -A:后面加数字,为after的意思,除了列出该行,后续的n行也列出 -B:before的意思,不解释 # dmesg | grep -n -A3 -B2 –color=auto ‘eth’ <== 内核信息 ====几个基本的正则式特殊符号====
====基础正则式====
====分析工具sed==== sed本身是一个管道命令,可以分析stdin数据 # sed [-nefr] [动作] -n:使用安静模式(silent),在一般模式下,所有来自stdin数据都显示出来,而-n后只显示被sed特殊处理的那一行 -e:直接在命令行模式上进行sed的动作编辑 -f:直接将sed动作写在一个文件内,-f filename 则可以执行filename内的sed动作 -r:sed的动作支持的是扩展型正则式语法(默认是基础型) -i:直接修改读取的文件内容,而不是由屏幕输出 动作说明:[n1[,n2]] function n1,n2:不见得存在,一般代表选择进行动作的行数,比如在10到20行间进行,则”10,20 [动作行为]‘ function的参数: a:新增,a的后面可以接字符串,而这些字符串会在新的一行出现(目前的下一行) c:替换,c的后面接字符串,这些字符串可以替换n1,n2之间的行 d:删除,后面不接任何参数 i:插入,i后面可接字符串,这些字符串会在新的一行出现(目前的上一行) p:打印,也就是将某个选择的数据打印出来 。通常p会与参数sed -n 一起运行 s:替换,就是直接进行替换工作,通常这个s的动作可以搭配正则式例如:1,29s/old/new/g就是 注:sed后面接的动作,需要用两个单引号”括住 。 # nl /etc/passwd | sed ’2,5d’ # nl /etc/passwd | sed ’3,$d’ 整行替换: # nl /etc/passwd | sed ’2,5c No 2-5 number’ # nl /etc/passwd | sed -n ’5,7p’ 这个等价于 : head -n 7 | tail -n 5 sed的查找并替换,跟vim的很类似: # sed ‘s/要被替换的字符串/新的字符串/g’ # nl /etc/passwd | sed ‘/^$/d’ <==删除空白行 ====扩展正则式==== ====好用的数据处理工具awk==== 相比于sed常常作用于一整行的处理,awk则运用于将一行分成数个字段来处理,适用于处理小型数据 # awk ‘条件类型1 {动作1} 条件类型2 {动作2} …’ filename # awk -n 5 | awk ‘{print $t “\t” $3}’ awk处理流程: 1,读入第一行,并将第一行的数据填入$0,$1,$2等变量中 2,依据条件类型限制,判断是否需要进行后面的动作 3,做完所有的动作与条件类型 4,若还有后续的行的数据,则重复上面的1'3的步骤,直到所有的数据都读完为止 awk的内置变量为: * NF :每一行($0)拥有的字段总数 * NR :目前awk所处理的是第几行数据 * FS :目前的分隔符,默认是空格键 # last -n 5 | awk ‘{print $1 “\t lines: ” NR “\t columns: ” NF}’ # cat /etc/passwd | awk ‘BEGIN {FS=”:”} $3 < 10 {print $1 “\t ” $3}’ ====文件的比较命令diff==== # diff [-bBi] original_file new_file -b:忽略一行中仅有多个空白的区别 -B:忽略空白行的区别 -i:忽略大小写的不同 ====补丁命令patch==== 先用diff命令生成补丁文件: # diff -Naur passwd.old passwd.new > paswd.patch # patch -pN < patch_file <==更新 # patch -R -pN < patch_file <== 还原 -p:后面的N表示取消基层目录的意思 -R:代表还原,将新的文件还原成原本的旧的版本 再开始把旧文件升级到新版本: # patch -p0 < passwd.patch 把新版本还原: # patch -R -p0 < passwd.patch 打印命令pr…. ============END=============== |