您的位置 首页 知识

linux awk命令详解(shell awk命令详解)

awk命令详解?

WK 数据过滤工具 (类似于grep,比grep强大)

Awk编程语言/数据处理引擎

创造者:Aho、Weinberger、Kernighan

基于模式匹配检查输入文本,逐行处理并输出

通常用在Shell脚本中,获取指定的数据,单独使用时,可对文本数据做统计

# which awk

# rpm -qf /bin/awk

语法格式:

格式1:前置命令 | awk [选项] ‘条件{编辑指令}’

格式2:awk [选项] ‘条件{编辑指令}’ 文件…

编辑指令如果包含多条语句时,可以用分号分隔,处理文本时,若未指定分隔符,则默认将空格、制表符等作为分隔符。print是最常见的指令。

awk查找指定行指定列的数据并输出到文件?

awk指定读取文件中的某一行的某个字段

awk 可以设置条件来输出文件中m行到n行中每行的指定的k字段,使用格式如下

awk ‘NR==m,NR==n {print $k}’ path/filename

m,n,k表示实在的数值。如果要用变量来表示m,n的值,则变量需要用单引号将其引起来。

NR,{print }是awk命令在此用法下的规定字段;path/filename表示读取文件的路径及文件名。

当要读取某一行的内容的k字段时,使用格式如下

awk ‘NR==m {print $k}’ path/filename

m,k与以上的含义一致,分别表示要读取的行数和当前行的第k字段。

awk命令中的FNR是什么意思?

FNR,表示awk开始执行程序后所读取的数据行数.不同的是awk每打开一个新文件,FNR便从0重新累计.# awk ‘{print FNR,$0}’ file1 file21 a b c d2 a b d c3 a c b d1 aa bb cc dd2 aa bb dd cc3 aa cc bb dd

awk命令怎么抓取关键字所在的一列?

例如行

a b key c d

awk 默认用空格来分割内容,上面内容被分为5部分

其中第3部分就是Key,例如

echo “a b key c d”|awk ‘{print $3}’

输出第3列。

如果分隔字符不是空白,可以用awk -F指定另外的字符。

awk命令使用哪个变量存储行号?

awk会使用内置位置变量来存储各个字段的值;这些变量就是$1,$2,$3,…$N;由换行符分隔的数据中的每一行,就是一个记录;在awk处理数据的时候,使用$0保存整行的内容

linux中awk命令详解?

AWK 是一种处理文本文件的语言,是一个强大的文本分析工具。

之所以叫 AWK 是因为其取了三位创始人 Alfred Aho,Peter Weinberger, 和 Brian Kernighan 的 Family Name 的首字符。

语法

awk [选项参数] ‘script’ var=value file(s)

awk [选项参数] -f scriptfile var=value file(s)

选项参数说明:

-F fs or –field-separator fs

指定输入文件折分隔符,fs是一个字符串或者是一个正则表达式,如-F:。

-v var=value or –asign var=value

赋值一个用户定义变量。

-f scripfile or –file scriptfile

从脚本文件中读取awk命令。

-mf nnn and -mr nnn

对nnn值设置内在限制,-mf选项限制分配给nnn的最大块数目;-mr选项限制记录的最大数目。这两个功能是Bell实验室版awk的扩展功能,在标准awk中不适用。

-W compact or –compat, -W traditional or –traditional

在兼容模式下运行awk。所以gawk的行为和标准的awk完全一样,所有的awk扩展都被忽略。

-W copyleft or –copyleft, -W copyright or –copyright

打印简短的版权信息。

-W help or –help, -W usage or –usage

打印全部awk选项和每个选项的简短说明。

-W lint or –lint

打印不能向传统unix平台移植的结构的警告。

-W lint-old or –lint-old

打印关于不能向传统unix平台移植的结构的警告。

-W posix

打开兼容模式。但有以下限制,不识别:/x、函数关键字、func、换码序列以及当fs是一个空格时,将新行作为一个域分隔符;操作符**和**=不能代替^和^=;fflush无效。

-W re-interval or –re-inerval

允许间隔正则表达式的使用,参考(grep中的Posix字符类),如括号表达式[[:alpha:]]。

-W source program-text or –source program-text

使用program-text作为源代码,可与-f命令混用。

-W version or –version

打印bug报告信息的版本。