软件开发培训班 >> 软件应用 >> 操作系统

linux awk 多文件操作2种实现方法

　　本文标签：awk,多文件操作

我们经常会将2个有关联文本文件进行合并处理。分别从不同文件获取需要的列，然后，整体输出到一起。awk进行多文件处理时候，常常会遇到2个方面问题，第一个是怎么样合并多个文件为一个文件。第二个问题就是怎么样将多行合并为一行显示。我这里说下我的处理2种方法，还有实现思路。

实例文本：

复制代码

代码如下:

[chengmo@centos5 shell]$ awk FNR==1{print "\r\n"FILENAME}{print $0} a.txt b.txt

a.txt
100 wang man
200 wangsan woman
300 wangming man
400 wangzheng man

b.txt
100 90 80
200 80 70
300 60 50
400 70 20

Kindle没干好的生意，让谁捡起来了?	Xperia 1 V成绝唱传索尼移动退出中国市场
画质便携俱佳摄影备机购买指南	未来5G都能干嘛呢，看看这十大应用场景

需要合并得到结果：

100     wang    man 90 80
200 wangsan woman 80    70
300 wangming man 60     50
400 wangzheng man 70    20

awk多文件操作方法一：

实现思路：

通过外部命令合并文件，然后通过排序，然后通过awk进行合并操作。

全球首位AI程序员诞生人类程序员会失业吗？	IE已死但网站只兼容IE？一招教你搞定特殊网站
华为Mate 20 Pro的这些小功能你有用到吗？	Intel老CPU运行Win11有救了：厂商更新BIOS实现支持

首先：

复制代码

代码如下:

[chengmo@centos5 shell]$ cat a.txt b.txt | sort -n -k1 |awk {print}
100 90 80
100 wang man
200 80 70
200 wangsan woman
300 60 50
300 wangming man
400 70 20
400 wangzheng man

现在需要把：第一列相同的处理合并到一行，这里需要用“next”语句。它操作，可以参考awk 多行合并【next 使用介绍】（常见应用4）

继续：

复制代码

代码如下:

[chengmo@centos5 shell]$ cat a.txt b.txt | sort -n -k1 |awk NR%2==1{fd1=$2"\t"$3;next}{print $0"\t"fd1}
100 wang man 90 80
200 wangsan woman 80 70
300 wangming man 60 50
400 wangzheng man 70 20

win8消费者预览版桌面水印怎么去除	快乐的Threads，终究干不过愤怒的推特？
windows 7下硬盘安装黑苹果Mac OS X图文教程	C盘容量不足一招解决

需要把几行合并，经常用到方法是：NR%num 然后将行值保存下来，next该行。在输出时候打印出来。

awk多文件操作方法二

实现思路

不借助第3放工具打开，直接通过awk 打开多个文件。然后可以通过：FILENAME获得当前处理文件名。NR总记录 FNR当前文件记录,以及ARGC传入参数总数，ARGV是数组，各个参数值。

看下这些实例：

复制代码

代码如下:

[chengmo@centos5 shell]$ awk BEGIN{print ARGC,ARGV[0],ARGV[1],ARGV[2]}{print FILENAME,NR,FNR,$0} a.txt b.txt
3 awk a.txt b.txt
a.txt 1 1 100 wang man
a.txt 2 2 200 wangsan woman
a.txt 3 3 300 wangming man
a.txt 4 4 400 wangzheng man
b.txt 5 1 100 90 80
b.txt 6 2 200 80 70
b.txt 7 3 300 60 50
b.txt 8 4 400 70 20

机械硬盘买64M缓存别买256M	京东采销：质疑李佳琦，成为李佳琦
网站seo百度搜索语法详解	手感是不是玄学？关于手感的二三事

程序代码：

复制代码

代码如下:

[chengmo@centos5 shell]$ awk
BEGIN{
if(ARGC<3)
{
exit 1;
}

file="";
}
{
aData[FILENAME,$1]=ARGV[1]==FILENAME?$0:$2"\t"$3;
}
END{
for(k in aData)
{
split(k,idx,SUBSEP);
if(idx[1]==ARGV[1] && (ARGV[2],idx[2]) in aData)
{
print aData[ARGV[1],idx[2]],aData[ARGV[2],idx[2]] | "sort -n -k1";
}
}
} a.txt b.txt

100 wang man 90 80
200 wangsan woman 80 70
300 wangming man 60 50
400 wangzheng man 70 20

代码说明：

这里用到2维数组，aData[文件名,关联列对应值] ,这种方法可以将多个文件内容。放入一个统一二维数组。然后循环数组，通过if((i,j} in array) 查找对应列值，在其它文件中是否存在。

以上是2种实现方法，其中第一种思路较为简单，很容易理解。第二种处理起来较为复杂。有更好方法大家给我分享。

技术文章快速查找

rteng7.exe - rteng7是什么进程有什么用

Win10助理Cortana增加新功能：可连接Xbox Live账户查看游戏信息

linux oracle 乱码 Linux环境Oracle显示乱码解决犯法

WIN2003服务器常用安全策略

养眼又实用的概念版个性Win8.2 图

详解Windows7系统使用中一些误区

Windows Server 2008 防火墙配置

winservsuit.exe是什么进程

在线教程导航

软件应用
·Windows8	·Windows7	·Word
·Excel	·PPT	·WPS
Web开发
·ASP	·JavaScript	·DIV+CSS
·JSP	·VbScript	·XML
·PHP
开发语言
·VB	·VC	·ASP.NET
·Java	·C++	·Delphi
数据库开发
·MySQL	·MsSQL	·Access
·Oracle	·DB2
手机系统
·Android	·iOS	·WindowsPhone
网站设计
·Flash	·Dreamweaver	·Fireworks
平面设计
·Photoshop	·CorelDraw	·AutoCAD
·3DsMAX	·Illustrator
网络技术
·网站运营	·网络安全	·网络搭建