100% 実践 awk

------------------------------------------------------------------------------- $ ps -ef | grep hashi hashi 6848 6687 0 12:18:22 pts/2 0:00 vi /doc/md5.html hashi 6687 6685 0 11:10:31 pts/2 0:00 -bash hashi 6680 6678 0 11:01:31 pts/1 0:00 -bash -------------------------------------------------------------------------------

------------------------------------------------------------------------------- $ ps -ef | grep hashi | awk '{print ">>" $2 "<<"}' >>6848<< >>6687<< >>6680<< -------------------------------------------------------------------------------

------------------------------------------------------------------------------- $ ps -ef | grep hashi | awk '{print "kill -9 " $2}' | sh -------------------------------------------------------------------------------

------------------------------------------------------------------------------- $ ps -ef | grep hashi | awk 'BEGIN{print "♪橋村のプロセス番号一覧"}{print $2}END{print "以上。"}' ♪橋村のプロセス番号一覧 6848 6687 6680 以上。 -------------------------------------------------------------------------------

------------------------------------------------------------------------------- $ cat topdomain5.txt com,12140747,15479017,3338270,868016,5993551,Commercial net,8856687,9383201,526514,64423,2926036,Networks edu,5022815,5228251,205436,3600,1678553,Educational jp,1687534,1718935,31401,97,38979,Japan us,1562391,1642418,80027,75,3118,United States -------------------------------------------------------------------------------

------------------------------------------------------------------------------- $ ls -alp | grep -v / 合計 14 -rw-r--r-- 1 hashi users 2251 3月 2日 14:49 form.c -rw-r--r-- 1 hashi users 601 3月 2日 13:34 tmp.c -------------------------------------------------------------------------------

------------------------------------------------------------------------------- $ ls -alp | grep -v / | awk '{capa+=$5}END{capa/=1024; print "total=" capa "Kbyte";}' total=2.78516Kbyte -------------------------------------------------------------------------------

------------------------------------------------------------------------------- $ cat /etc/hosts 127.0.0.1 localhost 192.168.1.1 jisaku1.myhome.or.jp jisaku1 192.168.1.2 ok_vaio 192.168.1.3 fmv5120d5.myhome.or.jp fmv5120d5 192.168.1.4 fmv466d3 -------------------------------------------------------------------------------

------------------------------------------------------------------------------- $ awk '{print NF}' /etc/hosts 2 3 2 3 2 -------------------------------------------------------------------------------

------------------------------------------------------------------------------- $ awk '{print $NF}' /etc/hosts localhost jisaku1 ok_vaio fmv5120d5 fmv466d3 -------------------------------------------------------------------------------

条件によって制御を変えるには、if 構文が使えます。
C言語と同様の形式となっています。

if(条件式){...}else if(条件式){...}else{...}

次のような内容のファイルがあるとします。

-------------------------------------------------------------------------------
$ cat px.lst
wyrm.its.uow.edu.au:8080
xanadu.centrum.dk:8080
xcs.contex.com:80
xena.cable-lynx.net:3128
xmail.eatel.com:8080
xns.codify.com.tw:3128
xxcal-labs.com:8080
yellow.javanet.com:80
yogsothoth.ludexpress.com:8080
yourpalsat.netmeg.net:3128
zam381.zam.kfa-juelich.de:3128
zenith000.hhs.net:80
-------------------------------------------------------------------------------

何のリストかはともかく、どうも “ドメイン名:ポート番号” という形式をしているようです。
例えば、ポート番号が80番と3128番のドメイン名を抽出したいとします。

-------------------------------------------------------------------------------
$ awk -F: '{if(($2==80)||($2==3128)){print $1}}' px.lst
xcs.contex.com
xena.cable-lynx.net
xns.codify.com.tw
yellow.javanet.com
yourpalsat.netmeg.net
zam381.zam.kfa-juelich.de
zenith000.hhs.net
-------------------------------------------------------------------------------

この例のような場合、もっと簡単に

条件式{...}

とも書くことができます。

-------------------------------------------------------------------------------
$ awk -F: '$2==80||$2==3128{print $1}' px.lst
-------------------------------------------------------------------------------

処理する行を選ぶのに、正規表現を含むパターンも使えます。 (今回は正規表現については詳しく触れません)

/パターン/{...}

とすればOKです。

例えば、上記リストで、トップドメインが “.net” と “.de” のドメイン名を抽出したいとします。

-------------------------------------------------------------------------------
$ awk -F: '/\.(net|de)/{print $1}' px.lst
xena.cable-lynx.net
yourpalsat.netmeg.net
zam381.zam.kfa-juelich.de
zenith000.hhs.net
-------------------------------------------------------------------------------

※パターンの所のドット . に \ を付けないと、ドットが「任意の1文字に合致する」という意味になってしまいます。
※( 文字列 | 文字列 | ... ) で文字列の複数一致ができます。

このパターンに合致するかどうかのチェックは $0 (行の全ての文字列) に対して行われますが、時には $1や$2 だけにと限定したい場合もあります。そういう場合、

$1 ~ /パターン/{...}

のように書くと、$1 に限定されます。 1つ前の例は、

-------------------------------------------------------------------------------
$ awk -F: '$1 ~ /\.(net|de)/{print $1}' px.lst
-------------------------------------------------------------------------------

と書いた方がより親切でしょう。
パターンチェックの意味を逆にするには、

$1 !~ /パターン/{...}

のように、チルダ ~ の前に ! を付けます。

-------------------------------------------------------------------------------
$ awk -F: '$1 !~ /\.(net|de)/{print $1}' px.lst
wyrm.its.uow.edu.au
xanadu.centrum.dk
xcs.contex.com
xmail.eatel.com
xns.codify.com.tw
xxcal-labs.com
yellow.javanet.com
yogsothoth.ludexpress.com
-------------------------------------------------------------------------------

翻訳すると、1番目の文字列 ($1) に “.net” または “.de” が無い行の 1番目の文字列を printせよ！ということです。

100% 実践 awk

★どういう時にawkを使うか

★awkのコマンド構文

★最初と最後に一度だけ実行したい処理がある場合

★文字列の区切り文字に別の文字を指定したい場合

★変数を使う

★特別な変数

★処理する行を選んだり、条件によって処理を行うには

★終わりに