cut コマンド タブ区切り


cutコマンドは、タブなどで区切られたデータの中から、特定の項目を抽出する場合に使用します。 コマンドを実行する際には、特定の項目を抽出したいファイルを引数として指定します。 無料進呈 CentOS7サーバー構築マニュアル無料プレゼント. cutコマンドで出来ること.

cut コマンドはその名の通り文字列を切り出すコマンドです。それぞれのオプションの意味は、、、-d は区切り文字の指定です。今回はカンマ区切りの入力ファイルなので、カンマを指定しています。何も指定しないとタブが区切り文字となります。 cutコマンドで出力デリミタ(区切り文字)を指定するには--output-delimiter オプションを指定します。 オプションの説明 --output-delimiter=STRING use STRING as the output delimiter the default is to use the input delimiter
cutコマンドで連続した空白で区切られているフィールドを取り出すのは難しいので、連続した空白を一つのタブに変換後してから切り出します。 下記では「sed 's/[\t ]\+/\t/g’」で連続した空白を一個のタブに変換してからcutコマンドで切り出しています

cutコマンドでは、以下のように実行することでタブ区切りのデータから指定列を抽出することができる。 例をみてわかるように、範囲指定や指定列まで、指定列以降といった指定が簡単に行えるようになっている。 cut -f 抜き出すフィールドの番号
cutコマンドはデフォルトでは、タブ区切りでフィールドを認識しますが、-dオプションでフィールドの区切り文字を指定することができます。 区切り文字として、:(コロン)を指定して確認してみます。 いろいろ切られてるということで、PowerShellでcutコマンドと似たようなことができないか確認してみます。 (本記事はPowerShell入門記事としてコチラにもまとめています。) 実験用のデータを生成します。タブ区切りフィールド3列、10レコードのデータです。