文字エンコーディングによるファイル検索

サブフォルダ以下にある *.c ファイルのなかから、特定の文字コード(UTF-8)であるものをリストアップする。

 

1. find

  • . : カレントフォルダから再帰的に検索する。
  • -name '*.c' : 拡張子が c のファイルを検索する。
  • -type f : 検索対象をファイルとする。(フォルダを除く)
  • -print0 : 文字列区切りをNUL文字とする。(デフォルトは改行文字)

 

2. xargs

  • -0 : 文字列区切りをNUL文字とする。(デフォルトは改行文字)

 

3. nkf

  • -guess : 文字エンコーディングを判定(推測)する。

 

4. grep

  • 'UTF-8' : 検索対象の文字列を 'UTF-8' とする。