名前
find -
ディレクトリ階層内のファイル検索
書式
find [-H] [-L] [-P] [-D debugopts] [-Olevel]
[starting-point...] [expression]
説明
このマニュアルページは
GNU 版 find
の使用法を説明しています。
GNU find は、
指定された検索開始ポイント
(starting-point) を基準にして、
ディレクトリツリーを検索します。
そして優先規則に従って
(「オペレーター」のセクション参照)、
指定された式 (expression)
を左から右の順で評価していきます。
たとえば、 and
演算で左辺が false
になった場合や、 or
演算で左辺が true
になった場合のように、
式の結果が確定すると、
find
は次のファイル名を処理対象とします。
検索開始ポイントが指定されていない場合は、
`.'
が指定されたものとみなします。
セキュリティを重視する必要がある状況
(たとえば、
別ユーザーが書き込み可能なディレクトリを、
自分が検索しようとしている場合)
のもとで、 find
を利用する場合には、
findutils 文書の 「Security
Considerations」の章をよく読んでください。
この文書は Finding Files
というものであり、
findutils
に含まれています。
この文書の方がマニュアルページに比べて、
詳しい説明や検討が行われているので、
役に立つ情報が得られるかもしれません。
オプション
-H, -L, -P
というオプションは、
シンボリックリンクの取り扱いを制御します。
このオプションに続くコマンドライン引数は、
検索対象となるファイル名やディレクトリ名として扱われます。
ただしそのように扱われるのは、
次に `-'
で始まる引数や、 `('
や `!'
という引数が現れるところまでです。
その引数以降の記述は、
検索方法を示した式として扱われます。
検索開始ポイントのパスが指定されなかった場合は、
カレントディレクトリが検索対象になります。
また、
式が指定されなかった場合は、
式 -print
が使用されます
(ただしどのような場合でも、
-print ではなく -print0
の利用を検討してください)。
このマニュアルページでは、
式の中で用いる「オプション」について説明しています。
オプションは、 find
の動作を制御します。
これを指定するのは、
パス名の指定を終えた後ろです。
これとは別に、
「本当の」オプションとして
-H, -L, -P, -D, -O
という 5
つがあります。
これを用いるのであれば、
パス名の指定よりも前でなければなりません。
なお仕様上は、
ダッシュを 2 つ重ねた
--
を使用することで、
それ以降の引数が、
オプションでないことを表すことができるとされます。
ただし、
この後に続く引数がパス引数であるかどうかを決定する処理が原因となって、
2
重のダッシュは実際には動作しません。
つまり式を表す引数
(これも `-'
で始まります)
が現れるところまで、
引数を読み込むことで、
パス引数の終わりが判断されます。
仮にパス引数が `-'
で始まっていたとしたら、
find
はこれを式として取り扱ってしまいます。
このように、
検索開始点であるパス引数は、
適切に解釈されない場合があり、
他にも、
ワイルドカードパターンをシェルが展開する際に、
誤って式のように展開してしまうことがあります。
このような状況を避けるため、
一般的に行う安全策としては、
不安に思うパス名称やワイルドカードの前には、
`./'
をつけるようにするか、
'/'
で始まる絶対パス名を用いるようにします。
別の方法として移植性には欠けますが安全な方法があります。
GNU オプションの -files0-from
を使って find
の検索開始ポイントを任意に定める方法です。
- -P
- シンボリックリンクをたどりません。
これがデフォルトの動作です。
find
がファイルの情報を調べたり表示したりする際に、
そのファイルがシンボリックリンクであれば、
シンボリックリンクそのもののプロパティから取得される情報が用いられます。
- -L
- シンボリックリンクをたどります。
find
がファイルの情報を調べたり表示したりする際には、
リンク先ファイルのプロパティから情報が取得され利用されます。
つまりリンクそのものの情報は利用されません
(ただし、
シンボリックリンクが切れていたり、
find
がリンク先のファイルを調べることができなかった場合は除きます)。
このオプションの指定は、
暗に -noleaf
の指定を含みます。
この指定の後ろに -P
オプションを指定しても、
-noleaf
の効果は変わりません。
-L が有効であって、
find
がサブディレクトリを指し示すシンボリックリンクを見つけた場合は、
サブディレクトリ内が検索されます。
- -L
オプションが有効な場合に、
述語表現である -type
を用いると、
シンボリックリンクそのものではなく、
シンボリックリンク先のファイルのタイプに対して、
確認が行われます
(リンク切れである場合は除きます)。
find の実行中に、
シンボリックリンク切れを起こすようなアクションを行うと
(たとえば、 -delete
を指定すると)、
混乱を招く動作が発生することになります。
-L を使用すると、
述語表現の -lname や
-ilname は必ず false
を返します。
- -H
- シンボリックリンクをたどりません。
ただしコマンドライン引数を処理する場合は別です。find
がファイルの情報を調べたり表示したりする際には、
シンボリックリンクそのものからプロパティを取得して、
その情報が利用されます。
このような動作は、
コマンドライン上のファイルがシンボリックリンクであった場合には行われません。
このときには、
リンク先が読み取られます。
つまりその状況では、リンク先が何であっても、
リンク先から取得した情報が利用されます
(つまりリンクをたどります)。
シンボリックリンク自体の情報は、リンク先が確認できなかった場合の予備情報として利用されます。
-H が有効であって、
コマンドラインで指定されたパスのうち、
ディレクトリへのシンボリックリンクがあった場合も、
そのディレクトリの中身が調べられることになります
(ただし -maxdepth 0
が指定されていれば、
当然そのような処理にはなりません)。
複数の -H, -L, -P
を指定した場合は、
前のものが上書きされます。
つまり、
適用されるものは、
コマンドライン上で最後に指定されたものです。
-P
がデフォルトなので、
-H や -L
の指定がなければ、
-P
オプションが有効であると判断できます。
GNU find は、
検索処理に入る前のコマンドライン処理においても、
ファイル情報を調べることがあります。
上に示したオプションは、
そのような引数の処理に対しても、
影響を及ぼします。
具体的に見てみると、
数多くのテストでは、
その時点で処理対象となっている
1 つのファイルと、
コマンドライン上の複数ファイルとの間で、
比較処理を行います。
どの状況でも、
コマンドラインから指定されたファイルは、
プロパティが調べられて、
その一部は保存されます。
引数上のファイルがシンボリックリンクであって、
-P
オプションが有効な場合
(あるいは -H と -L
オプションの指定がどちらもない場合)、
比較処理に用いられるのは、
シンボリックリンクのプロパティ情報です。
そうでない場合には、
リンク先ファイルのプロパティ情報が用いられます。
find
がリンク先をたどれなかった場合
(たとえば権限が不足していた場合や、
リンク先が存在しないファイルであった場合)、
シンボリックリンクそのもののプロパティが用いられます。
-H あるいは -L
オプションが有効な場合、
-newer
の引数として指定されたものがシンボリックリンクなら、
その参照をたどって、
リンク先のファイルからタイムスタンプを取得します。
このような処理は、
-newerXY, -anewer, -cnewer
でも同様に行われます。
-follow
オプションは、 -L
と同様の効果がありますが、
オプションの指定位置以降に対して有効になります。
(つまり、 -L
を使わずに、 -follow
が使われた場合、
コマンドライン上、
シンボリックリンクが
-follow
の後ろに指定されている場合は、
参照をたどるのに対して、
その前に指定されたものは参照をたどりません。)
- -D debugopts
- 診断情報を出力します。
find
が思うように動かない場合に、
原因調査に役立てることができます。
デバッグオプションを複数指定するときは、
カンマで区切ります。
findutils
のリリース間において、
デバッグオプションの互換性は保証されません。
有効なデバッグオプションの一覧は、
find -D help
の出力を確認してください。
有効なデバッグオプションには、
以下のものがあります。
- exec
- -exec, -execdir, -ok, -okdir
に関連する診断情報を表示します。
- opt
- 式ツリー (expression tree)
の最適化に関する診断情報を表示します。
-O
オプションを参照してください。
- rates
- 述語表現が成功あるいは失敗した回数を、
取りまとめて表示します。
- search
- ディレクトリツリーを詳細に示します。
- stat
- システムコールの
stat や lstat を使って、
ファイルが調べられた場合に、
メッセージを表示します。
find プログラムは、
そのようなシステムコールの呼び出しを、
最小となるように処理します。
- tree
- 式ツリー (expression tree) を、
元の形と最適化した形で示します。
- all
- すべてのデバッグオプションを有効にします
(ただし help
は除きます)。
- help
- デバッグ用オプションを説明します。
- -Olevel
- 問い合わせの最適化を有効にします。
find プログラムは、
複数テスト全体の処理内容を変えることなく、
テストの順番を並べ替えて、
実行速度を上げます。
ただし、
副作用を持つ述語は、
他の述語と入れ替えは行いません。
最適化レベルごとの最適化の違いは以下のとおりです。
- 0
- 最適化レベル 1
と同じです。
- 1
- これはデフォルトの最適化レベルであり、
従来からある動作です。
ファイル名だけを確認するテスト
(たとえば -name や -regex)
が先に実行されるように、
式の並び替えを行います。
- 2
- ファイル名だけを確認するテストよりも、-type
あるいは -xtype
を後に処理します。
ただし i
ノードからの情報を必要とするテストよりは、
前に処理します。
最近の Unix では、 readdir()
関数がファイルタイプを返すようになっているため、
これらの述語表現は、
ファイル情報を最初に調べる述語表現に比べて、
処理が高速になります。
述語表現の -fstype FOO
を用いた際に、
指定したファイルシステムタイプ
FOO が、 find
の起動時点において不明なもの
(`/etc/mtab'
に存在しないもの)
であった場合、
この述語表現は -false
に等しくなります。
- 3
- この最適化レベルでは、
コストベースによって最適化を行う、
完全な問合せオプティマイザー
(query optimiser)
を有効にします。
コストの低い
(つまり高速になる)
テストを先に処理し、
コストの高いものは後に処理するというように、
必要に応じた並び替えが行われます。
一定のコストの幅の中では、
述語表現が成功するか否かの可能性を考慮して、
述語表現の評価を先に行ったり、
後に行ったりします。
-o の場合は、
成功する可能性のあるものが、
先に評価されます。
-a の場合は、
失敗する可能性のあるものが、
先に評価されます。
- コストベースのオプティマイザーは、
対象のテストが成功するかどうかに関して、
一定の取り決めを設けています。
成功するかどうかの判断は、
テストの性質を配慮して、
状況により変化する場合があります
(たとえば -type f
の場合は、 -type c
よりも、
成功する可能性が高いとみなしています)。
コストベースのオプティマイザーは現在、
評価中の段階です。
したがって、 find
の性能が実際に向上しなければ、
削除される予定です。
逆に、
この機能に信頼性や確実さが確認されて、
効果的であることが分かれば、
後々、
下位の最適化レベルにおいて実現するかもしれません。
ただし、 4.3.x
系のリリースにおいては、
デフォルトの動作
(最適化レベル 1)
を変更する予定はありません。
findutils
のテストスイートでは、
find
に対するテストすべてにおいて、
各最適化レベルでの処理を実施していて、
その結果が同一になることを確認しています。
式
コマンドライン上で、
検索開始ポイント
(starting-point)
のリストの次にくるものが、式
(expression) です。 式は、
検索方法を定めます。
どのファイルに一致するか、
一致したファイルをどう処理するか、
ということを表します。
式は、
以下の項目から構成されます。
- テスト (test)
- テストは true または false
を返します。
通常その値は、
処理時点での対象ファイルの所定のプロパティに基づいて決まります。
たとえば -empty
というテストは、
対象ファイルが空の場合に
true になります。
- アクション (action)
- アクションには副作用があり
(たとえば、
標準出力に何かを表示するなどして)、
その上で true または false
を返します。
通常その値は、
副作用による処理の成功または失敗に基づいて決まります。
たとえば -print
というアクションは、
対象ファイルの名前を標準出力に出力します。
- グローバルオプション
(global option)
- グローバルオプションは、
コマンドライン上に指定されているテストやアクションすべてに影響を及ぼします。
グローバルオプションは、
必ず true を返します。
たとえば、 -depth
オプションを指定すると、
find
がファイルシステムをたどるときに、
深い方から先 (depth-first order)
に処理します。
- 位置オプション (positional
option)
- 位置オプションは、
この後ろにあるテストやアクションに対してのみ影響を及ぼします。
位置オプションは、
必ず true を返します。
たとえば -regextype
オプションは、
その記述位置によって動作が決まります。
コマンドライン上で、
この記述以降に現れる正規表現が、
どういった方言の正規表現であるかを指定します。
- オペレーター (operator)
- オペレーターは、
式を構成する項目どうしを結びつけます。
オペレーターには、
-o (論理 OR の意味) や
-a (論理 AND の意味)
があります。
オペレーターがないところは、
-a
があるものとみなされます。
式がすべて true
になったファイルに対して、
アクション -print
が実行されます。
ただしアクション
-prune または -quit
を除いた、
他のアクションがある場合は、
実行されません。
デフォルトの -print
の動作を発生させないアクションは、
以下のものです。
-delete, -exec, -execdir, -ok, -okdir,
-fls, -fprint, -fprintf, -ls, -print,
-printf
-delete
というアクションは、
オプションのようにも働きます
(-depth
の指定を暗に含むためです)。
位置オプション
位置オプションは、
常に true を返します。
位置オプションは、
この後ろにあるテストに対してのみ影響を及ぼします。
- -daystart
- 時間の計測を、 24
時間前からではなく、
本日の始まりからとします
(対象は -amin, -atime, -cmin,
-ctime, -mmin, -mtime です)。
このオプションの指定が有効になるのは、
コマンドライン上でこれよりも後ろに記述されたテストに対してのみです。
- -follow
- 非推奨とされています。
代わりに -L
オプションを使ってください。
これはシンボリックリンクをたどます。
-noleaf
の指定を暗に含みます。
-follow
オプションが影響を及ぼすのは、
コマンドライン上で、
これよりも後ろに指定されたテストに対してのみです。
-H あるいは -L
オプションの指定がなければ、
-follow
オプションが記述されると、
述語表現 -newer
の動作は変わります。
-newer
の引数として指定されたファイルが、
シンボリックリンクであった場合は、
そのリンク先が参照されます。
-newerXY, -anewer, -cnewer
についても同様です。
また、 述語表現の
-type も、
シンボリックリンクそのものではなく、
シンボリックリンク先のファイルタイプに一致するようになります。
-follow を指定すると、
述語表現 -lname と -ilname
は、 必ず false
を返します。
- -regextype
type
- コマンドライン上で、
この後に記述されるテスト
-regex と -iregex
に対して、
解釈する正規表現文法を変更します。
正規表現の種類には何があるかについては、
-regextype help
を実行して確認してください。
Texinfo 文書
(「関連項目」参照)
では、
各種正規表現の意味や違いについて説明しています。
- -warn, -nowarn
- 警告メッセージの表示、非表示を切り替えます。
この警告は、
コマンドラインの使用法に関するものだけを対象とします。
逆に find
のディレクトリ検索時における処理状況に関するものは、
対象としません。
デフォルトの動作は、
標準入力が tty
であれば -warn
になり、
そうでなければ -nowarn
になります。
コマンドラインの使用法に関する警告メッセージが出力された場合であっても、
find
の終了ステータスには影響しません。
環境変数 POSIXLY_CORRECT
が設定された状態で、
-warn
が指定されると、
警告が発生したとしても、
どの警告を出すのかは未定です。
グローバルオプション
グローバルオプションは、必ず
true を返します。
グローバルオプションは、
コマンドライン上で、
これよりも前にあるテストに対しても影響を及ぼします。
混乱を避けるために、
コマンドライン上でのグローバルオプションの指定は、
検索開始ポイントのリストの後ろで、
テスト、位置オプション、
アクションの直前に指定してください。
グローバルオプションを、
それとは別の場所で指定すると、
find は、
混乱する可能性があることを示す警告メッセージを出力します。
グローバルオプションの指定位置は、
検索開始ポイントのリストより後ろです。
このため -L
とは異なる種類のものです。
たとえば以下のとおりです。
- -d
- -depth と同じです。 FreeBSD, NetBSD,
MacOS X, OpenBSD
との互換性のためにあります。
- -depth
- ディレクトリそのものより前に、
ディレクトリの中を処理します。
アクション -delete には
-depth
オプションが暗に含まれています。
- -files0-from
file
- 検索開始ポイントを、
コマンドラインから指定されたものを使わずに、
file
から読み込みます。
コマンドラインからの引数として検索開始ポイントを指定することには、
一定の制約がありました。
つまりファイルの指定数に上限があったことです。
またオプション名とかぶるようなファイル名の場合に、
見誤ってしまうことがありました。
このオプションを使うと、
find
に指定する検索開始ポイントを、
安全にまた任意の数だけ受け渡すことができます。
このオプションを用いることと、
コマンドラインから検索開始ポイントを受け渡すことは、
互いに排他的な関係にあります。
つまり両方を同時に用いることはできません。
引数 file
は必須です。
検索開始ポイントの一覧を
標準入力
ストリームからとることは可能であり、
たとえばパイプを使って受け渡すことができます。
その場合、
アクション -ok と
-okdir
は用いることができません。
これらはユーザーからの入力確認を行うものであるため、
標準入力
からの読み込みとは、
明らかに相容れないものになるからです。
file
内の検索開始ポイントは、
ASCII NUL
文字によって区切ります。
2 つの連続した NUL
文字、
つまり検索開始ポイントのファイル名の長さがゼロであるものは、
指定することができません。
その場合はエラーメッセージが出力されて、最後にゼロ以外の終了コードが返されます。
指定された file
が空の場合、 find
は検索開始ポイントがないものとして処理をするため、
プログラム引数を解析した後に、
すぐに終了します。
これは、
パス引数が受け渡されなかった場合に、
find
の標準的な呼び出しを行えば、
カレントディレクトリを検索開始ポイントとする動作とは異なることになります。
検索開始ポイントからの処理は、
それ以外の点では通常どおり行われます。
つまり find
は特に指示がない限りは、
サブディレクトリを再帰的に処理します。
検索開始ポイントだけを処理するには、
さらに -maxdepth 0
を指定することができます。
さらに注意点です。
入力ファイル内に所定のファイルが複数回記述されていた場合、
それが複数回検索されることになるかどうかは不定です。
find の処理中に file
が変更された場合も、
同様に不定です。
また find
が終了する際の、その指定された
file
内の検索位置も、
終了方法が -quit
であるか別の方法であるかを問わず、
不定となります。
ここで "不定"
と言っているのは、
動作するしないは分からず、何か特定の処理がなされるかもしれないということであり、
その動作は、
プラットフォームによって変わるかもしれないし、
findutils
のリリースによって変わるかもしれないということです。
- -help, --help
- find
のコマンドラインの使用方法の概要を表示して終了します。
- -ignore_readdir_race
- 通常 find は、
ファイル情報の取得に失敗したときには、
エラーメッセージを出力します。
このオプションを指定した場合、
ディレクトリからファイル名を読み込んだときと、
ファイル情報を取得しようとしたときの間で、
ファイルが削除されてしまっていても、
エラーは表示されません。
この動作は、
コマンドライン上から指定されるファイルやディレクトリに対しても適用されます。
このオプションは、
コマンドラインから読み込みを行う段階で有効となるので、
ファイルシステムの一部に対して、
このオプションをオンとし、
残りの部分はオフとするような指定はできません。
(これを実現しなければならない場合は、
find コマンドを 2
つ実行することが必要です。1
つは本オプションをオンにして、
もう 1
つはオフにして実行します。)
さらに、 -ignore_readdir_race
オプションを指定した
find の実行では、
親ディレクトリを読み込んだ後に、
対象ファイルが消失している状況が発生した場合、
-delete
アクションからのエラーも無視します。
その場合には、
診断エラーは出力されず、
-delete
アクションからの返り値も
true になります。
- -maxdepth
levels
- 検索開始ポイントから最大で、
levels
で示される階層数のディレクトリまで検索します
(levels
は負ではない整数です)。
-maxdepth 0
を指定すると、
テストやアクションの対象は、
検索開始ポイントだけになります。
- -mindepth
levels
- 検索開始ポイントから
levels
で示される階層数のディレクトリに至るまでは、
テストやアクションを適用しません
(levels
は負ではない整数です。)。
-mindepth 1
を指定すると、
検索開始ポイントを除いたファイルを、
すべて処理することになります。
- -mount
- ファイルシステムが異なる場合は、
ディレクトリを検索しません。
これは -xdev
の別名であり、
バージョンが異なる
find
との互換性のために設けられています。
- -noignore_readdir_race
- -ignore_readdir_race
の効果を無効にします。
- -noleaf
- ディレクトリに含まれるサブディレクトリ数が、
ハードリンク数よりも
2 つ少ない、
とする想定のもとでの最適化を無効にします。
このオプションが必要になるのは、
Unix
のディレクトリとリンクに関する慣例に従っていないファイルシステム、
たとえば CD-ROM、 MS-DOS
ファイルシステム、
AFS
ボリュームマウントポイントを検索する場合です。
通常の Unix
ファイルシステムにおいては、
各ディレクトリに最低でも
2
つのハードリンクがあります。
ディレクトリ名そのものと、
`.' エントリです。
そしてサブディレクトリがある場合に、
そのサブディレクトリには、
親ディレクトリにリンクする
`..'
というエントリがあります。
そこで find
がディレクトリを調べる際に、
ディレクトリへのリンク数よりも
2
つ分だけ少ないサブディレクトリを調べた後であれば、
ディレクトリ内の残りのエントリは、
ディレクトリではない
(ディレクトリツリー内の「葉」(leaf)
ファイルである)
ことが決定します。
ファイル名を調べるだけで十分であれば、
ファイル情報を調べる必要がなくなるので、
これを利用すれば、
検索速度が明らかに向上します。
- -version,
--version
- find
のバージョンを表示して終了します。
- -xdev
- 異なるファイルシステムのディレクトリを検索しません。
テスト (test)
テストの中には、
-newerXY や -samefile
のように、
その時点で対象となっているファイルと、
コマンドラインから指定する参照ファイル
(reference file) との間で、
比較を行うものがあります。
そのようなテストが指定された際に、
参照ファイルに対する解釈は、
-H, -L, -P
といったオプションや、
先行する -follow
の存在によって決定します。
ただし、
参照ファイルが調べられるのは、
コマンドラインが解析されるときの
1 回だけです。
参照ファイルが調べられなかった場合
(たとえば、 stat(2)
システムコールに失敗した場合)、
エラーメッセージが出力されて、
find は 0
以外のステータスを返して終了します。
数値引数である n
は、 以下のテスト、
-amin, -mtime, -gid, -inum, -links,
-size, -uid, -used
において指定できます。
そして以下のような指定方法があります。
- +n
- n より大きい。
- -n
- n より小さい。
- n
- n
にちょうど等しい。
サポートされているテスト:
- -amin n
- ファイルの最終アクセス時間が、
n 分前と比較して、
それよりも前か後かちょうど同じかをテストします。
- -anewer
reference
- 現在ファイルの最終アクセス時間が、
reference (参照ファイル)
の最終更新時間よりも、
新しいかどうかをテストします。
引数 reference
がシンボリックリンクであり、
-H や -L
オプションが有効になっている場合は、
リンク先ファイルの最終更新時間が常に利用されます。
- -atime n
- ファイルの最終アクセス時間が、
n*24
時間前と比較して、
それよりも前か後かちょうど同じかをテストします。
ファイルの最終アクセス時間が、
24
時間の何倍であるかを割り算して計算する際に、
端数は無視されます。
したがって、 -atime +1
に一致するためには、
ファイルは少なくとも
2
日前にアクセスされていなければなりません。
- -cmin n
- ファイルステータスの最終変更時間が、
n 分前と比較して、
それよりも前か後かちょうど同じかをテストします。
- -cnewer
reference
- 現在ファイルの最終ステータス変更時間が、
reference (参照ファイル)
の最終更新時間よりも、
新しいかどうかをテストします。
引数 reference
がシンボリックリンクであり、
-H や -L
オプションが有効になっている場合は、
リンク先ファイルの最終更新時間が常に利用されます。
- -ctime n
- ファイルステータスの最終変更時間が、
n*24
時間前と比較して、
それよりも前か後かちょうど同じかをテストします。ファイルステータスの更新時間の解釈にあたって、丸め処理がどのように影響するかについては、
-atime
の説明を参照してください。
- -empty
- ファイルが空であって、
通常のファイルかディレクトリであるかどうかをテストします。
- -executable
- 実行可能なファイルか、
あるいは、
現在のユーザーが
(ファイル名解決の観点で)
検索可能なディレクトリであるかどうかをテストします。
このテストは、
アクセスコントロールリスト
(access control list; ACL) や、
この他のパーミッション機能を考慮します。
ちなみに、 テスト
-perm
では無視されます。
本テストは、
システムコール access(2)
を利用するので、 NFS
サーバーが UID
マッピング (つまり root
squash)
を行っている場合に、
適切に動作しない場合があります。
多くのシステムでは、
クライアントのカーネルにおいて
access(2)
を実装しているため、
サーバー側にある UID
マッピング情報を利用できないからです。
このテストは、 access(2)
システムコールの結果だけに基づいているため、
このテストが true
となったファイルが、
実際に実行できるかどうかの保証はありません。
- -false
- 必ず false を返します。
- -fstype
type
- ファイルが存在するファイルシステムが、
type
かどうかをテストします。
いろいろな Unix
システムに対して、
有効なファイルシステムは変わります。
Unix
などの各種システムにおいて、
許容されるファイルシステムタイプを、
その一部だけあげてみると、
ufs, 4.2, 4.3, nfs, tmp, mfs, S51K, S52K
といったものです。
-printf
のディレクティブ %F
を使えば、
現在のファイルシステムタイプを確認することができます。
- -gid n
- ファイルのグループ
ID 番号が、 n
と比較して、
それよりも小さいか大きいかちょうど同じかをテストします。
- -group gname
- ファイルの属するグループが
gname
かどうかをテストします
(グループ ID
番号による指定も可)。
- -ilname
pattern
- -lname と同様ですが、
大文字小文字は区別しません。
-L または -follow
オプションが有効な場合、
シンボリックリンクが切れていない限り、
このテストは false
を返します。
- -iname
pattern
- -name と同様ですが、
大文字小文字は区別しません。
たとえば、 パターン
`fo*' や `F??' は、 `Foo', `FOO', `foo', `fOo'
などのファイル名に一致します。
また、 パターン `*foo*'
は、 `.foobar'
というファイルにも一致します。
- -inum n
- ファイルの i
ノード番号が、 n
と比較して、
それよりも小さいか大きいかちょうど同じかをテストします。
普通はこれよりも、
-samefile
を使った方が簡単です。
- -ipath
pattern
- -path と同様です。
ただし大文字小文字を区別しません。
- -iregex
pattern
- -regex と同様です。
ただし大文字小文字を区別しません。
- -iwholename
pattern
- -ipath
を参照してください。
この別名は、 -ipath
よりも移植性に劣ります。
- -links n
- ファイルが持つハードリンクの数が、
n と比較して、
小さいか大きいかちょうど同じかをテストします。
- -lname
pattern
- ファイルがシンボリックリンクであって、
その内容がシェルパターン
pattern
に一致するかどうかをテストします。
メタ文字は、 `/' や `.'
を特別扱いしません。
-L または -follow
オプションが有効な場合には、
シンボリックリンクが切れていない限り、
このテストは false
を返します。
- -mmin n
- ファイルの最終更新時間が、
n 分前と比較して、
それよりも前か後かちょうど同じかをテストします。
- -mtime n
- ファイルの最終更新時間が、
n*24
時間前と比較して、
それよりも前か後かちょうど同じかをテストします。
何日前かを計算する際、
時間差を 24
時間で割った結果を丸めるため、
ファイル更新時間の解釈にあたって、
その処理がどのように影響するかについては、
-atime
の説明を参照してください。
- -name pattern
- ファイルのベース名
(パス名から、
先行するディレクトリを取り除いたもの)
が、
シェルのパターン
pattern
に一致するかどうかをテストします。
先行するディレクトリを取り除いているので、
-name
を使って一致の確認を行うファイル名には、
スラッシュが含まれないものとして扱われます。
つまり `-name a/b'
としても、
一致するものはありません
(その場合は、
おそらく -path
を用いる必要があります)。
これを行ってしまった場合、
環境変数 POSIXLY_CORRECT
が設定されていない限りは、
警告メッセージが出力されます。
メタ文字 (`*', `?', `[]') は、
ベース名の先頭にある
`.' に一致します
(これは findutils-4.2.2
から変更されました。以降のセクション「規格への準拠」を参照してください)。
1
つのディレクトリとそこに含まれるファイルを無視したい場合は、
ディレクトリツリー内の全ファイルを確認するのではなく、
-prune
を使います。-prune
の説明において、
例を説明しているので参照してください。
波カッコ ('{}') は、
特別な文字としては扱われません。
bash
などのシェルにおいては、
シェルパターン内の波カッコに特別な意味を持つものがありますが、
この点は異なります。
ファイル名のマッチングは、
fnmatch(3)
ライブラリ関数を用いて行われます。
シェルによってパターンが展開されないように、
パターンはクォートで囲むことを忘れないでください。
- -newer
reference
- 対象ファイルの最終更新時間が、
reference
ファイルの最終更新時間よりも、
最新であるかどうかをテストします。
reference
がシンボリックリンクであって、
-H または -L
オプションが有効である場合は、
リンク先ファイルの更新時間が用いられます。
- -newerXY
reference
- 対象ファイルのタイムスタンプ
X が、 reference
ファイルのタイムスタンプ
Y より、
新しいかどうかをテストします。
X と Y
の位置に記述する文字は、
以下の文字とします。
a |
reference
ファイルのアクセス時間 |
B |
reference
ファイルの生成時間 |
c |
reference ファイルの i
ノードステータスが変更された時間 |
m |
reference
ファイルの内容更新時間 |
t |
reference
に直接時間表現が書かれたとして解釈 |
組み合わせによっては、
無効になるものも発生します。
たとえば、 X に t
を指定しても無効です。
またシステムによっては、
特定の組み合わせを実装していない場合があります。
たとえば B は、
すべてのシステムでサポートされているわけではありません。
指定された XY
の組み合わせが、
無効や未サポートの場合は、
致命的エラーが発生します。
時間表現は、 GNU date
における -d
オプションに対する引数と同様のものとして解釈されます。
参照ファイルの生成時間を使用しようとて、
その生成時間が決定できなかった場合は、
致命的エラーになります。
また、
対象ファイルの生成時間を参照するテストを用いた際に、
生成時間が不明な場合は、
そのテストは失敗します。
- -nogroup
- ファイルのグループ
ID 番号が、
システムに存在していないことをテストします。
- -nouser
- ファイルのユーザー
ID 番号が、
システムに存在しないことをテストします。
- -path pattern
- ファイル名が、
シェルのパターン
pattern
に一致するかどうかをテストします。
メタ文字は、 `/' や `.'
を特別扱いしません。
したがってたとえば、
find . -path "./sr*sc"
は、 ./src/misc
というディレクトリ
(それが存在している場合)
の内容を表示します。
ディレクトリツリー全体を対象としないのであれば、
ツリー内の各ファイルを確認していくのではなく、
-prune を用います。
パターン一致を確認するようなテストは、
ファイル名すべてに対して適用されます。
つまりそのファイル名は、
コマンドライン上から指定された検索開始点から始まる、
検索対象すべてです。
このパターンにおいて、
絶対パスを指定するなら、
検索開始点も絶対パスでなければ意味がありません。
つまり以下のようなコマンドでは、
どのファイルも一致しません。
find bar -path /foo/bar/myfile -print
find が -path
の引数と比較するのは、
その時点で対象としているファイルのディレクトリとベース名を連結した文字列です。
その文字列の末尾がスラッシュになることはないため、
-path
の引数の末尾にスラッシュを指定すると、
何にも一致しないことになります。
(ただし、
コマンドラインで指定された検索開始ポイントには、
おそらく一致します)。
述語表現 -path は、 HP-UX
の find
でもサポートされていて、
POSIX 2008
規格に存在します。
- -perm mode
- ファイルの許可属性が
mode (8
進数表現またはシンボル表現)
に一致するかどうかをテストします。
mode
指定のこの形式では、
完全一致が求められるので、
この形式をシンボリックモードで使う場合には、
モード文字列の指定が多少複雑になるかもしれません。
たとえば `-perm g=w' は、
許可属性が 0020
のファイルにのみ一致します
(つまり、
グループの書き込み権限のみを設定します)。
おそらく、 `/' や `-'
を用いる形式を必要とすることがあります。
たとえば、 `-perm -g=w'
とすれば、
グループの書き込み許可があるファイルに一致します。
具体例については「例」セクションを参照してください。
- -perm
-mode
- mode
で指定した許可属性ビットすべてが、
対象ファイルのものに一致するかどうかをテストします。
この形式でも、
シンボリックモード指定が可能です。
このモードは、
ごく普通に用いたくなるはずです。
シンボリックモードでは、
`u'、 `g'、 `o'
を用いる必要があります。
具体例については「例」セクションを参照してください。
- -perm
/mode
- mode
で指定した許可属性ビットの一部が、
対象ファイルのものに一致するかどうかをテストします。
この形式でも、
シンボリックモード指定が可能です。
シンボリックモードでは、
`u'、 `g'、 `o'
を用いる必要があります。
具体例については「例」セクションを参照してください。
なお、 mode
の許可属性ビットが何も設定されていない場合、
このテストは、
どんなファイルにも一致します
(この動作は、 -perm -000
と一貫性を持たせるためです)。
- -perm
+mode
- この書式は、
もうサポートされていません
(2005 年以来、
非推奨となっています)。
代わりに -perm /mode
を用いてください。
- -readable
- 現在のユーザーによって読み込み可能なファイルであるかどうかをテストします。
このテストは、
アクセスコントロールリスト
(access control list; ACL) や、
その他のパーミッション機能を考慮します。
ちなみに、 テスト
-perm
では無視されます。
本テストは、
システムコール access(2)
を利用するので、 NFS
サーバーが UID
マッピング (つまり root
squash)
を行っている場合に、
適切に動作しない場合があります。
多くのシステムでは、
クライアントのカーネルにおいて
access(2)
を実装しているため、
サーバー側にある UID
マッピング情報を利用できないからです。
- -regex
pattern
- ファイル名が正規表現
pattern
に一致するかどうかをテストします。
この処理は、
パス全体への一致を確認するものであって、
ファイル検索ではありません。
したがってたとえば、
`./fubar3'
ファイルに一致する正規表現として、
`.*bar.' や `.*b.*3'
は利用できますが、
`f.*r3'
は利用できません。
find
が扱う正規表現のデフォルトは、
Emacs 正規表現です ('.'
が改行に一致する点は除きます)。
これは、 -regextype
オプションを用いて変更することができます。
- -samefile
name
- 対象ファイルが、
name と同じ i
ノードを参照しているかどうかをテストします。
-L が有効であれば、
シンボリックリンクを対象とすることができます。
- -size
n[cwbkMG]
- ファイルが n
単位分の容量と比較して、
それよりも小さいか大きいかちょうど同じかをテストします。
ここでは丸め処理が行われます。
以下のサフィックスが利用できます。
- `b'
- 512
バイトブロックを表します
(サフィックスの指定がない場合は、
これがデフォルトとなります)。
- `c'
- バイトを表します。
- `w'
- 2
バイトワードを表します。
- `k
- キビバイトを表します
(kibibyte, KiB, 1024
バイト単位)。
- `M'
- メビバイトを表します
(mebibyte, MiB, 1024 * 1024 単位 = 1048576
バイト)。
- `G'
- ギビバイトを表します
(gibibyte, GiB, 1024 * 1024 * 1024 単位 =
10737418241073741824)。
- サイズというのは単純に、
システムコールの lstat
(あるいは stat)
に含まれている struct stat
の メンバー st_size
のことであり、
上に示すようにして切り上げられます。言い換えると、
その結果は ls -l
で得られるものと一致します。-printf
における `%k' と `%b'
の書式指定子は、
スパースファイルに対して、
異なる扱いをする点に注意してください。
サフィックス `b' は、
常に 512
バイトブロックを表していて、
1024
バイトブロックを表すことはありません。
この点は、 -ls
の動作とは異なるところです。
- プレフィックスの +
と - は、
ごく普通に、
それより上、
それより下、
を表します。
したがって、 n
とちょうど同じ数には一致しません。
サイズとは、
次の数単位に向けて切り上げられることに注意してください。
つまり -size -1M
というのは、
-size -1048576c
と同じではありません。
前者は、
空のファイルにしか一致しません。
また後者は、
バイトサイズが 0
から 1,048,575
までのファイルに一致します。
- -true
- 常に true です。
- -type c
- ファイルタイプが c
であるかどうかをテストします。
- b
- ブロックスペシャルファイル
(バッファーあり)
- c
- キャラクタースペシャルファイル
(バッファーなし)
- d
- ディレクトリ
- p
- 名前付きパイプ (FIFO)
- f
- 通常のファイル
- l
- シンボリックリンク。
オプション -L や -follow
が有効な場合、
シンボリックリンク切れの場合を除いて、
このテストが true
になることはありません。
-L が有効なときに、
シンボリックリンクを検索するには、
-xtype
を用いてください。
- s
- ソケット
- D
- ドア (door) (Solaris の場合)
- 一度に複数のファイルタイプを検索したい場合は、
タイプを表す英字を、
カンマ `,'
で区切ったリストで指定します。
(GNU 拡張)
- -uid n
- ファイル所有者のユーザー
ID 番号が、 n
と比較して、
それよりも小さいか大きいかちょうど同じかをテストします。
- -used n
- ファイルのステータスが変更されてから、
ファイルにアクセスした最終時間が、
n 日間と比較して、
小さいか大きいかちょうど同じかをテストします。
- -user uname
- ファイルの所有者が、
uname
というユーザーであるかどうかをテストします
(ユーザー ID
番号による指定も可)。
- -wholename
pattern
- -path
を参照してください。
この別名は、 -path
よりも移植性に劣ります。
- -writable
- 現在のユーザーによって書き込み可能なファイルであるかどうかをテストします。
このテストは、
アクセスコントロールリスト
(access control list; ACL) や、
その他のパーミッション機能を考慮します。
ちなみに、 テスト
-perm
では無視されます。
本テストは、
システムコール access(2)
を利用するので、 NFS
サーバーが UID
マッピング (つまり root
squash)
を行っている場合に、
適切に動作しない場合があります。
多くのシステムでは、
クライアントのカーネルにおいて
access(2)
を実装しているため、
サーバー側にある UID
マッピング情報を利用できないからです。
- -xtype c
- 対象ファイルがシンボリックリンクでなければ、
-type と同様です。
シンボリックリンクのときは、
以下のように動作します。
-H や -P
オプションの指定時は、
リンク先がタイプ c
のファイルであれば、
true を返します。 -L
オプションの指定時は、
c が `l' ならば true
を返します。
言い換えると、
シンボリックリンクに対して、
-xtype は、 -type
がチェックしないファイルタイプをチェックします。
- -context
pattern
- (SELinux 有効時のみ)
対象ファイルのセキュリティコンテキストが
glob パターン pattern
に一致するかどうかをテストします。
アクション
- -delete
- ファイルまたはディレクトリを削除します。
削除に成功すると true
を返します。
削除に失敗した場合は、
エラーメッセージを表示して、 ゼロ以外の終了ステータスを返します
(最終終了するときです)。
警告: find
はコマンドラインを式として評価する点を忘れないでください。
したがって -delete
を一番初めに記述すると、
それは find
に対して、
検索開始ポイント以下のものをすべて削除させることになります。
コマンドラインから
-delete
オプションを指定すると、
自動的に -depth
オプションがオンとなります。
一方で -depth は -prune
を無効にするので、
-delete アクションは
-prune
と同時に用いることはできません。
ユーザーの中ではよく、
コマンドライン上において
-delete の前に -print
を指定して、
削除が実際にどのように行われるかをテストしようとします。
予期しない結果を起こさないためにも、
そのようなテストを行うときから、
-depth
オプションを明示的に指定することを忘れないでください。
-delete
アクションは、
ディレクトリが空でない場合には削除に失敗します。
-ignore_readdir_race
オプションとともに、
このオプションを指定し、
さらに、
親ディレクトリを読み込んだ後に、
対象ファイルが消失している状況が発生した場合、
-delete
アクションからのエラーは無視されます。
その場合には、
診断エラーは出力されず、
終了コードをゼロ以外には変えずに
-delete
アクションからの返り値も
true になります。
- -exec command ;
- command を実行します。
command の返り値が 0
なら、 true
を返します。 find
のコマンドラインで、
これ以降に指定されている引数は、
`;'
という引数が現れるまで、
すべてそのコマンドに対する引数とみなされます。
文字列 `{}' は、
コマンド引数内に現れるすべての箇所で、
対象ファイル名に置き換えられます。
find
の他の実装においては、
引数の中で `{}'
が単独で用いられていないと、
対象ファイル名に置き換えられないものがあります。
文字列 `{}' は、
シェルによって展開されないように、
どちらも `\'
でエスケープするか、
クォートで囲む必要があります。
アクション -exec
の具体例については、
「例」セクションを参照してください。
指定されたコマンドは、
一致したファイルごとに一回ずつ実行されます。
そのコマンドは、
find
を実行したディレクトリにおいて実行されます。
そこで、 -exec
アクションの実行にあたっては、
セキュリティの問題が避けられません。
したがって、 -exec
の代わりに、 -execdir
アクションを使用してください。
- -exec command {} +
- この形式の -exec
アクションは、
対象ファイルに対して、
指定されたコマンド
(command) を実行します。
各対象ファイルは、
コマンドラインの末尾に追加されながら、
コマンドラインが構成されるので、
指定コマンドの呼び出し回数は、
対象ファイル数よりも大幅に少なくて済みます。
コマンドラインが構成される処理方法は、
xargs
の場合とほぼ同じです。
`{}' の記述は、
コマンドライン中に 1
度しか用いることはできず、
しかも最後に `+'
を伴って、
コマンドラインの最終記述としなければなりません。
また、
シェルによって誤った解釈が行われないように、
(`\' を使って)
エスケープするか、
全体をクォートで囲むことが必要です。
そのコマンドは、
find
を実行したディレクトリにおいて実行されます。
'+'
形式を使った呼び出しにおいて、
終了ステータスにゼロでない値が返ってきたら、
find も、
終了ステータスにゼロ以外を返します。
find
においてエラーが発生すると、
その場ですぐに終了する場合があります。
その際には、
残りのコマンドがまったく実行されないこともあります。
このため、
-exec my-command ... {} + -quit
では、 my-command
が実際には実行されない場合があります。
なおこの -exec
の形式は、 必ず true
を返します。
- -execdir command
;
- -execdir
command {} +
- -exec と同様ですが、
指定したコマンドは、
一致したファイルが存在するサブディレクトリ内で実行されます。
このサブディレクトリは、
普通は find
を実行したディレクトリとは異なるはずです。
-exec と同じように、 find
をシェルから呼び出す場合には
{}
をクォートでくくる必要があります。
この形式は、
コマンドを呼び出す方法として、
非常に安全なものです。
一致したファイルのパスを確定させる際に、
競合状態を避けることができるためです。
-exec
アクションの場合と同様、
-execdir の `+'
形式の実行においても、
一致した複数ファイルを処理するようなコマンドラインが構成されます。
ただし、 指定された
command の呼び出しは、
どの場合であっても、
必ず同一サブディレクトリ内にあるファイルだけを対象にして実行されます。
このオプションの利用にあたっては、
環境変数 PATH が、 `.'
を参照していないようにする必要があります。
そうしていないと、
攻撃者が、 -execdir
を実行するディレクトリ内に、
いかにも正しいファイルを置くだけで、
任意のコマンド実行を許してしまうことになります。
PATH
内のエントリに、
空のものや、
相対パスのディレクトリ名を含んでいる場合にも、
同じことが言えます。
'+'
形式を使った呼び出しにおいて、
終了ステータスにゼロでない値が返ってきたら、
find も、
終了ステータスにゼロ以外を返します。
find
においてエラーが発生すると、
その場ですぐに終了する場合があります。
その際には、
残りのコマンドがまったく実行されないこともあります。
このアクションが返す値は、
+ と ;
のどちらの形式を使うかによって異なります。
-execdir command {} +
は必ず true
を返しますが、
-execdir command {} ;
は、 command が 0
を返したときだけ、
true を返します。
- -fls file
- true を返します。 -ls
と同様ですが、 -fprint
のように、 file
への出力を行います。
出力ファイルは、
この述語表現に一致するものがなくても、
必ず生成されます。
ファイル名に、
普通は使わない文字が含まれている場合の扱いについては、
「普通ではないファイル名」のセクションを参照してください。
- -fprint
file
- true を返します。
パス付きのファイル名を、
ファイル file
に出力します。 find
の実行時に、 file
が存在しなければ、
新たに生成されます。
すでに存在していたら、
元の中身は失われます。
ファイル名 /dev/stdout と
/dev/stderr
は特別に扱われます。
それぞれ、
標準出力、
標準エラー出力を意味します。
出力ファイルは、
この述語表現に一致するものがなくても、
必ず生成されます。
ファイル名に、
普通は使わない文字が含まれている場合の扱いについては、
「普通ではないファイル名」のセクションを参照してください。
- -fprint0
file
- true を返します。 -print0
と同様ですが、 -fprint
のように、 file
への出力を行います。
出力ファイルは、
この述語表現に一致するものがなくても、
必ず生成されます。
ファイル名に、
普通は使わない文字が含まれている場合の扱いについては、
「普通ではないファイル名」のセクションを参照してください。
- -fprintf file
format
- true を返します。 -printf
と同様ですが、 -fprint
のように、 file
への出力を行います。
出力ファイルは、
この述語表現に一致するものがなくても、
必ず生成されます。
ファイル名に、
普通は使わない文字が含まれている場合の扱いについては、
「普通ではないファイル名」のセクションを参照してください。
- -ls
- true を返します。
対象ファイルを、 ls
-dils
の書式で標準出力に出力します。
ブロック数は、 1
ブロックに 1 KB
バイトです。 ただし、
環境変数 POSIXLY_CORRECT
が設定されている場合は、
1 ブロック 512
バイトが使用されます。 ファイル名に、
普通は使わない文字が含まれている場合の扱いについては、
「普通ではないファイル名」のセクションを参照してください。
- -ok command ;
- -exec と同様ですが、
ユーザーへの問い合わせを行います。 ユーザーが同意すれば、
コマンドを実行します。
同意しなければ、
何もせずに false
を返します。
コマンドが実行される際に、
標準入力はリダイレクトされて、
/dev/null になります。
このオプションは
-files0-from
オプションとともに指定することはできません。
- プロンプトに対するユーザーの入力は、
肯定、
否定を表す一組の正規表現との一致確認が行われて、
同意したかどうかが決定します。
この正規表現は、
環境変数 POSIXLY_CORRECT
が設定されていれば、
システムから取得されます。
環境変数が設定されていなければ、
find
が持つメッセージ翻訳から取得されます。
システムに適切な定義が存在しなかった場合は、
find
自体が持つ定義が使用されます。
どの場合でも、
正規表現そのものの解釈は、
環境変数 LC_CTYPE
(文字クラス) や LC_COLLATE
(文字の範囲や等価クラス)
の影響を受けます。
- -okdir command
;
- -execdir と同様ですが、
-ok と同じように、
ユーザーへの問い合わせを行ないます。
ユーザーが同意しなければ、
何もせずに false
を返します。
コマンドが実行される際に、
標準入力はリダイレクトされて、
/dev/null になります。
このオプションは
-files0-from
オプションとともに指定することはできません。
- -print
- true を返します。
パス付きのファイル名と、
最後に改行文字をつけて、
標準出力に出力します。
find の出力を、
パイプを使って他のプログラムに受け渡している場合、
対象ファイル名に改行文字が含まれている可能性が、
少しでもあるなら、
-print ではなく、 -print0
アクションの使用を是非考えてください。
ファイル名に、
普通は使わない文字が含まれている場合の扱いについては、
「普通ではないファイル名」のセクションを参照してください。
- -print0
- true を返します。
パス付きのファイル名と、
最後にヌル文字をつけて、
標準出力に出力します
(-print
が改行文字をつけるのとは異なります)。
このアクションを使えば、
find
の出力を処理するプログラムが、
改行文字やホワイトスペースを含むファイル名を、
正しく解釈できるようになります。
このアクションは、
xargs の -0
オプションに対応します。
- -printf
format
- true を返します。
これは標準出力に
format を出力します。
format 内の `\'
によるエスケープや、
`%'
に始まるディレクティブを解釈します。
フィールドの幅や精度は、
C 言語の printf(3)
関数と同じ方法で指定することができます。
多くのフィールドは、
%d としてではなく、 %s
として出力されます。
このため、
フラグが期待通りに動作しないことも発生します。
一方で、 `-' フラグ
(フィールドを必ず左揃えにする指定)
を使えば、
必ず動作します。
-print とは違って、
-printf は、
文字列の末尾に改行文字を追加しません。
エスケープとディレクティブには、
以下のものがあります。
- \a
- 警告ベル。
- \b
- バックスペース。
- \c
- このフォーマットによる出力をすぐに停止して、
出力をフラッシュします。
- \f
- フォームフィード。
- \n
- 改行文字。
- \r
- 復帰文字。
- \t
- 水平タブ。
- \v
- 垂直タブ。
- \0
- ASCII NUL 文字。
- \\
- バックスラッシュ文字そのもの
(`\')。
- \NNN
- ASCII コードが NNN (8 進数)
の文字。
バックスラッシュ文字
`\' に、
上記以外の文字が続いた場合は、
`\'
が普通の文字として扱われます。 つまり、
2
文字とも表示されることになります。
- %%
- パーセント文字そのもの。
- %a
- ファイルの最終アクセス時間を、
C 言語の ctime(3)
関数が返す形式で表したものです。
- %Ak
- k
で指定された書式に基づいて、
ファイルの最終アクセス時間を表したものです。
k に指定するのは、
`@' か、 あるいは C
言語の strftime
関数で用いるディレクティブです。
以下に、 k
に指定可能な値を示します。
ただし、
すべてを示すものではありません。
完全な一覧については、
strftime(3)
のドキュメントを参照してください。
指定文字に応じた文字列変換は、
システムによっては利用できない場合があります。
それは、
ライブラリ関数
strftime(3) の実装が、
システムよって異なるからです。
- @
- Jan. 1, 1970, 00:00 GMT
からの経過秒数。
小数点以下も表示します。
時刻フィールド:
- H
- 時 (00..23)
- I
- 時 (01..12)
- k
- 時 ( 0..23)
- l
- 時 ( 1..12)
- M
- 分 (00..59)
- p
- 現在のロケールにおいて
AM/PM
に相当する文字列。
- r
- 12 時間制の時刻 (hh:mm:ss [AP]M)
- S
- 秒 (00.00 .. 61.00)。
小数点以下も表示します。
- T
- 24 時間制の時刻
(hh:mm:ss.xxxxxxxxxx)
- +
- 日付と時刻。
両者の間は `2004-04-28+22:22:05.0'
といったように '+' で
区切られます。
これは GNU 拡張です。
時間は、
現在のタイムゾーンによるものが用いられます
(したがって、
環境変数 TZ
の設定に影響を受ける場合があります)。
秒は、
小数点以下が含まれます。
- X
- 現在のロケールによる時刻表示
(H:M:S)。
秒は小数点以下を含みます。
- Z
- タイムゾーン (JST
など)。
タイムゾーンが決定できなかった場合は、
何も表示されません。
日付フィールド:
- a
- 現在のロケールによる曜日の短縮形
(Sun..Sat)。
- A
- 現在のロケールによる、
曜日の省略しない表示。
長さは可変 (Sunday..Saturday)。
- b
- 現在のロケールによる月名の短縮形
(Jan..Dec)。
- B
- 現在のロケールによる月名の省略しない表示。
長さは可変 (January..December)。
- c
- 現在のロケールによる日付と時刻の表示
(Sat Nov 04 12:02:33 EST 1989)。
この表示形式は、
ctime(3)
のものと同じであり、
ctime(3)
の形式との互換性を維持するためのものです。
秒は小数点表記されません。
- d
- その月の何日目かの表示
(01..31)。
- D
- 日付 (mm/dd/yy)。
- F
- 日付 (yyyy-mm-dd)。
- h
- b と同じ。
- j
- その年の何日目かの表示
(001..366)。
- m
- 月 (01..12)。
- U
- その年の何週目か
(日曜日を週の始まりとする)
(00..53)。
- w
- 曜日 (0..6)。
- W
- その年の何週目か
(月曜日を週の始まりとする)
(00..53)。
- x
- 現在のロケールによる日付表示
(mm/dd/yy)。
- y
- 年の下二桁 (00..99)。
- Y
- 年 (1970...)。
- %b
- ファイルが使用するディスク容量を、
1 ブロック 512
バイトのブロック数で表示します。
ディスク領域は、
ファイルシステムブロックサイズの倍数によって割り当てられるので、
たいていは %s/512
より大きくなります。
ただしスパースファイルの場合は、
%s/512
より小さくなることがあります。
- %Bk
- ファイルの生成時間。
フォーマットは k
によって指定します。
これは %A
に対するものと同じです。
処理を行っているオペレーティングシステムやファイルシステムが、
生成時間をサポートしていない場合、
このディレクティブは空文字を返します。
- %c
- ファイルの最終ステータス変更時間を、
C 言語の ctime(3)
関数が返す形式で表したものです。
- %Ck
- ファイルの最終ステータス変更時間を、
k
で指定した書式で表したものです。 k
は %A
の場合と同様です。
- %d
- ディレクトリツリー内で、
対象ファイルがどれだけ深い階層数にあるかを示します。
0 は、
対象ファイルが検索開始ポイントにあることを意味します。
- %D
- ファイルがどのデバイス上にあるかを、
10
進数のデバイス番号
(stat 構造体の st_dev
フィールド)
で示します。
- %f
- ベース名を表します。
ファイル名から、
先頭にあるディレクトリ名を取り除きます
(最後の要素のみを残します)。
/ に対する結果は `/'
です。
処理例については「例」セクションを参照してください。
- %F
- ファイルがあるファイルシステムのタイプを表します。
ここで表示される値は
-fstype
の引数に指定することができます。
- %g
- ファイルのグループ名を表します。
グループ名が存在しない場合は、
グループ ID
番号を表します。
- %G
- ファイルのグループ
ID 番号。
- %h
- ディレクトリ名を表します。
つまり、
ファイル名の先頭にあるディレクトリ部分
(最後の要素以外のすべて)
を表します。
ファイル名にスラッシュが一つも含まれない場合
(カレントディレクトリ内にあることになるので)、
書式指定子 %h は `.'
に展開されます。対象ファイルがディレクトリそのものであって、
スラッシュ /
を含む場合、 %h
は空文字に展開されます。
具体例は「例」セクションを参照してください。
- %H
- 検索開始ポイントのうち、
対象ファイルが見つかったものを表します。
- %i
- ファイルの i
ノード番号 (10
進数表示)。
- %k
- ファイルが利用するディスク容量を、
1 ブロック 1 KB
のブロック数で表示します。
ディスク領域は、
ファイルシステムのブロックサイズの倍数によって割り当てられるので、
たいていは %s/1024
より大きくなります。
スパースファイルの場合は、
%s/1024
より小さくなることがあります。
- %l
- シンボリックリンク先
(シンボリックリンクでない場合は、
空文字列)
を表します。
- %m
- ファイルの許可属性ビット
(8 進数表示)
を表します。
このオプションが使用している数値は、
たいていの Unix
実装において用いられる「従来の」数値です。
しかし利用中のシステム実装においては、
8
進数で表示する許可属性ビットの並び方が、
普通とは異なるかもしれません。
その場合は、
ファイルの許可属性の実際の値と、
%m
の出力とが異なることになります。
数値の先頭に 0
をつけて表示したい場合があります。
そのときは、 #
フラグを使って、
たとえば `%#m'
のようにします。
- %M
- ファイルの許可属性を表します
(ls
と同様のシンボルによる表現)。
このディレクティブは、
findutils 4.2.5
以降にサポートされるようになりました。
- %n
- ファイルのハードリンク数。
- %p
- ファイル名。
- %P
- 検索開始ポイント名を使って表現した、
対象ファイル名であって、
現在削除されたものを表します。
- %s
- バイト単位によるファイルサイズ。
- %S
- ファイルが「まばら」である度合い
(sparseness) を表します。
この値は (BLOCKSIZE*st_blocks / st_size)
として計算されます。
ある程度の大きさを持つ普通のファイルの場合、
その正確な値は、
システムによってさまざまです。
スパースファイルであれば、
「まばら」な度合いは、
普通は 1.0 未満です。
一方で、
間接ブロックを使用しているファイルの場合は、
1.0
以上になることがあります。
BLOCKSIZE
に設定される値は、
システムに依存しますが、
通常は 512
バイトです。
ファイルサイズが 0
の場合、
この値は未定義として出力されます。
st_blocks
をサポートしていないシステムでは、
ファイルの「まばら」な度合いは、
1.0 とみなされます。
- %t
- ファイルの最終更新時間を、
C 言語の ctime(3)
関数が返す形式で表したものです。
- %Tk
- k
で指定された書式に基づいて、
ファイルの最終更新時間を表したものです。
k は %A
の場合と同様です。
- %u
- ファイルを所有するユーザー名。
ユーザーに名前がない場合は、
ユーザー ID
番号が用いられます。
- %U
- ファイルを所有するユーザーの
ID 番号。
- %y
- ファイルタイプ (ls -l
の表現と同様です)。
U はタイプ不明 (unknown type)
を表します
(発生することはありません)。
- %Y
- ファイルタイプ (%y
と同様)。 さらに、
シンボリックリンクをたどります。
`L' はループ、 `N'
は非存在、 `?'
はその他のエラーであり、
シンボリックリンク先のタイプが決定できなかった場合です。
- %Z
- (SELinux 有効時のみ)
ファイルのセキュリティコンテキスト。
- %{ %[ %(
- 将来の利用のために予約されています。
1 つの `%' に対して、
上記以外の文字が続く場合、
`%' 文字は無視されて、
それに続いた文字が表示されます
(新たに指定文字が定義されるかもしれないため、
この動作に期待するのは避けてください)。
書式指定の文字列の最後に
`%' だけが 1 つあると、
次に文字がないため、
その動作は不定となります。
何が起きるか分かりませんから、
ロケールによっては、
ドアの鍵を紛失するかもしれませんし、
せっかく読んでいる小説の最後のページが、
なくなってしまうかもしれません。
ディレクティブ %m
と %d は、 書式フラグ
#, 0, +
をサポートします。
これ以外のディレクティブは、
数値を表す場合であっても、
このフラグをサポートしません。
このフラグをサポートしない数値関連のディレクティブには、
G, U, b, D, k, n
があります。
書式フラグとして `-'
もサポートされています。これを使えば、
欄出力の右揃え
(デフォルト)
を左揃えに変更することができます。
ファイル名に、
普通は使わない文字が含まれている場合の扱いについては、
「普通ではないファイル名」のセクションを参照してください。
- -prune
- true を返します。
処理対象がディレクトリである場合、
ディレクトリ内に入っていきません。
-depth
が指定してあると、
-prune
は何もしません。
-delete の指定には、
暗に -depth
の指定が含まれているので、
-prune と -delete
を同時に使うことはできません。
たとえば、 src/emacs
というディレクトリとその下にあるファイルやディレクトリはスキップするとします。
そしてそれ以外のファイルを表示しようとする場合には、
以下のように実行します。
find . -path ./src/emacs -prune -o -print
- -quit
- すぐに終了します
(エラーが発生していなければ
0 を返します)。
これは -prune
とは異なります。
-prune は、
適用されたディレクトリの内容を、
対象外とするものですが、
-quit は単純に find
をその場で止めます。
子プロセスが残ることはありません。
コマンドラインが、
-exec ... + や
-execdir ... +
の形式で構成されていた場合、
そのコマンドはすべて呼び出されてから、
プログラムが終了します。
-quit
が実行されると、
コマンドライン上に指定されていた残りのファイルは、
処理されません。
たとえば
`find /tmp/foo
/tmp/bar -print -quit`
では、 `/tmp/foo`
だけが表示されます。
-quit
を利用するごく普通のケースとして、
ファイルシステム内から検索したいものが見つかったら、
検索をやめるという使い方があります。
たとえば、 1
つのファイルだけを見つけたい場合には、
以下のようにすることができます。
find / -name needle -print -quit
オペレーター
以下ではオペレーターを、
優先順位の高いものから順に示します。
- ( expr )
- カッコ内を優先的に処理します。
シェルにとって、
カッコには特別な意味があるため、
普通はクォートでくくる必要があります。
このマニュアルページであげている例では、
この目的でバックスラッシュを多用しています。
つまり `(...)' は、 `\(...\)'
のように記述しています。
- ! expr
- expr が false の場合に true
となります。
通常この記号も、
シェルによって解釈されないようにする必要があります。
- -not expr
- ! expr と同様ですが、
POSIX
には準拠していません。
- expr1 expr2
- 2 つ並んだ式は、
暗に -a
によって結合されたものとして扱われます。
そして expr1 が false
の場合、 expr2
は評価されません。
- expr1 -a
expr2
- expr1 expr2 と同じです。
- expr1 -and
expr2
- expr1 expr2
と同様ですが、 POSIX
には準拠していません。
- expr1 -o
expr2
- OR 結合です。 expr1 が true
のとき、 expr2
は評価されません。
- expr1 -or
expr2
- expr1 -o expr2
と同様ですが、 POSIX
には準拠していません。
- expr1 ,
expr2
- リストを表します。
必ず expr1 と expr2
の両方が評価されます。
expr1
の値は無視されて、
expr2 の値が、
リストとしての値になります。
このカンマオペレーターは、
さまざまな種類のものを探すときに便利です。
ただしファイルシステム内の検索は、
一度しか行われません。
さまざまなものに一致した結果を、
複数ファイルに出力するには、
-fprintf
アクションを利用します。
暗に -a
の指定を意図した場合
(たとえばテストとテストの間に、
このオペレーターを記述しなかった場合)、
あるいは明示的に指定した場合は、
-o
よりも優先順位が高いことを覚えておいてください。
たとえば、 find . -name afile -o -name
bfile -print とした場合、
afile
が出力されることはない、
ということです。
普通ではないファイル名
find
のアクションの多くでは、
他ユーザーが、
出力されるデータを自由に制御できます。
データには、
ファイル名、
サイズ、
更新時間など、
さまざまなものがあります。
ファイル名は、 `\0' と `/'
以外の文字であれば、
何でも含めることができるため、
潜在的な問題を抱えています。
ファイル名の中に、
普段用いない文字が含まれていると、
端末に対して、
予期しない動作や、
時には望ましくない事態を引き起こすことも可能です。
(たとえば端末次第では、
ファンクションキーの設定変更が行われてしまうかもしれません)。
普段使わない文字を、
どのように処理するかについては、
アクションごとに動作が異なります。
以下にこのことを示します。
- -print0,
-fprint0
- 常にファイル名を修正せずに、
そのまま出力します。
出力先が端末であっても同じです。
- -ls, -fls
- 普段使わない文字は、
必ずエスケープされます。
ホワイトスペース、
バックスラッシュ、
ダブルクォートは、 C
言語のようなエスケープ表現で出力されます
(`\f', `\"' など)。
その他の文字では、 8
進数表記によってエスケープして出力されます。
通常の表示可能な文字
(-ls や -fls
においては、 8
進数の 041 から 0176
に相当する文字) は、
そのまま出力されます。
- -printf,
-fprintf
- 出力先が端末でない場合は、
そのまま出力されます。
出力先が端末の場合は、
利用するディレクティブによって、
出力は変わります。
ディレクティブ %D, %F, %g, %G,
%H, %Y, %y
が展開される値は、
ファイル所有者が制御するものではないため、
そのまま出力されます。
ディレクティブ %a, %b, %c, %d,
%i, %k, %m, %M, %n, %s, %t, %u, %U の値は、
ファイル所有者が制御可能なものですが、
だからと言って、
端末に任意にデータ送信してよいものではありません。
したがってこのときのデータも、
そのまま出力されます。
ディレクティブ %f, %h, %l, %p,
%P の出力値は、
クォートでくくられます。
クォートでくくるこの方法は、
GNU ls
の場合と同じです。
逆に -ls や -fls
における方法とは異なります。
find
の出力書式を自由に定めてよい、
ということになれば、
普通は、
終端文字として改行ではなく、
`\0'
を用いるように変更するのが適切です。
これを行うのは、
ファイル名に、
空白や改行が含まれる場合があるためです。
どの文字をクォートでくくるかは、
環境変数 LC_CTYPE
の設定を用いて決定されます。
- -print, -fprint
- クォートでくくる方法は、
-printf や -fprintf
と同じです。 find
をスクリプト内で利用する場合や、
一致したファイルにあらゆる文字が含まれる可能性がある場合には、
-print
を用いるのではなく、
-print0
を用いるようにしてください。
アクション -ok と
-okdir は、
対象ファイル名をそのまま出力します。
この動作は、
将来のリリースで変わるかもしれません。
規格への準拠
POSIX
規格にできるだけ準拠した動作が必要であれば、
環境変数 POSIXLY_CORRECT
を設定してください。
以下のオプションは、
POSIX 規格 (IEEE Std 1003.1-2008, 2016 Edition)
の中で規定されています。
- -H
- このオプションはサポートされています。
- -L
- このオプションはサポートされています。
- -name
- このオプションはサポートされていますが、
POSIX への適応は、
システムの fnmatch(3)
ライブラリ関数が、
どれだけ POSIX
に準拠しているかによって、
変わります。 findutils-4.2.2
以降、
シェルのメタ文字
(たとえば `*', `?', `[]') は、
ファイル名先頭の `.'
文字に一致するようになりました。
これは IEEE PASC interpretation 126
の要求に従ったものです。
これは、 それ以前の
findutils
のバージョンから、
変更されている点です。
- -type
- サポートされています。
POSIX では `b', `c', `d', `l', `p', `f', `s'
を規定しています。
GNU find は、 この他にドア
(door) を表す `D'
もサポートしています。
これが使えるのは、
OS
がこの機能を提供している場合です。
さらに、 GNU find では、
複数の型指定を一度に行うことが可能であり、
その場合には、
カンマで区切ったリストを指定します。
- -ok
- サポートされています。
プロンプトに対する入力は、
`yes'、 `no'
を表すパターンに従って解釈されます。
そのパターンは、
環境変数 LC_MESSAGES
の設定内容により決定します。
環境変数 POSIXLY_CORRECT
が設定されている場合は、
そのパターンが、
`yes'、 `no'
の入力に対するシステム定義として扱われます。
nl_langinfo(3)
に関するドキュメント、
特に YESEXPR と NOEXPR
について参照してください。
POSIXLY_CORRECT
が設定されていない場合、
そのパターンは、
find
が持っているメッセージカタログから取得されます。
- -newer
- サポートされています。
指定されたファイルがシンボリックリンクの場合は、
必ずリンク先が参照されます。
これは以前のバージョンから変更されたものであり、
以前は、
比較に用いる時間をシンボリックリンクから取得していました。
「履歴」セクションを参照してください。
- -perm
- サポートされています。
環境変数 POSIXLY_CORRECT
が設定されていない場合には、
POSIX
では認められていない
(たとえば、 +a+x
のような)
モード引数であっても、
後方互換のために利用できるものがあります。
- その他のプライマリ
- 式を構成するプライマリ
(primary) として、 -atime, -ctime,
-depth, -group, -links, -mtime,
-nogroup, -nouser, -perm, -print,
-prune, -size, -user -xdev が、
すべてサポートされています。
POSIX 規格は、 カッコ
`(', `)'、 否定 `!'、 論理 AND/OR
のオペレーター -a,
-o
を規定しています。
上記を除いたオプション、
述語、 式などは、
すべて POSIX
規格にはない拡張です。
ただしその拡張の多くは、
GNU find
に特有なものではありません。
POSIX 規格における find
は、
ループの検出ができなければならないと定めています。
- find
ユーティリティは、
無限ループを検出できなければなりません。
無限ループとは、
処理対象となったファイルの上位ディレクトリが、
以前に処理していたものであって、
そのディレクトリに入ることです。
無限ループを検出した場合、
find は、
診断メッセージを標準エラー出力に書き出すものとします。
そして、
ディレクトリ階層上での検索位置を復旧するか、
あるいは終了するものとします。
GNU find は、
この要件を満たしています。
上位ディレクトリへのハードリンクを含んだディレクトリと、
そういったものを含まないディレクトリを比較してみると、
ディレクトリのリンク数は、
前者の方が少なくなることがよくあります。
このことがあるため、
上位ディレクトリへのリンクであるサブディレクトリに対して、
GNU find は、
最適化によって、
そのディレクトリを調べないケースが発生します。
find は実際に、
そういったサブディレクトリに入っていかないため、
診断メッセージの出力を抑えることができます。
わかりにくい処理かもしれませんが、
実際にこの動作に期待する人は、
まずいません。 -noleaf
オプションの指定によって、
葉 (leaf)
に関する最適化処理が無効になっていた場合、
ディレクトリの各エントリは、
必ず調べられます。
したがって診断メッセージは、
必要な場面で表示されます。
シンボリックリンクを使っていれば、
ファイルシステム上にこのようなリンクを作り出すことはできません。
ただし -L
オプションや -follow
オプションを指定しているときには、
シンボリックリンクのループが見つかると、
診断メッセージが表示されます。
ハードリンクを含むループの場合と同様に、
葉に関する最適化によって、
find
がシンボリックリンクに対して、
stat() や chdir()
を用いる必要がないと判断することがあるため、
診断情報は、
かなりの頻度で必要なくなります。
-d オプションは、
各種の BSD
システムとの互換性のためにサポートされています。
したがって、
これを使うのではなく、
POSIX に準拠する -depth
オプションを用いてください。
環境変数 POSIXLY_CORRECT
は、 テスト -regex や
-iregex
の動作に影響を与えません。
こういったテストは、
POSIX
では規定されていないためです。
環境変数
- LANG
- 国際化関連の環境変数において、
値が設定されていない、
あるいは null
であるものに対して、
デフォルト値を提供します。
- LC_ALL
- この環境変数に、
空文字列ではない値が設定されていれば、
国際化関連の環境変数を上書きします。
- LC_COLLATE
- POSIX の規定では、
この環境変数は、
テスト -name
で用いられるパターンマッチングに影響を及ぼします。
GNU find は、 fnmatch(3)
ライブラリ関数を利用しているので、
LC_COLLATE への対応は、
システムのライブラリ次第です。
またこの変数は、
アクション -ok
の入力値の解釈にも影響します。
-ok
における入力値を解釈するものとして、
実際に用いられるパターンは、
LC_MESSAGES
変数の値によって決定されますが、
そのパターンの中に角カッコによる表現が用いられていると、
LC_COLLATE
の影響を受けることになります。
- LC_CTYPE
- システムの fnmatch(3)
ライブラリ関数がこの環境変数をサポートしている場合、
この環境変数は、
正規表現で使用される文字クラスと、
-name
テストで使われる文字クラスの扱い方に影響を及ぼします。アクション
-ok
のプロンプトにおけるユーザー入力値の解釈には、
正規表現が用いられますが、
この変数は、
その正規表現内の文字クラスの判断に影響します。
環境変数 LC_CTYPE は、
ファイル名の表示時に、
表示できない文字を判断する処理に影響します。
「普通ではないファイル名」のセクションを参照してください。
- LC_MESSAGES
- 国際化されたメッセージで使用するロケールを設定します。
環境変数 POSIXLY_CORRECT
が設定されている場合は、
この変数によって、
アクション -ok
のプロンプト入力値に対する解釈が決定します。
- NLSPATH
- 国際化メッセージカタログを置く場所を設定します。
- PATH
- -exec, -execdir, -ok, -okdir
から呼び出される実行ファイルが、
どこにあるかを検索するディレクトリに影響します。
- POSIXLY_CORRECT
- -ls や -fls
が使用するブロックサイズを決定します。
POSIXLY_CORRECT
が設定されている場合は、
1 ブロックが 512
バイト、
設定されていない場合は、
1 ブロックが 1024
バイトになります。
- またこの変数を設定すると、
デフォルトで警告メッセージを出力しません
(つまり -nowarn
が暗に指定されます)。
なぜなら POSIX
の規定では、 -ok
のプロンプトを除くと、
標準エラーに出力されるメッセージは、
すべて診断情報であり、
終了ステータスは 0
以外を返さなければならないからです。
- POSIXLY_CORRECT
が設定されていない場合、
+zzz
が適正なシンボリックモード表現でなかったら、
-perm +zzz
という記述は、 -perm
/zzz
として扱われます。
POSIXLY_CORRECT
が設定されている場合、
この記述はエラーになります。
- POSIXLY_CORRECT
が設定されていると、
アクション -ok
のプロンプトに対する入力値の解釈は、
find
の持つメッセージ翻訳を用いるのではなく、
システムのメッセージカタログに従って行われます。
- TZ
- タイムゾーンに影響します。
タイムゾーンは、
-printf や -fprintf
の時間関連ディレクティブにおいて利用されます。
例
単純な `find|xargs`
のアプローチ
- •
- /tmp
ディレクトリ以下にある、
core
という名前のファイルを探して、
それを削除します。
$ find /tmp -name core -type f -print | xargs /bin/rm -f
ただし、
ファイル名の中に、
改行、
シングルクォート、
ダブルクォート、
空白文字が含まれる場合には、
このコマンドは正しく動作しません。
安全な `find -print0 | xargs -0`
によるアプローチ
- •
- /tmp
ディレクトリ以下にある、
core
という名前のファイルを探して、
それを削除します。
ファイルやディレクトリの名前に、
シングルクォート、
ダブルクォート、
空白、
改行などが含まれていても、
適切に処理されます。
$ find /tmp -name core -type f -print0 | xargs -0 /bin/rm -f
テスト -name は、 -type
よりも前に置いています。
これは、 stat(2)
の呼び出しが、
すべてのファイルに対して行われることを防ぐためです。
ただし、 find
がファイルシステム内を検索して、
一致するファイルを出力する時間と、
xargs
によるコマンド起動がそのファイルを処理する時間との間では、
まだ競合が発生する点に注意してください。
任意の検索開始ポイントからの処理
- •
- プログラム proggy
というものがあるとして、
あらかじめ処理を行って、
大量のNUL
区切りのファイル一覧を作るものであったとします。
これを検索開始ポイントととして処理を行って、
その中から通常ファイルと空のファイルを検索します。
$ proggy | find -files0-from - -maxdepth 0 -type f -empty
`-files0-from -`
と記述している部分は、
検索開始ポイントとする名前を
標準入力 から、
つまりパイプから読み込むことを表しています。
そして -maxdepth 0
はサブディレクトリへの再帰的な検索は行わずに、
そこに明示された対象のみを検索するようにしています
(検索開始ポイントの指定がただ
1 つである場合)。
各ファイルに対するコマンド実行
- •
- カレントディレクトリ以下の各ファイルに対して
file を実行します。
$ find . -type f -exec file '{}' \;
波カッコをシングルクォートで囲んでいる点に注意してください。
これは、
句読点がシェルスクリプトの記号として、
解釈されないようにするためです。
同様のこととして、
セミコロンもバックスラッシュを使ってエスケープしています。
シングルクォートを使うのでもかまいません。
性能やセキュリティのことを考慮すると、
`-exec ... +`
という記述が望まれるケースが多いかもしれません。
異なる 2
つのアクション、
ファイルシステム検索は
1 回
- •
- ファイルシステムを検索するのは
1 回だけにして、 setuid
ビットが立っているファイルやディレクトリの一覧は
/root/suid.txt に出力し、
サイズが大きいファイルの一覧は
/root/big.txt
に出力するようにします。
$ find / \
\( -perm -4000 -fprintf /root/suid.txt '%#m %u %p\n' \) , \
\( -size +100M -fprintf /root/big.txt '%-10s %p\n' \)
この例では、 初めの 2
つの行に対して、
行継続文字 '\'
を用いています。
シェルがコマンド読み込みを行うにあたって、
次の行も継続して読み込むように指示しています。
期間の指定を使ったファイル検索
- •
- ホームディレクトリ内のファイルの中から、
修正時間が 24
時間未満のファイルを検索します。
$ find $HOME -mtime 0
このコマンドがそういう動作になるのは、
各ファイルの最終更新時間が、
24
時間単位で割られて、
余りは捨てられるからです。
つまり、 ファイルが
-mtime 0
に一致するのは、
過去 24
時間未満の間に更新されていることを表します。
許可属性を使ったファイル検索
- •
- 実行可能であり、
読み出し不能なファイルを探します。
$ find /sbin /usr/sbin -executable \! -readable -print
- •
- ファイルの所有者とグループが読み書き可能であって、
他ユーザーは、
読み込みのみで書き込み不可であるファイルを探します。
$ find . -perm 664
上に示す条件を満たすファイルであっても、
さらに別の許可属性ビットも立っているようなファイル
(たとえば、
他ユーザーが実行できるなど)
は、
この条件に一致しません。
- •
- ファイルの所有者とグループが読み書き可能であり、
他ユーザーも読み込みが可能であるようなファイルを探します。 それ以外の許可属性ビット
(たとえば実行ビット)
が立っていてもかまいません。
$ find . -perm -664
したがって上は、
たとえばモードが
0777
であるようなファイルにも一致します。
- •
- (ファイルの所有者、
グループ、
他ユーザーの誰でも良いから)
書き込み可能なファイルを探します
$ find . -perm /222
- •
- ファイルの所有者あるいはグループのいずれかが、
書き込み可能なファイルを探します。
$ find . -perm /220
$ find . -perm /u+w,g+w
$ find . -perm /u=w,g=w
上のコマンドは 3
つとも同じ動作をします。
1 つめは、
ファイルの許可属性を
8
進数で表しています。
残りの 2 つは、
シンボルによる表現形式を利用しています。
ファイルが一致する際には、
所有者とグループの両方が書き込み可能である必要はなく、
どちらか一方が満たされれば一致します。
- •
- ファイルの所有者あるいはグループが、
ともに書き込み可能であるようなファイルを探します。
$ find . -perm -220
$ find . -perm -g+w,u+w
上のコマンドは同じ処理を行ないます。
- •
- 権限に関して、
さらに複雑な検索を以下に示します。
$ find . -perm -444 -perm /222 \! -perm /111
$ find . -perm -a+r -perm /a+w \! -perm /a+x
この 2
つのコマンドは、
両方とも次のような条件のファイルを探します。
つまり、
誰にでも読み出すことが可能
(-perm -444 または -perm -a+r)
であって、
書き込み許可ビットが少なくとも
1 つは立っているもの
(-perm /222 または -perm
/a+w)、
ただし誰にも実行ができないもの
(! -perm /111 や ! -perm /a+x)、
というものです。
除外 -
ファイルやサブディレクトリの除き方
- •
- /source-dir の内容を /dest-dir
にコピーします。
ただし .snapshot
という名前のファイル、
またはディレクトリ
(その中身)
は除きます。
さらに、 名前が `~'
で終わるファイル、
またはディレクトリも除きますが、
その中身までは除きません。
$ cd /source-dir
$ find . -name .snapshot -prune -o \( \! -name '*~' -print0 \) \
| cpio -pmd0 /dest-dir
-prune -o \( ... -print0 \)
という形は、
ごく普通に利用されます。
考え方としては、
-prune
の前にある式が、
取り除く対象になるということです。
アクション -prune
自体は、
返り値として true
を返します。
したがって、 直後に
-o があるおかげで、
取り除き (prune)
の対象にならなかったディレクトリが、
-o
の右辺によって評価されることになります
(取り除きの対象になったディレクトリの中身は、
処理の対象になっていないので、
中身を考慮する必要はありません)。
-o
の右辺の式をカッコで囲んでいるのは、
わかりやすくするためです。
このように記述することで、
アクション -print0
の処理対象が、 -prune
の処理対象以外あることが、
はっきりします。
テストとテストの間にある
`and' 条件は、 -o
よりも強く結びつくものであって、
それがデフォルトになっていますが、
カッコで囲めば、
どのように処理されるかがよくわかります。
- •
- 以下に示されるようなプロジェクトディレクトリがあって、
さらに、 関連する SCM
の管理ディレクトリがあるとします。
これに対して、
プロジェクトルートから効率の良い検索を行います。
$ find repo/ \
\( -exec test -d '{}/.svn' \; \
-or -exec test -d '{}/.git' \; \
-or -exec test -d '{}/CVS' \; \
\) -print -prune
出力例:
repo/project1/CVS
repo/gnu/project2/.svn
repo/gnu/project3/.svn
repo/gnu/project3/src/.svn
repo/project4/.git
この例では、 -prune
を指定することによって、
すでに対象が見つかったディレクトリの配下は、
それ以上の検索が不要なので、
検索を行わないようにしています
(たとえば project3/src
は検索されません。
その理由は project3/.svn
が、
すでに見つかっているからです)。
しかし、
となり合わせのディレクトリ
(たとえば、 project2 と
project3) は、
確実に検索されます。
この他の利用例
- •
- 複数のファイルタイプを検索します。
$ find /tmp -type f,d,l
ファイルタイプとして、
カンマ区切りのリスト
(GNU 拡張) を指定して、
それぞれファイル、
ディレクトリ、
シンボリックリンクを
/tmp
ディレクトリの中から検索します。
同じことは、
やや長くなりますが、
移植性の高い記述として、
以下のようにしても同じです。
$ find /tmp \( -type f -o -type d -o -type l \)
- •
- 特定の名前 needle
を持ったファイルを検索して、
最初にそれが見つかった時点で、
すぐに終了するようにします。
$ find / -name needle -print -quit
- •
- -printf
アクションの書式ディレクティブ
%f と %h が、
境界条件において、
どのように解釈されるかを示します。
$ find . .. / /tmp /tmp/TRACE compile compile/64/tests/find -maxdepth 0 -printf '[%h][%f]\n'
[.][.]
[.][..]
[][/]
[][tmp]
[/tmp][TRACE]
[.][compile]
[compile/64/tests][find]
終了ステータス
find は、
すべてのファイルを正常に処理できれば、
ステータス 0
で終了します。
エラーが起きた場合は、
1 以上を返します。
ここでは、
わざと大まかな説明としていますが、
返り値が 0
以外だった場合、 find
の結果は正しいと思わないでください。
エラーが発生した場合、
find は、
指定されたアクションを完了しないまま、
その場で終了することがあります。
たとえば、
検索開始ポイントの中には、
検索されずに終わるものもあります。
あるいは -exec ... {} +
や -execdir ... {} +
において、
まだ呼び出しが行われていないプログラムが、
実行されないまま終了することもあります。
履歴
findutils-4.2.2 以降、
ファイル名のパターンに使われるシェルのメタ文字
(`*', `?', `[]' など) は、 先頭の
`.' に一致します。
これは IEEE POSIX interpretation 126
が要求しているためです。
findutils-4.3.3 以降 -perm /000
は、
どんなファイルにも一致しない、
ではなく、
すべてのファイルに一致する、
になりました。
ナノ秒まで表現するタイムスタンプは、
findutils-4.3.3
で実装されました。
findutils-4.3.11 以降、
アクション -delete
の処理に失敗すると、
find
の終了ステータスは 0
以外の値になります。
ただし、 find は、
その場ですぐには終了しません。
以前のバージョンでは、
-delete
の処理が失敗しても、
find
の終了ステータスとは無関係でした。
機能 |
追加時期 |
他システムの対応 |
-files0-from |
4.9.0 |
-newerXY |
4.3.3 |
BSD |
-D |
4.3.1 |
-O |
4.3.1 |
-readable |
4.3.0 |
-writable |
4.3.0 |
-executable |
4.3.0 |
-regextype |
4.2.24 |
-exec ... + |
4.2.12 |
POSIX |
-execdir |
4.2.12 |
BSD |
-okdir |
4.2.12 |
-samefile |
4.2.11 |
-H |
4.2.5 |
POSIX |
-L |
4.2.5 |
POSIX |
-P |
4.2.5 |
BSD |
-delete |
4.2.3 |
-quit |
4.2.3 |
-d |
4.2.3 |
BSD |
-wholename |
4.2.0 |
-iwholename |
4.2.0 |
-ignore_readdir_race |
4.2.0 |
-fls |
4.0 |
-ilname |
3.8 |
-iname |
3.8 |
-ipath |
3.8 |
-iregex |
3.8 |
-perm +MODE
という文法は、 findutils-4.5.12
において削除されました。
代わりに、 -perm /MODE
を使用してください。 +MODE
という文法は、 2005
年にリリースされた
findutils-4.2.21 以降、
非推奨となっています。
バグではないもの
意外なオペレーター優先順位
以下のようなコマンド
find . -name afile -o -name bfile -print は、
afile
を出力しません。
なぜなら実際には find .
-name afile -o \( -name bfile -a -print \)
と同じものだからです。
-a の優先順位は -o
よりも高いことを忘れないでください。
またテストとテストの間に、
オペレーターが指定されていないければ、
-a
であるとみなされる点も注意してください。
エラーメッセージ
“paths must precede expression”
$ find . -name *.c -print
find: paths must precede expression
find: possible unquoted pattern after predicate `-name'?
*.c
というパターンをシェルが展開した際に、
カレントディレクトリの複数ファイルに該当した場合に、
このエラーが発生します。
この場合には、
対象となったファイル名が、
find
におけるコマンドライン上に、
以下のように受け渡されることになります。
find . -name frcode.c locate.c word_io.c -print
上のコマンドは、
もちろん動作しません。
述語表現である -name
の引数は、
パターンを 1
つしか受けつけないからです。
そのような記述とするのではなく、
パターンの表現部分は、
クォートでくくるか、
ワイルドカードをエスケープしてください。
以下のようにすることで、
ファイル名がシェルによって展開されることなく、
find
のファイル名の一致検索の際に、
ワイルドカードを用いたパターン検索ができるようになります。
$ find . -name '*.c' -print
$ find . -name \*.c -print
バグ
POSIX が規定する find
の動作には、
セキュリティ上の問題があって、
これを修正することはできません。
たとえば、
アクション -exec は、
本質的に安全ではないため。
代わりに -execdir
を使ってください。
環境変数 LC_COLLATE
は、 アクション -ok
に対しては、
何の効果も及ぼしません。
バグ報告
GNU findutils
オンラインヘルプ:
<https://www.gnu.org/software/findutils/#get-help>
翻訳に関するバグ報告
<https://translationproject.org/team/>
その他の問題について
GNU Savannah
バグトラッカー経由での報告:
<https://savannah.gnu.org/bugs/?group=findutils>
GNU findutils
パッケージのメーリングリスト
bug-findutils
において議論されている全般的なトピック:
<https://lists.gnu.org/mailman/listinfo/bug-findutils>
著作権
Copyright © 1990-2022 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later
<https://gnu.org/licenses/gpl.html>.
This is free software: you are free to change and redistribute it. There is NO
WARRANTY, to the extent permitted by law.
関連項目
chmod(1), locate(1), ls(1),
updatedb(1), xargs(1), lstat(2), stat(2),
ctime(3) fnmatch(3), printf(3), strftime(3),
locatedb(5), regex(7)
完全なドキュメント
<https://www.gnu.org/software/findutils/find>
またローカルにおいては
info find
により参照できます。