現在地 HOME > 掲示板 > IT1 > 496.html ★阿修羅♪ |
|
エディタと処理ファイルサイズとGREPのすごさ。
あくまでも、小生が使っているQXの場合です。現在、英辞郎の元テキ
ストデータファイルのサイズが、59MBです。
つまり、59000000B(バイト)です。
全角一文字が、2Bなので、
59000000B÷2=29500000Bです。つまり、英辞郎ファ
イルには全角換算で2950万文字の情報が入っていることになります。
実際にはアルファベット部分は半角なので、実際の文字数は想像を超えて
ます。
QXで、ファイルサイズの限界とかの話題もいままで聞いた覚えがない
です。多分限界はハードディスクの空きサイズが限界だと思います。(^^;
但し、ファイルサイズをエンセンさんのように巨大にすることはあまりお
勧めできないです。理由はいくつかあります。
1、使い勝手の問題です。ファイルをメディアにコピーして持ち運びたい
時があります。ほどほどの大きさにしておいた方が使いやすいでしょう。
2、エディタで作ったテキストファイルの場合、GREPで検索すると、
同じキーワードあるいは同じキーワードをAND検索したものの候補を
猛烈なスピードで検索探し出してくれます。アッと言う間です。複数の
ファイルに分かれているものでもあたかも一つのファイルかのごとくま
とめて検索→結果表示をしてくれます。
3、元データファイルが大きすぎると、「 and 」でキーワードを二つ組
み合わせたくらいでは検索結果が多く出過ぎることがあいます(その場
合でも、キーワードを三つ、あるいは四つ組み合わせれば困ることはな
いですが、、)。データをある程度整理して、サブフォルダに整理し、
検索時にサブフォルダを検索対象として切換えたりして検索・データ管
理した方が使い勝手が良いです。逆に候補が少ないようであれば、親フ
ォルダの時に、「サブフォルダも検索する」のチェックを入れたりして
調節します。
※一寸面白い実験をしてみます。エディタの基本機能・GREPのすごさ
を実感できると思います。
この投稿文をテキストファイルで一旦保存します。
C:ドライブ全体を、QGREPでキーワード検索します。またWindows
のエクスプローラーの文字検索でも同じく検索します。比べます。
◎先ず、Windowsのエクスプローラーの文字検索の方でやります。
コピペで「エディタと処理ファイルサイズ」をきっちり検索文字とし
て指定します。エクスプローラーの方はGREPでは出来る「 and 検
索」とかは出来ないからです。
検索が該当ファイルをヒットしたのは、18分15秒。その後、延々
と処理続行、35分過ぎても終わらないので中止ボタンで止めた。
◎次に、QGREPでやります。
検索キーは、うろ覚えと言うことで「エディタ and ファイルサイズ」
でやります。実際にはこう言う具合にキッチリでなくうろ覚えキーワー
ドの組合せでやることの方が多いでしょう。
検索が該当ファイルをヒットしたのは、約35秒。全C:を検索し終
わったのは、約5分でした。
※タグジャンプを使うのでなければヒットした段階で検索をストップし直
接ファイルを開いてもOKです。QGREPは下の窓にヒットした該当
ファイル名と該当ヒットした論理行を表示するからです。
※実際には、C:全体を検索すると言うのはそれほどないでしょう。ホル
ダをきめてデータ管理していればもっと検索は早いです。約1秒くらい
の感じです。