スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
  1. --/--/--(--) --:--:--|
  2. スポンサー広告

大量にある画像キャッシュ

キャッシュ消さずにいたら30万ファイルになった。
ブラクラ削除したものや画像じゃない404や503のファイルも大量にあるようだけど。

ファイルが多すぎてなかなかエクスプローラではJaneのキャッシュが置いてあるディレクトリを開けないんだよね。
開いたところで、画像見られないから、みても仕方ないけどね。



Janeのキャッシュが置いてあるディレクトリのファイルを調べてVCHファイル名、NGFiles.txt互換ハッシュ、VCHファイルの作成アクセス更新日時をSqlite3でDBに保存するプログラムを作ってみた。

初回実行は、NGFiles.txt互換ハッシュを作るためにHDDガリガリしちゃうよ。
次からはFindFirstFileして、DBにあるVCHファイルの作成アクセス更新日時と同じものはNGFiles.txt互換ハッシュを調べ直さないので余りHDDガリガリはしない。
意図的にWM_TIMERで少しずつ処理しているので時間はすごいかかるけどね。

DBファイルが49MBもあり、PupSQLite.exeで開くとき少々待たされる。
SELECT COUNT(fileName) FROM vch;
結果
307291

もともとは、NGFiles.txtの嘘報告を調べる目的で考えてみた。



これで完成ではない。
今度は、NGFiles.txt互換ハッシュ、オリジナル情報、画像ファイル番号、サムネイル情報っていう別DBファイルを作ろうかと思っている。
でも忙しいから完成は未定。というか、このまま作らなかったりして。

簡単に言うとThumbs.dbファイルみたいなものを作るってことだ。画像データはDBではなく別ファイルにする。
Thumbs.dbファイルは1つでは足りないかもしれないので画像ファイル番号を設ける。

専用ビュアを作らないとだな。
グロかもしれないので、デフォルトでぼかしいれた表示にすべきか迷う。
そもそも、使い物になるくらい高速に動作してくれるビュアになるだろうか。

単なるデータではなくDBMSを用いたDBにしたことは正解だと思っている。
でも正直なところ判らん。
最近のコンピュータなら、DBMSつかわずに何の工夫もなくデータをファイル保存したり、定番のアルゴリズムで検索しても充分速いかもしれないな。

ついでに、タグ付けしてみたいな。
普通にキーワードを文字で入れてたら、DBファイルは大きくなるし、文字列の全文検索って遅そうだな。遅かったり検索できないタグ付けはつまらんし。



VCHファイル名やNGFiles.txt互換ハッシュから元URLや元スレッドをたどる仕組みはない。
膨大なDATから調べるの大変だから。
でもついでに自動タグ付けなんてできたら面白そうとは思っている。
しかしそれは難しい。
嘘の書き込みが多いから。

最近のGoogle画像検索って色指定とか大きさ指定とか似たような画像を検索するとか高度になってきているな。俺には似たようなことできない。できたら便利そう。あと自動グロ判定とか作れたらいいのになあ。
  1. 2009/12/17(木) 00:28:27|
  2. JaneStyle
  3. | コメント:0
<<Firefox INPUT type=fileでキー入力が効かないし、取り消せない | ホーム | ビデオの録画の話>>

コメント

コメントの投稿


管理者にだけ表示を許可する

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。