XML DB

10万くらいのRSSをうまく管理するのはどうすっかなーと
新しいシステムについてつらつら考えていたのだけれど、
ふとXMLベースのDBってどうなんだろうと思い出して調査開始。

キャッシュがきかない、トランザクションがきかない
とかI/O周りの負荷が高すぎて
結局具合のいいパーサかいてやるか
一旦mysqlに格納しちまったほうがよさそうだなー

と思いつつとりあえず使ってみた。

Xprioriってのでテスト
Xpriori

ここらへんを参考にXquery(SQLの代わりに投げるDB用クエリ)をいじってみる
Xquery

・・・
スキーマレスDBっていうのは
RSSのようにスキーマがガンガン変わるようなものを
一括で管理するにはいいとおもったんだけど、
どうも勝手がちがったw

JOINとかは1ファイル1テーブルで、JOINはファイルを結合してくイメージだから・・
あかんw10万ファイルをJOIN(実質MAX1000くらいなんだろうけど)
とか気が遠くなるこれw

10万ファイルをDBに格納してRSSを生成しなおすのと(こっちは格納コストが高い)
ファイルとして保持して、Xqueryで生成するのと・・(こっちは生成コストが高い)
うーん ちょっと簡単にはコスト計算できそうもないので、要検証。
パーサ書くほうが楽しいしとりあえずやめよっかなーとか。

余談だけどXqueryに関するこの記事をよんで
めっちゃ面白そうだとはおもった
http://d.hatena.ne.jp/stemy/20060708/1152385620