10万くらいのRSSをうまく管理するのはどうすっかなーと
新しいシステムについてつらつら考えていたのだけれど、
ふとXMLベースのDBってどうなんだろうと思い出して調査開始。
キャッシュがきかない、トランザクションがきかない
とかI/O周りの負荷が高すぎて
結局具合のいいパーサかいてやるか
一旦mysqlに格納しちまったほうがよさそうだなー
と思いつつとりあえず使ってみた。
Xprioriってのでテスト
Xpriori
ここらへんを参考にXquery(SQLの代わりに投げるDB用クエリ)をいじってみる
Xquery
・・・
スキーマレスDBっていうのは
RSSのようにスキーマがガンガン変わるようなものを
一括で管理するにはいいとおもったんだけど、
どうも勝手がちがったw
JOINとかは1ファイル1テーブルで、JOINはファイルを結合してくイメージだから・・
あかんw10万ファイルをJOIN(実質MAX1000くらいなんだろうけど)
とか気が遠くなるこれw
10万ファイルをDBに格納してRSSを生成しなおすのと(こっちは格納コストが高い)
ファイルとして保持して、Xqueryで生成するのと・・(こっちは生成コストが高い)
うーん ちょっと簡単にはコスト計算できそうもないので、要検証。
パーサ書くほうが楽しいしとりあえずやめよっかなーとか。
余談だけどXqueryに関するこの記事をよんで
めっちゃ面白そうだとはおもった
http://d.hatena.ne.jp/stemy/20060708/1152385620