1月 21, 2009
購読させてもらってるブログに書いてあったネタなんですが、
http://labs.cybozu.co.jp/blog/akky/archives/2009/01/hyves-google-penalty-check.html
元ネタ
http://www.mediadonis.net/?p=378
http://www.prchecker.info/check_page_rank.php
ここで適当に
http://hyves.あなたのドメイン/ と入れてみる。
と 0,4,7の3パターンでしかPRが出力されないらしい。
hyves というサブドメインがテスト用なのかなんなのかは不明。
本サイトのコメント欄みてると結構見れましたとか
スパムサイトが案の定4にみたいなのがずらずらでてるんですが、
その紹介されてるサイトを googleツールバーで見ても全部 0になってる。。
どうも 日本圏のツールバーが見てるサーバとは違うみたいです。
=日本のサーバにあるサイトには適応できないっぽいです 。
(厳密にはドメインをアメリカでとらないとだめっぽいです。)
が、逆にいうとアメリカとかにあるサーバを契約してそこでドメインをとったサイトは上手く機能します。
http://hyves.uoh.jp/
↑自分が管理してるゲームのコミュニティサイトなんですが、
1server とかいうやつをつかっていて
ドメインもそこでとったやつなんですよね。
これを見るとPRが7にwwwwwwwwwwwwwww
(グレーになるときは取得に失敗してるので、更新ボタンを押してください)
ようは
0,4,7の3択しかないので、
スパム扱いされてない7が出てくるドメインの
サブドメインを今取得すればwww
という話です。
いつまで使えるのやら。
12月 5, 2008
リファラでさっくり簡単かなーって思ったけどそうでもなかった・・
Googleだと
検索結果URL: http://www.google.co.jp/search?hl=ja&rlz=***&q=***&btnG=***&lr=
PPCリンクをクリック
PPCのURL先: http://www.google.co.jp/aclk?sa=l&ai=***
そのときの
リファラ: http://www.google.co.jp/search?hl=ja&rlz=***&q=***&btnG=***&lr=
ステータスコード: HTTP/1.x 302 Found
転送先: http://www.googleadservices.com/pagead/aclk?sa=***
転送されてきたURL:http://www.googleadservices.com/pagead/aclk?sa=L&ai=***
そのときの
リファラ: http://www.google.co.jp/search?hl=ja&rlz=***&q=***&btnG=***&lr=
ステータスコード: HTTP/1.x 302 Found
転送先: http://PPCの対象URL
さらに転送されてきて:http://PPCの対象URL
そのときの
リファラ: http://www.google.co.jp/search?hl=ja&rlz=***&q=***&btnG=***&lr=
Yahooだと
検索結果URL: http://search.yahoo.co.jp/search?p=***&search.x=1&fr=top_ga1&tid=top_ga1&ei=UTF-8
PPCリンクをクリック
↓
PPCのURL先: http://wrs.search.yahoo.co.jp/S=***/K=***/v=2/SID=w/TID=***/D=E/OV=0/S***
そのときの
リファラ: http://search.yahoo.co.jp/search?p=***&search.x=1&fr=top_ga1&tid=top_ga1&ei=UTF-8
ステータスコード:HTTP/1.x 302 Found
転送先: http://rc20.overture.com/d/sr/?xargs=***
転送されてきたURL:http://rc20.overture.com/d/sr/?xargs=***
そのときの
リファラ: http://search.yahoo.co.jp/search?p=***&search.x=1&fr=top_ga1&tid=top_ga1&ei=UTF-8
ステータスコード: HTTP/1.x 302 Found
転送先: http://PPCの対象URL
さらに転送されてきて:http://PPCの対象URL
そのときの
リファラ: http://search.yahoo.co.jp/search?p=***&search.x=1&fr=top_ga1&tid=top_ga1&ei=UTF-8
見ればわかるように 302で飛ばしながらくるので、
リファラは常に検索結果ページのURL
つまり、リファラだけみてもPPCからきたのか、SEOなのかわからないという。
まあPPCでも検索ワードが拾えるわけだけど。
で結局送られくるデータだけだと
どうしようもないので、ひと手間かけて、実現しました。
やり方としては Webmater Tool系 + PPCの機能 + PHP ってかんじ。
近いうちにツールでも公開しますかね。
12月 4, 2008
こちらとかのエントリーを見て思ったことをつらつら
コメントに書こうとして長すぎてエントリーに。。
http://www.algoritmi.jp/seo/20081204010749.html
http://www.suzukikenichi.com/blog/googl-must-have-more-than-one-partitions/
(先にいってくと、私はGoogleもYahooも2つのインデックスは使っていないと思ってる人です)
とりあえずインデックスってどんなものなのか
イメージできていないとおもうので、
ここらへんを参考にしてみてください。
http://ja.wikipedia.org/wiki/%E8%BB%A2%E7%BD%AE%E3%82%A4%E3%83%B3%E3%83%87%E3%83%83%E3%82%AF%E3%82%B9
(転置インデックスの説明@wikipedia)
まあこんなかんじで
サイトがインデックスされると
ほんとに索引に近いものができるわけです。
(実際には転置インデックスはつかってないとおもいますが
イメージとして)
クロール > インデックス
ここで簡単にクロールから検索結果までのフローを書くと
○クローラー
1:クロールする
2:クロールしたものがキャッシュするに値するかを判定
⇒キャッシュしない場合終了
○インデクサー
1:キャッシュされたリストを順にみていってインデックスに値するかを判定
⇒インデックスしない場合終了
2:サイトを分析
3:(検索エンジンが独自に考えた理論で)インデックス
4:ついたインデックスに対してさらに独自の操作をしてポイントさらに操作
(ドメインエイジとかスパムみたいな文書解析とは別のレイヤーの作業)
5:検索結果を出すためのインデックス完成
このできたリストから検索結果を出すわけです
Yとかはこのインデクサーの作業が追いついていなくて、
定期的に 更新しました! といって全サイトのインデックス作業をやるわけです。
(Yahooの場合このインデクサーの作業4だけはこまめにやってる感じ)
が Googleはたぶん余裕で追いついているので、
随時やってるわけです。 だから随時変動。
—-
というのを踏まえて
・補足結果っていうのはたぶん インデクサーの作業の4でしてる作業の一つの集合
・Matt Cuttさんの言及 -> 4の作業をしない状態で5にいってしまった
・ヨーヨー現象 -> インデクサーの処理が早くなっただけじゃないのかな?
・ghost data-set -> こんなのあったらあのスピードで検索結果は出せないと思う。。
・site:とか -> Googleのインデックスは他のサイトからの影響を強く受けるわけだから
被リンク元のページにインデクサーが走った時、被リンク先のページの
評価が変わるのは自然だと思う。
というお話でした。
長ひ。。
結論
hyperestraierを使ってみよう(ぇ