Seo tools

Neo Inspiration

  • Search

    • About Me

      • inspi 改め
        jakk@webアーキテクト(自称)
        php,javascript,seoなど
        得意技は extract();



  • Categories

  • Ranking

  • Comments

  • Others


    • track feed   |
  • Archive for the ‘Just A Scrap’ Category

    Google ウェブ履歴で1年のシメを

    木曜日, 12 月 25th, 2008

    去年もやった1年のシメ的なもので、
    おもしろい1年の振り返り方ということで。

    1:ログインしてGoogleにアクセスしてください。
    2:右上に 「アカウント」ってあるとおもうのでそれをクリック
    3:「ウェブ履歴」をクリック
    4:サイドバーの 「統計」 をクリック
    5:上部にある「昨年」をクリック(これが今年分らしい)

    去年もやったんですが、
    一年の検索ワードで、その時期何考えてたかが結構わかったりしますね~

    あーこのことはこれ良くわかってなくてしらべまくったなとか、
    あのころマイブームはこれだったなみたいな。

    個人的なまとめ

    総検索回数:13629

    1月:1474
    2月:2278
    3月:1991
    4月:1481
    5月:1666
    6月:1310
    7月:450
    8月:521
    9月:412
    10月:456
    11月:747
    12月:843
    

    ・・・なんでこんな7月から検索してないんだろう。

    あとどうでもいいけどこれはひどすぎる

    「関心のあるアイテム」

    1:メリークリスマス
    2:ダウン症
    3:ちんこアプロダ
    4:真木よう子
    5:グリーティングカード
    6:ジャックラッセルテリア
    7:autopagerize
    8:松野明美
    9:むすめーかー
    10:バナナダイエット
    

    一度も検索したことないワードがずらずらと
    つか 真木よう子とか誰だよwwwww

    ということで今年一年お疲れ様でした。

    Googleのインデックスのお話

    木曜日, 12 月 4th, 2008

    こちらとかのエントリーを見て思ったことをつらつら
    コメントに書こうとして長すぎてエントリーに。。

    http://www.algoritmi.jp/seo/20081204010749.html
    http://www.suzukikenichi.com/blog/googl-must-have-more-than-one-partitions/

    (先にいってくと、私はGoogleもYahooも2つのインデックスは使っていないと思ってる人です)
    とりあえずインデックスってどんなものなのか
    イメージできていないとおもうので、
    ここらへんを参考にしてみてください。
    http://ja.wikipedia.org/wiki/%E8%BB%A2%E7%BD%AE%E3%82%A4%E3%83%B3%E3%83%87%E3%83%83%E3%82%AF%E3%82%B9
    (転置インデックスの説明@wikipedia)

    まあこんなかんじで
    サイトがインデックスされると
    ほんとに索引に近いものができるわけです。
    (実際には転置インデックスはつかってないとおもいますが
     イメージとして)

    クロール > インデックス

    ここで簡単にクロールから検索結果までのフローを書くと

    ○クローラー
    1:クロールする
    2:クロールしたものがキャッシュするに値するかを判定
     ⇒キャッシュしない場合終了

    ○インデクサー
    1:キャッシュされたリストを順にみていってインデックスに値するかを判定
     ⇒インデックスしない場合終了
    2:サイトを分析
    3:(検索エンジンが独自に考えた理論で)インデックス
    4:ついたインデックスに対してさらに独自の操作をしてポイントさらに操作
    (ドメインエイジとかスパムみたいな文書解析とは別のレイヤーの作業)
    5:検索結果を出すためのインデックス完成

    このできたリストから検索結果を出すわけです

    Yとかはこのインデクサーの作業が追いついていなくて、
    定期的に 更新しました! といって全サイトのインデックス作業をやるわけです。
    (Yahooの場合このインデクサーの作業4だけはこまめにやってる感じ)
    が Googleはたぶん余裕で追いついているので、
    随時やってるわけです。 だから随時変動。

    —-

    というのを踏まえて

    ・補足結果っていうのはたぶん インデクサーの作業の4でしてる作業の一つの集合
    ・Matt Cuttさんの言及 -> 4の作業をしない状態で5にいってしまった
    ・ヨーヨー現象 -> インデクサーの処理が早くなっただけじゃないのかな?
    ・ghost data-set -> こんなのあったらあのスピードで検索結果は出せないと思う。。
    ・site:とか -> Googleのインデックスは他のサイトからの影響を強く受けるわけだから
            被リンク元のページにインデクサーが走った時、被リンク先のページの
            評価が変わるのは自然だと思う。

    というお話でした。
    長ひ。。

    結論

    hyperestraierを使ってみよう(ぇ

    googleの裏ワザ

    金曜日, 11 月 7th, 2008

    http://www.haywirehacking.com/main/2008/10/11/hacking-google-turning-a-search-engine-into-an-mp3-downloade.html

    こ これわ・・・

    —-

    検索式を使ってMP3をダウンロードする方法デス。
    ダークサイドな検索ってことで。

    -inurl:(htm|html|php) intitle:”index of” +”last modified” +”parent directory” +description +size +(wma|mp3) “バンド名や曲名”

    検索、特にgoogleって正規表現みたいな書き方ができるんですよね。
    そういう特殊な書き方をミックスさせたウラワザかな。

    軽く説明するとこの条件式は3つ構成で、
    1:-inurl:(htm|html|php)
    2:intitle:”index of”
    3:”last modified” +”parent directory” +description +size +(wma|mp3)

    1:URLの中に htm,html,php という文字が入っていない
    2:タイトルに “index of” というフレーズが入っている
    3:あとは通常の and検索

    これで何を検索するかというと
    apacheのディレクトリ表示画面を出すわけです。

    デフォルトのディレクトリ表示画面には
    Last modified,Size,Descriptionという文字があって、
    タイトルはIndex of(フォルダ名)になってるわけで、
    それを狙い撃ちするわけです。

    たとえばメタリカとかでいくと

    -inurl:(htm|html|php) intitle:"index of" +"last modified" +"parent directory" +description +size +(wma|mp3) "metallica"
    
    こんなかんじで、
    出てくるページはこんなかんじ。
    ってURL載せようと思ったけどかわいそうだからヤメタ。
    いまだと上から3個目とかかな。
    

    .

    日本語でもできるかな

    -inurl:(htm|html|php) intitle:"index of" +"last modified" +"parent directory" +description +size +(wma|mp3) "ハルヒ"
    
    日本語ファイルつけてる人もいるのね。
    

    .

    というわけです。

    はいはい自己責任自己責任。

    結論

    .

    まあ index.htmlは絶対おいておこうね。というお話です。

    2009/01/07 01:28:47