ランダムフォレストでASOとかSEOとかやってます

今年は割とデータサイエンス的なこともやっていて、ランダムフォレストという機械学習のアルゴリズムを使ってASOやSEOを分析しています。
特にASOなんかは外部リンクのようなとってこれないデータが少なめなので内部対策の重要度をデータから導き出せるので中々よい参考になります。SEOだと取りきれないデータも多いので、内部対策に絞ってやっていますが、これはこれで不要な内部対策を洗い出したりできます。

ランダムフォレストがわかりやすい感じの参考URL
http://drilldripper.hatenablog.com/entry/2016/10/04/211245
https://www.slideshare.net/HitoshiHabe/ss-58784421




実際やってることはこんな感じで、週次で自動計算してデータを集めて、変動を見ながらアルゴリズムが動いたとかそういった検知をしています。




ランダムフォレストのいい所は、ディープラーニングと違って寄与変数を出せる所で、仮説一覧の中で相関度が高いものを出してくれるので、それがそのまま対策優先順位になるってとこでしょうか。
※上にいくほど相関度が高い的なグラフ




さらに、各項目について、詳細を出す事も出来て、例えばこれだとASOにおいて更新日が高いほどよくて、急カーブで落ちて行って、ドメインオーソリティみたいに少しづつ上がっていくみたいなデータも見れます。

ソースは裏はRで書いていて週次でデータを集計してRFかけて、データをまとめる所まで自動でやっています。RFのチューン自体は毎日データ見つつやっています。


データの量が多いので処理のサーバが中々に大変なんですよね。特にios11対応でリソースひっ迫してピンチだったりしますが、今の所安定して動いています。

会社が初めてEXPOなるものに出展したので、たまには宣伝みたいなことも書いてみようかと思ったので投稿しました。

ということで、テクニカルだったり、データ分析の側面からもSEOやっています。
ほとんどコンサル案件になっていますが、一度話を聞いてみたいと思った方や、単純いSEOなどのご相談はこちらからお願いします!
# もしくは記事にコメントいただければこちらからご連絡いたします!
https://www.sakurasaku-labo.jp/contact