本文へスキップ

ジョイライフは50代40代女性の自分サイズ起業(小さな起業)を応援します。

TEL.072-655-2101

〒569-1046 大阪府高槻市

アナリティクスのリファラースパム対策

アナリティクスを利用する悪質なスパム対策

アナリティクス解析を利用している人が、どのページからアクセスしたかを確認することを逆に利用し悪質サイトへ誘導する、それがリファラースパムという手法だそうです。
うっかり悪質サイトへ誘導されないよう、またデータを正確なものにするために、そういったスパム記録をブロックする対策について簡単なモノを紹介します。


スポンサーリンク


アナリティクスを不正利用する行為

アナリティクスではどのサイトから自分のサイトに来たのかを知るために『リンク元の情報』が分かります。
知らないサイトのURLがあるとついうっかり確認しに行きます。
悪質サイトへ勝手にリンクを貼られてしまっているようなもの!
まずはそういう不正行為が存在することを知っておいた方がいいでしょう。

>>スパムと対策について分かりやすく説明しているサイトがこちらです
>>こちらは少し専門的な解説になりますが詳細に載っています

まずはスパムが無いか調べてみる

アナリティクスでレポートを見る
「ユーザー」>「地域」>「言語」
ここに言語が「not set」のものがあると怪しいそうです

セカンダリディメンション⇒集客⇒「参照元」を指定します
そうすると「not set」の参照元ドメインが分かります
くれぐれもクリックしないように!

こういったドメインを除外するための簡単な設定方法を紹介しておきます


ホスト名を使ってのフィルターで除外する方法

多くのスパムの言語設定が【not set】であるのでこれをフィルターで除外する方法です

アカウント > プロパティ > ビューを指定
「フィルタ」をクリック > 「新しいフィルタ」をクリック >
フィルタの設定項目を入力・選択し保存
フィルタ名:「リファラースパム|言語設定|not set」
フィルタの種類:「カスタム」で除外を選択
フィルタフィールド:「言語設定」を選択
フィルターパターン:「not set」を入力

言語設定で「not set」のアクセスはすべて除外するという設定ができました
ただこれだけではまだ除外できないものもあるので
完璧に除外するなら手作業で一つ一つ見つけて除外するしかないようです


ロボットを除外して本当のアクセスだけを記録する

アナリティクス設定 > ビュー設定 > ボットのフィルタリングの項目で…
□既知のボットやスパイダーからのヒットをすべて除外する
にチェックを付け保存する


まずはアナリティクスにそういうスパムが蔓延しているということを知って
少しだけ対策をしてみてください

詳しく知りたい方は【アナリティクス,スパム,除外方法】で検索して自分で調べてください

スポンサーリンク



『lifehacĸer.com』からのアクセス違いは『ĸ』

ある日 『lifehacĸer.com』からのアクセスが急増し、その情報も載っていました。
よく見ると『k』ではなく『ĸ』です。

管理>すべてのウェブサイトのデータ(ビュー)
「フィルタ」をクリック > 「新しいフィルタ」をクリック 
フィルタの設定項目を入力・選択し保存
フィルタ名:「新たなリファラースパム」などを入れて
フィルタの種類:「カスタム」で除外を選択
フィルタフィールド:「参照」を選択
フィルターパターン:『lifehacĸer.com』を入力

これでデータはカウントされなくなります。

『ɡoogle.com』と『ɢoogle.com』というリファラースパムもあるそうです。
パッと見るとおかしいとは気づきにくいのですが
よく見ると…ɡoogleの『ɡ』←『g』、ɢoogleの『ɢ』←『G』となっているそうです。
あと『reddit.com』という海外の検索サイトからも急増! これもフィルター設定しました。

スパムが急増し… フェイスブックでも成りすましが増えています。
たまに自分のサイトがどんな危険にさらされているのかを
違った視点から観察するのも良いのかもしれません。

スパム急増中でキリがない

2016年11月末よりスパム急増中で上記の対策ではキリがなくなっています
勿論アナリティクス側でも対処はしていくのでしょうけれど…
キリが無いので実際にサイトに来ていないスパムを除外する方が良さそうです。

実際にこのサイトを例にとって設定してみた。
このサイトのホスト名『kigyou.jlkikaku.com』を訪れていないものを除外する設定

管理>すべてのウェブサイトのデータ(ビュー)
セグメント>新しいセグメント
>セグメント名に 『kigyou.jlkikaku.comホスト名一致』などの名称を記入
>左の『条件』を選択
>右のフィルタ セッションの下が最初は『Flashのバージョン』になっているが『行動』を選択
>『ホスト名』を選択>『含む』になっているが『完全一致』を選択
>右の□に『kigyou.jlkikaku.com』を入力し保存

レポートに戻ると『すべてのユーザー』のデータが表示されている
右の『○セグメント』を選ぶと下にリストが表示されるのでリストからセグメントを選択する
>『kigyou.jlkikaku.comホスト名一致』を選び>『適用』
すると…
青線ですべてのユーザーのデータ
オレンジの線で選んだセグメントのデータが表示される

ここで確認しても2016年11月から12月の月初にかけて二つの線の幅があるのが分かる
現在は二つの線が重なっているのでアナリティクス側でなんらかの対処をしている?

集客>すべてのトラフィック>参照元/メディア
で確認すると正しい数値が確認できました

一応忘備録としてここに記載しておきます