リファラスパムをGoogleアナリティクスのデータから除外する方法

当ブログではこれまで数が少なかったため、特に対策もせず放置してきました。しかし、今月に入ってからでしょうか。リファラスパムの数が以前と比べてだいぶ増えてしまったのです。アナリティクスのデータにも影響するため、フィルタを設定しリファラスパムを除外することにしました。

リファラスパムとは

「そもそもリファラスパムって何?」という話なのですが、すごくざっくり言うとリファラ情報の偽装によってサイト管理者に意図的なURLを踏ませようとするスパムです。

リファラ/リファラー:あるWebページのリンクをクリックして別のページに移動したときの、リンク元のページのこと。(リファラとは | referer | リファラー – 意味/解説/説明/定義 : IT用語辞典

サイトやブログを運営している方は、アクセス解析の参照元(どこから自分のサイトやブログにやってきたか)をチェックする機会があると思います。

グーグルアナリティクスの参照元データ

これはGoogle Analyticsのものですが、グーグル検索で来たのは137人、ツイッターから来たのは2人、といったことを読み取ることが出来ます。

さてみなさん、お気づきでしょうか。一番下に”www.Get-Free-Traffic-Now.com”という怪しげなURLがありますね。こういう見慣れないURLがあると「一体どんなサイトが自分のサイトに言及してくれているんだろう?」と確認したくなってしまいますよね。

そう、こういう人の心理を利用してサイトに誘導しようとするのがリファラスパムなのです。アフィリエイトサイトへの誘導やSEO業者によるアクセス数の水増し等がその真の目的なため、怪しいURLがあっても踏まなければ問題はないでしょう。

……と言いたいのですが、アクセス解析の参照元のデータとして残ってること自体が問題ですよね。なぜなら、そのせいでアクセス解析データが乱されてしまい、適切な分析が出来なくなってしまうためです。

僕はこれまで日に1件とかだけだったので無視してきましたが、先日は次の画像のように結構な数のリファラスパムがきました。

リアルタイムサマリーに表示されるリファラスパム

最終的に”free-share-buttons.com”という参照元から34のアクセスが。さすがにこの数を無視することは出来ないため、他のリファラスパムを含めてグーグルアナリティクスのデータから除外することにしました。

Google Analyticsのフィルタ設定

今回は”free-share-buttons.com”という参照元のデータを除外する方法を例として紹介していきます。

www.Get-Free-Traffic-Now.comを除外する場合は、www.は無視して”Get-Free-Traffic-Now.com”として設定します。(参考:ビューフィルタについて – アナリティクス ヘルプ

まず、<アナリティクス設定>から<フィルタ>をクリックします。

GoogleAnalyticsのアナリティクス設定画面

その次に<+新しいフィルタ>と書かれた赤いボタンをクリックします。

アナリティクス設定のフィルタ画面

すると次のような画面になります。

新しいフィルタの作成・設定画面

<新しいフィルタを作成>にチェックを入れ、各項目を入力していきます。

  1. <フィルタ名>に適当な名前を入力
  2. <フィルタの種類>は<カスタム>を選択し<除外>にチェック
  3. <フィルタ フィールド>は<キャンペーンのソース>を選択
  4. <フィルタ パターン>は<free-share-buttons\.com>を入力(ピリオドの前にはバックスラッシュが必要)

実際の画面はこんな感じになります↓

リファラスパムを除外するための設定

入力が終わったら<フィルタの確認>をしましょう。ただし、これは過去7日間のデータを参照するので、当日に初めて現れたリファラスパムの除外フィルタを作成している場合、次の画像のような結果となります(問題はありません)。

設定後のフィルタ確認結果1

ちなみに、もし過去7日間にデータがあった場合、次の画像のような結果となります。

フィルタ確認結果2

設定項目に間違いがないと確認したら<保存>をクリックしましょう。これでフィルタの作成は完了です。この設定はちょっと時間が経ってから自動で有効になります。

注意すべき点は、このフィルターは過去のデータには反映されず、当日からのデータにしか反映されないという点です。そのため、新しいリファラスパムを発見したらすぐに除外設定する必要があります。

なお、当日でも設定前のデータ(15時にフィルタを作成したとして0時から14時59分までのデータ)には反映されないと書かれていたサイトもあったのですが、僕が2回(それぞれ別の日・参照元で)試したところ、フィルタを作成して約1時間後にちゃんと反映されました。

ちなみに、今回は”free-share-buttons.com”だけを設定する方法を紹介しましたが、同一フィルタ内で複数の参照元を設定することも可能です。

複数除外する時の設定方法

この画像のように|区切りで除外したいドメインを入力していくだけです。ただ、文字数制限があるので、いっぱいになってしまったらまた新しくフィルタを作成する必要があります。

おわりに

さて、今回はリファラスパムのデータをアナリティクスから除外する方法について書いてきましたが、いかがだったでしょうか。少しでも参考になったなら幸いです。

そうそう、フィルタ設定の前にもリファラスパム対策として出来ることがあります。<アナリティクス設定>から<ビュー設定>へ行き、<ボットのフィルタリング>にチェックを入れることです。

ビュー設定にあるボットのフィルタリングをオンに

これだけで既知のボットのデータはアナリティクスから除外されるようになります。

しかし、裏を返せば新規のスパムボットは対応まで時間がかかるということです。次々と新たなリファラスパムが出てくる現状を考えると、この記事で紹介したように自分自身で対策することが大切だと言えるでしょう。

それでは今回はこの辺で。最後までありがとうございました。

この記事を書いた人

エヌジマ

エヌジマ

三十路の唐変木。学校など特定の社会的状況で話せなくなる場面緘黙(ばめんかんもく)を過去に経験。現在も雑談は大の苦手で、時に緘黙の症状が出ることも。このブログでは自分の日常や「紹介したい!」と思ったものを中心にいろいろ書いています。詳しくは当ブログについてをご覧ください。また、お問い合わせはこちらのフォームからどうぞ。