Google Analyticsに覚えのないアクセスがあったとき調べたこと

ひさしぶりにGoogle Analyticsをのぞいてみたら
2015年6月終わり頃から、このブログwebdevへ おびただしい数の身に覚えのないアクセスが記録されているのを発見??!!!?????
その調査と解決について、2本立てでレポートします。

前半となる今回は、調査編です。

後半はこちら
自分のサイトのGoogle Analyticsのトラッキングコードをよそで貼られてしまったときの対処法

存在しないURLへの大量アクセス

まずは、異常を感じたログを…
行動 → サイトコンテンツ → 全てのページ
で見られる、アクセス数の多いページ順にリストが出てくるレポートです。

Google analyticsへ覚えのないログが大量に…

下の行で黄色くマーキングしている項目がそうなんですが
このブログ、siteっていうディレクトリないよ?物理的にないよ?Apacheでも設定しとらんよ?
このおびただしい数…不気味すぎる…

落ち着け…
まずは、アクセスが爆上げしている6/24以降の折れ線グラフ稜線が本当に
site関連アドレスのしわざか問題を切り分けるために
行動 → サイトコンテンツ → ディレクトリ
から、表示するログを⁄site⁄配下に絞り込んでみました。

Google analytics ログをsiteディレクトリ以下に絞ってみた

あー、間違いない。
⁄site⁄配下のアクセスのせいで爆上げだ。

セカンダリディメンションで状況を絞り込めないかもがく

観察してみれば、このアドレス、aspxって付いてるしマーケティング管理用システムっぽい綴り。
セカンダリディメンションから、なんとかこれらのアクセスについて掘り下げられないか試してみたところ

Google analytics 不審なログをセカンダリディメンションで掘り下げてみた

いろんな場所から、いろんな端末でアクセスされている…
Google Analyticsのリアルタイムで見ても、⁄site⁄配下に常時10人くらい人がいるよ…
今この瞬間も10人働いてるよ…
(ちなみに、これを調べてたときは金曜日の深夜。ご苦労さまです。)
怖い…誰かがうちのサーバをクラックしてこっそりマーケティング管理システムを置いて…いるのか…??!!!

…いやいや。落ち着け。

スクリーン名でフルアドレスが見られる

気を取り直して、セカンダリディメンションで他に分かることがないか見てみたところ
行動 → スクリーン名
これで、フルアドレスを表示できることが判明。

Google analytics ログでスクリーンネームを表示

192.168.x.x って、プライベートアドレスじゃないですか。
VPNで管理システムにはプライベートアドレスで接続ってところかな。

192.168.x.xのプライベートアドレスも、うちのと構成が違うし
もしや、アクセスの実体はない?!

サーバへのアクセスがあるか確認

だいぶ落ち着いてきたところで
本当にうちのブログが置いてあるサーバへsite関連アドレスのアクセスがあるのか確認しました。
この異常アクセスが、サーバも巻き込んだ問題なのかGoogle Analytics上のみで起こっている問題なのか切り分けるためです。

まずはApacheの生ログを確認…してみたんですが
あんまりきっちりメンテしていなかったので、データ量が膨大すぎる…
スクロールだけでも手こずりつつ探しても、それらしいアクセスを見つけられませんでした。

そこで、個人サイトだしええやろと割りきって試したのが
Apacheの停止。

Google Analyticsのリアルタイムサマリーを見ながら、Apacheを止めてみると
じょじょに、存在するコンテンツsafari-windows-downloadcheckbox-radio-custom-cssへのアクセスが消えていき
見事、アクセスが⁄site⁄配下のみになりました。
⁄site⁄配下のログはwebdevが置いてあるサーバへのアクセスじゃないってことですね。
恐れていた、サーバへの不正アクセスではないことが判明!

ちなみに、Google Analyticsのリアルタイムはサーバを落とした瞬間には今いるアクセスのログはブチっととぎれません。
ページを見ている=パソコンやスマホなどの端末へページデータがダウンロードされている ので
おそらくリロードか離脱したときが、リアルタイムから消えるタイミングです。

おびただしいアクセスはGoogle Analyticsが原因。つまり。
よそさまの社内システムのwebページを作った人が
間違ってwebdevのトラッキングIDがついたトラッキングコードを貼り付けている

ということですね。

というわけで次回は、まちがってトラッキングコードを使われてしまった場合の対処についてです。

後半はこちらから。
自分のサイトのGoogle Analyticsのトラッキングコードをよそで貼られてしまったときの対処法

関連記事

Pocket