ログのアクセス解析方法

レンタルサーバーによっては多少の違いがありますが、アクセスのログ(生ログ)を保存できるところが多いです。不正なアクセスや検索エンジンによる過度のクローリングを調べるには、ログを調べてみると、サーバーへのアクセス情報がわかります。

この生ログですが、サーバーに「log」のフォルダが作成されていて、そこに保存されていることが多いです。レンタルサーバーによっては、ftp接続でしか見れないところもあります。

たいてい、「.log」というファイル名や圧縮された形でのファイルなどで保存されていることが多いですが、中身はただのテキストファイルですので、メモ帳などで開いてみると、例えば、このような感じで書かれています。

一見するとたくさんの情報が書かれているように見えますが、アクセスがあるたび、次の情報が繰り返し書き加えられていくだけですので、構成自体は簡単なファイルです。


111.11.11.11 - - [15/Jan/2001:00:05:12 +0900]
"GET http://www.homepage-tukurikata.com/hp/folder.html HTTP/1.1" 200 -
"http://www.homepage-tukurikata.com/"
"Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1)"


この場合、IPアドレス111.11.11.11の訪問者が、2001年1月15日の0時5分12秒に、http://www.homepage-tukurikata.com/hp/folder.html のファイルをサーバーにリクエストして、200OKで正常に送信したという意味になります。

また、リクエストした元のページが、http://www.homepage-tukurikata.com/ で、そのうしろにブラウザ情報なども記載されています。

ちなみに、+0900 は、世界標準時間から9時間進めたものが日本の標準時なのでこのような書き方になっており、また、ファイルが見つからなかった場合などは、200ではなく、404などが記載されることになります。

同じ人が、そのまた次のページに行った場合にも、同じようにアクセスログが追加されていきますので、次のページのリクエストがあった時間の差から、そのページでの滞在時間を調べることができます。

また、同じIPで最後にアクセスしたページから、その人がどのページで離脱したのかも判断することができます。

ただ、ホームページのデザインなどで使用している背景画像や素材などのファイルも、その都度ログに記載されることになりますし、グーグルやヤフーなどのクローラーロボットによるアクセスも記載されますので、ログ自体は膨大なファイルになりがちです。

訪問者の経路を調べる場合などは、その膨大なデータのなかから、画像やクローラーなどのアクセスを取り除いて調べる必要があります。

その作業を自動的に行い、視覚的に見やすくなるような形で表示してくれるアクセス解析ソフトがレンタルサーバーに付属されていることが多いですが、アプリケーションソフトなどで表示されないような詳細なデータは、生ログを直接確認することによってわかる場合もあります。

アクセス解析の設置方法へ戻る