| ウェバライザー | |
|---|---|
| 原作者 | ブラッドフォード・L・バレット |
| 初回リリース | 1997 |
| 安定版リリース | 2.23-08 / 2013年8月26日 (2013年8月26日) |
| 書かれた | C |
| オペレーティング·システム | クロスプラットフォーム |
| 入手可能な | 30以上の言語 |
| タイプ | ウェブ分析 |
| ライセンス | GNU一般公衆利用許諾契約書 |
| Webサイト | ウェブアライザー |
Webalizerは、アクセスログと使用状況ログから分析用のウェブページを生成するウェブログ分析ソフトウェアです。最も広く利用されているウェブサーバー管理ツールの一つです。1997年にBradford L. Barrett氏によって開発されました。Webalizerが報告する統計情報には、ヒット数、訪問数、リファラー、訪問者の国、ダウンロードされたデータ量などがあります。これらの統計情報はグラフ形式で表示でき、日、時間、月など、異なる期間で表示できます。
概要
ウェブサイトのトラフィック分析は、ウェブサイト訪問者がウェブサイトを閲覧している間にウェブサーバーがログファイル形式で収集した様々なデータ項目をグループ化・集約することで行われます。Webalizerはウェブサーバーのログファイルを分析し、クライアントのIPアドレス、URLパス、処理時間、ユーザーエージェント、リファラーなどの項目を抽出してグループ化し、HTML形式のレポートを作成します。
Webサーバーは、HTTPトラフィックを様々なファイル形式でログに記録します。一般的なファイル形式には、共通ログ形式(CLF)、Apacheカスタムログ形式、拡張ログファイル形式などがあります。CLFログの例を以下に示します。
192.168.1.20 - - [2006年12月26日:03:09:16 -0500] "GET HTTP/1.1" 200 1774
Apacheカスタムログフォーマットは、リクエスト処理時間やリクエスト自体のサイズなど、ほとんどのHTTPパラメータをログに記録するようにカスタマイズできます。カスタムログのフォーマットはformat行で制御されます。Apacheログフォーマットの一般的な設定を以下に示します。
ログフォーマット"%a %l \"%u\" %t %m \"%U\" \"%q\" %p %>s %b %D \"%{Referer}i\" \"%{User-Agent}i\"" my_custom_log
CustomLog logs/access_log my_custom_log
Microsoft のインターネット インフォメーション サービス(IIS) ウェブ サーバーは、HTTP トラフィックを W3C 拡張ログ ファイル形式で記録します。Apache カスタム ログ形式と同様に、IIS ログはリクエスト処理時間などの拡張パラメータを記録するように設定できます。W3C 拡張ログは、以下に示すように、1 つ以上の形式行が存在することで識別できます。
#フィールド: 日付、時刻、s-ip、cs-method、cs-uri-stem、cs-uri-query、s-port、cs-username、c-ip、cs(User-Agent)、cs(Referer)、sc-status、sc-bytes、cs-bytes、time-taken
Webalizerは、CLF、Apache、W3C拡張ログファイルに加え、Squidサーバーが生成するHTTPプロキシログファイルを処理できます。他のログファイル形式は通常、分析のためにCLFに変換されます。さらに、GZip (.gz) またはBZip2 (.bz2) で圧縮されたログは、使用前に解凍することなく直接処理できます。
コマンドライン
Webalizerはコマンドラインアプリケーションであり、オペレーティングシステムのシェルプロンプトから起動されます。一般的なコマンドを以下に示します。
webalizer -p -F clf -n en.wikipedia.org -o は logfiles/access_log をレポートします。
このコマンドは、Webalizerにログファイルaccess_logを分析し、増分モードで実行し(-p)、ログをCLFログファイルとして解釈し(-F)、レポートリンクにドメイン名en.wikipedia.orgを使用し(-n)、現在のディレクトリのサブディレクトリを出力として生成するよう指示します。コマンドラインオプションの完全なリストを表示するには、-hオプションを使用してください。
構成
Webalizerは、コマンドラインオプションに加えて、設定ファイルのパラメータを使って設定することもできます。デフォルトでは、Webalizerはwebalizer.confファイルを読み込み、各行を処理命令として解釈します。また、-cオプションを使用して、ユーザーが指定したファイルを指定することもできます。
たとえば、ウェブマスターが特定のホスト グループからのすべてのリクエストを無視したい場合は、IgnoreSite パラメータを使用して、指定したパターンに一致する IP アドレスを持つすべてのログ レコードを破棄できます。
無視サイト 192.168.0.*
Webalizerは100を超える設定パラメータが用意されており、高度に設定可能なWebトラフィック分析アプリケーションとなっています。設定パラメータの完全なリストについては、各ソースまたはバイナリ配布に同梱されているREADMEファイルをご覧ください。
レポート
デフォルトでは、Webalizer は分析された月ごとに 1 つずつ、年次概要レポートと月次詳細レポートの 2 種類のレポートを生成します。
年間サマリーレポートでは、ヒット数、ファイルおよびページリクエスト数、ホスト数、訪問数、そして各月におけるこれらのカウンタの1日平均などの情報が提供されます。レポートには年間サマリーグラフが添付されています。
月次レポートはそれぞれ、月次サマリーレポート(ヒット数、ファイルおよびページリクエスト数、訪問数、ホスト数などの総数を一覧表示)、日次レポート(これらのカウンタを月内の各日付ごとにグループ化)、時間別集計レポート(各日の同じ時間帯のカウンタをまとめてグループ化)、URL レポート(収集した情報を URL 別にグループ化)、ホストレポート(IP アドレス別)、Web サイトの入口 URL と出口 URL レポート(最も一般的な最初の訪問 URL と最後の訪問 URL を表示)、リファラーレポート(分析対象の Web サイトに誘導するサードパーティの参照 URL をグループ化)、検索文字列レポート(Google などの検索エンジンで使用される検索用語別に項目をグループ化)、ユーザーエージェントレポート(ブラウザの種類別にグループ化)、および国別レポート(ホストの所在国別にグループ化)を含む単一の HTML ページとして生成されます。
上記の標準HTMLレポートは、各項目の上位エントリ(例:上位20件のURL)のみをリストします。各レポートの実際の行数は設定によって制御されます。Webalizerは、各項目ごとに個別のレポートを作成するように設定することもできます。このレポートでは、すべてのウェブサイト訪問者、すべてのリクエストされたURLなど、すべての項目がリストされます。
WebalizerはHTMLレポートに加えて、レポートデータ全体をプレーンテキスト形式でリスト化したコンマ区切りのダンプファイルを生成するように設定できます。ダンプファイルはスプレッドシートアプリケーションやデータベースにインポートして、さらに分析することができます。
国際化
HTML レポートは、カタロニア語、クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ガリシア語、ドイツ語、ギリシャ語、ハンガリー語、アイスランド語、インドネシア語、イタリア語、日本語、韓国語、ラトビア語、マレー語、ノルウェー語、ポーランド語、ポルトガル語、ポルトガル語 (ブラジル)、ルーマニア語、ロシア語、セルビア語、中国語 (簡体字)、スロバキア語、スロベニア語、スペイン語、スウェーデン語、トルコ語、ウクライナ語など、30 を超える言語で作成できます。
別の言語でレポートを生成するには、その言語専用にコンパイルされた別の Webalizer バイナリが必要です。
批判
- 生成された統計情報は、人間の訪問者とロボットの訪問者を区別しません。そのため、報告されるすべての指標は、人間のみによるものよりも高くなります。多くのウェブマスターは、Webalizerが生成する訪問数は非常に非現実的であり、Google AnalyticsやStatCounterなどのJavaScriptベースのウェブ統計データよりも200~900%も高い数値になることがあると主張しています。
- 報告されたヒット数は、セグメント化されたダウンロードを行うダウンロード マネージャーにとっては多すぎます。206 個の「部分コンテンツ」それぞれが 1 つのヒットとして報告されます。
- クエリ文字列分析は行われません。動的に生成されたウェブサイト(引数付きのPHPページなど)は個別にリストできません。
参照
外部リンク
- 公式サイト(アーカイブコピー)