webalizer.conf(2.01) [FC4]

[サーバの実験室 Redhat/Fedora]

作成 : 2005/05/25 修正 : 2006/10/28

"サーバの実験室"の検索


若干の語句説明

Webalizerの解析結果(Statistics)に使用される語句の説明を少々。

Hitsリクエストの総数。404(Not Found)や304(Not Modified)などのレスポンスコードを返した場合も含む。
Filesレスポンスコード200(OK)を返したリクエストの数。
Pagesリクエストされたページの数。
カウントするページの種類は、PageTypeオプションで定義。
Visitリモートサイトがサイトを訪れた数。
最後のリクエストからタイムアウト期間(デフォルト30分)内に再度リクエストした場合は、同一の訪問とカウントされる。
Sitesリクエストを送ったIPアドレスまたはホストの数。
Referrer参照元のURL。combined形式のログで取得できる。イメージファイルなどはHTMLファイルが参照元になる。

HITSとFILESとPAGESの関係は、"PAGES ⊆ FILES ⊆ HITS"となっている。

webalizer.confのオプション

LogFile(デフォルト : STDIN)

解析対象のログファイルを指定する。

LogFile     /var/log/httpd/gs_access_log

LogType(デフォルト : clf)

解析対象のログファイルのタイプを指定する。 Apache CLF(Common Log Format)またはcombined形式のログを解析する場合は"clf"(Apache combined)、wu-ftpdスタイルのログを解析する場合は"ftp"、squidのログを解析する場合は"squid"を指定する。

LogType     clf

OutputDir(デフォルト : カレントディレクトリ)

ファイルを出力するディレクトリをフルパスで指定する。

OutputDir   /var/www/usage

HistoryName(デフォルト : webalizer.hist)

Webalizerのindex.htmlを生成するときに使用する、履歴ファイルを指定する。 パスを記述せずにファイル名だけ指定すると、OutputDirで指定したディレクトリに履歴ファイルが作成される。 相対パスで指定した場合、パスの起点はOutputDirで指定したディレクトリになる。

HistoryName     /var/lib/webalizer/webalizer.hist

Incremental(デフォルト : no)

複数のログファイルによる増分処理を使用する。 1ヶ月より短い期間でログファイルがローテートする環境では、このオプションを有効にする。

デフォルトの処理では、LogFileで指定したログファイルが解析の対象になるため、短い期間でログファイルがローテートする環境では、1ヶ月分の解析ができない。 増分処理を使用すると、解析結果をIncrementalNameで指定した増分ファイルに保存し、次回Webalizer実行時は増分ファイルとカレントログファイルを使用して解析を実施する。

Incremental     yes

IncrementalName(デフォルト : webalizer.current)

増分処理に使用する、増分ファイルを指定する。 Incrementalを有効にしたときだけ、このオプションは意味を持つ。 パスを記述せずにファイル名だけ指定すると、OutputDirで指定したディレクトリに増分ファイルが作成される。 相対パスで指定した場合、パスの起点はOutputDirで指定したディレクトリになる。

IncrementalName     /var/lib/webalizer/webalizer.current

ReportTitle(デフォルト : Usage Statistics for)

レポートのタイトルを指定する。 ここで指定した文字列の後に、HostNameで指定したホスト名が付加される。

ReportTitle     Usage Statistics for

HostName

ホスト名を指定する。 "Top URLs"と"Top Pages"のリンクとレポートタイトルで使用される。 指定しない場合はunameで取得され、失敗した場合は"localhost"になる。

HostName    www.nina.jp

HTMLExtension(デフォルト : html)

生成するHTMLファイルの拡張子を指定する。

HTMLExtension   html

PageType(デフォルト : "htm*"/"cgi"(WEBサーバ)、"txt"(FTPサーバ))

1ページとカウントするURLのタイプ(ファイルの拡張子)を指定する。 JSPページをカウントする場合は、"jsp"を追加する。

PageType    htm*
PageType    cgi
PageType    php
PageType    shtml

UseHTTPS(デフォルト : no)

SSL WEBサーバのログを解析するとき、有効にする。 "Top URLs"と"Top Pages"のリンクで、"http://"の替わりに"https://"が使用される。

UseHTTPS    no

DNSCache(デフォルト : なし(逆引きを実行しない))

DNSキャッシュファイルを指定する。 Webalizerは、IPアドレスを名前に変換するためにこのファイルを使用する。 DNSChildrenが指定されていれば、Webalizerを実行するときDNSキャッシュファイルを生成/更新する。

このオプションを指定しないと、IPアドレスを名前に変換できない。 パスを記述せずにファイル名だけ指定すると、OutputDirで指定したディレクトリにキャッシュファイルが作成される。 相対パスで指定した場合、パスの起点はOutputDirで指定したディレクトリになる。

DNSCache    /var/lib/webalizer/dns_cache.db

DNSChildren(デフォルト : 0(DNSキャッシュファイルを生成/更新しない))

DNSキャッシュファイルの生成に使用する、DNS子プロセス数を指定する。 このオプションを指定した場合は、DNSキャッシュファイルを指定しなければならない。

DNSChildren     10

HTMLPre(デフォルト : <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">)

<HTML>タグの前に出力するHTMLコード(DOCTYPE宣言)を指定する。 1行は80文字以内で、複数行の指定が可能。

HTMLPre     <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">

HTMLHead(デフォルト : なし)

<HEAD>〜</HEAD>で<TITLE>タグの直後に出力するHTMLコードを指定する。 1行は80文字以内で、複数行の指定が可能。

HTMLHead    <META NAME="author" CONTENT="The Webalizer">

HTMLBody(デフォルト : <BODY BGCOLOR="#E8E8E8" TEXT="#000000" LINK="#0000FF" VLINK="#FF0000">)

<BODY>タグを指定する。 1行は80文字以内で、複数行の指定が可能。

HTMLBody    <BODY BGCOLOR="#E8E8E8" TEXT="#000000" LINK="#0000FF" VLINK="#FF0000">

HTMLPost(デフォルト : なし)

最初の<HR>タグの直前に出力するHTMLコードを指定する。 1行は80文字以内で、複数行の指定が可能。

HTMLPost    <BR CLEAR="all">

HTMLTail(デフォルト : なし)

ホームページのリンクバックなどのHTMLコードを指定する。 "Generated by Webalizer Version X.XX"の右側に表示される。 1行は80文字以内で、複数行の指定が可能。

HTMLTail    <IMG SRC="msfree.png" ALT="100% Micro$oft free!">

HTMLEnd(デフォルト : </BODY></HTML>)

生成するHTMLドキュメントの一番最後に付加するHTMLコードを指定する。 </BODY>と</HTML>は必ずつけること。 1行は80文字以内で、複数行の指定が可能。

HTMLEnd     </BODY></HTML>

Quiet(デフォルト : no)

警告とエラーを除くメッセージを出力しない。 cronでWebalizerを実行するときなどは有効にする。

Quiet   yes

ReallyQuiet(デフォルト : no)

警告とエラーを含むすべてのメッセージを出力しない。

ReallyQuiet     no

TimeMe(デフォルト : no)

処理にかかった時間を表示する。

TimeMe      no

GMTTime(デフォルト : no)

ローカルタイムの替わりにGMTを使用する。

GMTTime     no

Debug(デフォルト : no)

デバッグのための情報をエラーメッセージに追加する。

Debug       no

FoldSeqErr(デフォルト : no)

シーケンスエラーを無視する。 Apacheのログを解析するときは、このオプションを有効にするらしい。

FoldSeqErr      yes

VisitTimeout(デフォルト : 1800(秒))

セッションタイムアウト時間を指定する。

VisitTimeout    1800

IgnoreHist(デフォルト : no)

履歴ファイルを無視する。 このオプションを有効にすると、index.htmlはカレントログファイルを元に生成される。

IgnoreHist      no

CountoryGraph(デフォルト : yes)

Countory Graph(国ごとのアクセス状況円グラフ)を表示する。

CountryGraph    yes

DailyGraph(デフォルト : yes)
DailyStats(デフォルト : yes)

日毎の解析グラフと表を表示する。

DailyGraph      yes
DailyStats      yes

HourlyGraph(デフォルト : yes)
HourlyStats(デフォルト : yes)

時毎の解析グラフと表を表示する。

HourlyGraph     yes
HourlyStats     yes

GraphLegend(デフォルト : yes)

日毎解析グラフと時毎解析グラフの凡例を表示する。

GraphLegend     yes

GraphLine(デフォルト : 2)

日毎解析グラフと時毎解析グラフの補助線の本数を指定する。

GraphLines      2

TopSites(デフォルト : 30)
TopKSites(デフォルト : 10)
TopURLs(デフォルト : 30)
TopKURLs(デフォルト : 30)
TopReferrers(デフォルト : 30)
TopAgents(デフォルト : 15)
TopCountries(デフォルト : 30)
TopEntry(デフォルト : 10)
TopExit(デフォルト : 10)
TopSearch(デフォルト : 20)
TopUsers(デフォルト : 20)

表示する"Top"を指定する。 '0'を指定したオプションは表示しない。

TopURLs          30    <--- "Top XX URLs"
TopKURLs         10    <--- "Top XX URLs By KBites"
TopEntry         10    <--- "Top XX Entry Pages"
TopExit          10    <--- "Top XX Exit Pages"
TopSites         30    <--- "Top XX Sites"
TopKSites        10    <--- "Top XX Sites By KBites"
TopReferrers     30    <--- "Top XX Referrers"
TopSearch        20    <--- "Top XX Search Strings"
TopAgents        15    <--- "Top XX Agents"
TopCountries     30    <--- "Top XX Countries"
TopUsers         20    <--- "Top XX Users"

AllSites(デフォルト : no)
AllURLs(デフォルト : no)
AllReferrers(デフォルト : no)
AllAgents(デフォルト : no)
AllSearchStr(デフォルト : no)
AllUsers(デフォルト : no)

このオプションを有効にすると、それぞれの表の下に"View All xxx"というリンクが追加され、それをクリックするとすべてのエントリを表示できる。

AllSites        no
AllURLs         no
AllReferrers    no
AllAgents       no
AllSearchStr    no
AllUsers        no

IndexAlias(デフォルト : index.)

ここで指定した文字列で始まるファイルへのアクセスは、ディレクトリへのアクセスとしてカウントされる。 つまり、"dir/index.*"へのアクセスと"dir/"へのアクセスは、両方とも"dir/"へのアクセスとしてカウントされる。 "index."はデフォルトで指定されているので、それ以外の追加のエイリアスがある場合だけ指定する。

IndexAlias      home.htm
IndexAlias      homepage.htm

HideURL(デフォルト : なし)
HideSite(デフォルト : なし)
HideReferrer(デフォルト : なし)
HideAgent(デフォルト : なし)
HideUser(デフォルト : なし)

Hide*で指定した文字列を含む場合、"Statistics"でカウントされるが"Top"に表示されない。 ワイルドカード'*'を使用できる。

HideURL         .gif    <--- ".gif"を含むURLは、カウントされるが表示されない
HideSite        192.168.*.*    <--- LANのアドレス"192.168.*.*"を含むリモートサイトは、カウントされるが表示されない
HideReferrer    www.nina.jp    <--- 自サーバ"www.nina.jp"を含む参照元は、カウントされるが表示されない
HideAgent       MSIE    <--- "MSIE"を含むユーザエージェントは、カウントされるが表示されない

GroupURL(デフォルト : なし)
GroupSite(デフォルト : なし)
GroupReferrer(デフォルト : なし)
GroupAgent(デフォルト : なし)
GroupUser(デフォルト : なし)

Group*で指定した文字列を含む場合、グルーピングして"Top"に表示する。 ワイルドカード'*'を使用できる。

"Top"に表示するとき、グルーピングのための文字列で表示させることもできるし、グループにラベルをつけてそれを表示させることができる。 GroupShadesGroupHighlightでグルーピングした項目を強調して表示させることもできる。

GroupURL         /dir1/    <--- "/dir1/"を含むURLは、グルーピングされて"/dir1/"と表示される
GroupURL         /dir2/     DIRECTORY2    <--- "/dir2/"を含むURLは、グルーピングされて"DIRECTORY2"と表示される

Group*を使用すると、グルーピングされた項目と個々の項目の両方が表示される。 グルーピングされた項目のみ表示させたい場合は、Hide*とあわせて使用する。

GroupURL         /dir3/     DIR3    <--- "/dir3/"を含むURLは、グルーピングされて"DIR3"と表示される
HideURL         /dir3/    <--- "/dir3/"を含むURLは、カウントされるが"Top"に表示されない

GroupShades(デフォルト : yes)

グルーピングされた行を濃色(通常は"#E8E8E8"のところを"#D0D0E0")で表示する。

GroupShades     yes

GroupHighlight(デフォルト : yes)

グルーピングされた行を太字で表示する。

GroupHighlight  yes

HideAllSites(デフォルト : no)

GroupSiteGroupDomainsでグルーピングされたサイトだけ"Top"に表示し、個々のサイトを表示しない。

HideAllSites    no

GroupDomains(デフォルト : 0)

"Top Sites"において、第n+1レベルまでを使用してドメインをグルーピングする。 たとえば、'1'を指定すると"sub1.nina.jp"と"sub2.nina.jp"は両方とも"nina.jp"でグループ化され表示される。 HideAllSitesと一緒に使われる。 '0'を指定すると、ドメインのグルーピングをしない。

GroupDomains    0

IgnoreURL(デフォルト : なし)
IgnoreSite(デフォルト : なし)
IgnoreReferrer(デフォルト : なし)
IgnoreAgent(デフォルト : なし)
IgnoreUser(デフォルト : なし)

Ignore*で指定した文字列を含む場合、"Statistics"でカウントしないし、"Top"にも表示されない。 つまり、無視される。 ワイルドカード'*'を使用できる。

IgnoreSite        192.168.*.*    <--- LANのアドレス"192.168.*.*"を含むリモートサイトは、カウントも表示もしない
IgnoreReferrer    www.nina.jp    <--- 自サーバ"www.nina.jp"を含む参照元は、カウントも表示もしない

IncludeURL(デフォルト : なし)
IncludeSite(デフォルト : なし)
IncludeReferrer(デフォルト : なし)
IncludeAgent(デフォルト : なし)
IncludeUser(デフォルト : なし)

おもにIgnore*とペアで使用され、指定した文字列を含む場合、強制的にカウントと表示をする。 ワイルドカード'*'を使用できる。

"index.html"を含むURL以外は、カウントも表示もしない
IgnoreURL   *
IncludeURL  index.html

MangleAgents(デフォルト : 0)

ユーザエージェントをまとめる。 '0'を指定すると、ユーザエージェントをまとめない。

MangleAgents    0
Mozilla/5.0 (Windows; U; Windows NT 5.1; ja-JP; rv:1.7.8) Gecko/20050511 Firefox/1.0.4    <--- すべて

MangleAgents    1
Mozilla/5.0 (Windows)    <--- ブラウザ名+メジャーバージョン+2桁のマイナーバージョン+修飾+システムタイプ

MangleAgents    2
Mozilla/5.0    <--- ブラウザ名+メジャーバージョン+2桁のマイナーバージョン+修飾

MangleAgents    3
Mozilla/5.0    <--- ブラウザ名+メジャーバージョン+2桁のマイナーバージョン

MangleAgents    4
Mozilla/5.0    <--- ブラウザ名+メジャーバージョン+1桁のマイナーバージョン

MangleAgents    5
Mozilla/5    <--- ブラウザ名+メジャーバージョン

SearchEngine(デフォルト : なし)

サーチエンジンのURLに含まれる文字列と、検索キーワードを示すクエリ変数を指定する。 あらかじめ、サンプル設定ファイルにいくつかのサーチエンジンが記述されているが、jpドメインのサイトを追加しないと取りこぼしがでてしまう。

#日本のサーチエンジンに対応できるよう追加
SearchEngine    .google.        q=
SearchEngine    .msn.           q=
SearchEngine    .goo.ne.jp      MT=
SearchEngine    .yahoo.co.jp    p=
SearchEngine    .infoseek.co.jp qt=
SearchEngine    .nifty.com      Text=
SearchEngine    .biglobe.ne.jp  q=
SearchEngine    .live.com       q=
SearchEngine    .ceek.jp        q=
SearchEngine    ask.jp	        q=
SearchEngine    .fresheye.com   kw=
SearchEngine    .aol.com        query=

#最初からサンプル設定ファイルに記述されているもの
SearchEngine   yahoo.com       p=
SearchEngine   altavista.com   q=
SearchEngine   google.com      q=
SearchEngine   eureka.com      q=
SearchEngine   lycos.com       query=
SearchEngine   hotbot.com      MT=
SearchEngine   msn.com         MT=
SearchEngine   infoseek.com    qt=
SearchEngine   webcrawler      searchText=
SearchEngine   excite          search=
SearchEngine   netscape.com    search=
SearchEngine   mamma.com       query=
SearchEngine   alltheweb.com   query=
SearchEngine   northernlight.com  qr=

DumpPath(デフォルト : OutputDirで指定したディレクトリ)

ダンプファイル(解析結果をカンマ区切りで書き出す)を書き出すディレクトリを指定する。 最後にスラッシュをつけないこと。

DumpPath    /var/log/httpd

DumpHeader(デフォルト : no)

ダンプファイルの最初の行に、項目名を書き出す。

DumpHeader      no

DumpHeader(デフォルト : tab)

ダンプファイルの拡張子を指定する。

DumpExtension   tab

DumpURLs(デフォルト : no)
DumpSites(デフォルト : no)
DumpReferrers(デフォルト : no)
DumpAgents(デフォルト : no)
DumpUsers(デフォルト : no)
DumpSearchStr(デフォルト : no)

書き出すダンプファイルの種類を指定する。

DumpSites       yes    <--- "site_YYYYMM.tab"ファイルに出力される
DumpURLs        yes    <--- "url_YYYYMM.tab"ファイルに出力される
DumpReferrers   yes    <--- "ref_YYYYMM.tab"ファイルに出力される
DumpAgents      yes    <--- "agent_YYYYMM.tab"ファイルに出力される
DumpUsers       yes    <--- "user_YYYYMM.tab"ファイルに出力される
DumpSearchStr   yes    <--- "search_YYYYMM.tab"ファイルに出力される

[サーバの実験室 Redhat/Fedora]