Модуль для записи статистики apache в БД MySQL [2008]
Озадачился тем, чтобы писать логи апача в БД. Начал стругать скрипт на шелле, но - понял, что это полумера... Порывшись в инете понял - метод есть - модуль к апачу, который пишет логи сразу в БД. Пошёл в порты, смотреть, есть ли он там:
/usr/home/lissyara/>
/usr/home/lissyara/>cd /usr/ports/
/usr/ports/>make search name='mod_log_sql'
Port: mod_log_sql-1.18_2
Path: /usr/ports/www/mod_log_sql
Info: Allows Apache to log to a MySQL database
Maint: lev@FreeBSD.org
B-deps: apache-1.3.34_3 expat-1.95.8_3 gettext-0.14.5
gmake-3.80_2 libiconv-1.9.2_1 mysql-client-4.1.16_1 perl-5.8.7_2
R-deps: apache-1.3.34_3 expat-1.95.8_3 mysql-client-4.1.16_1 perl-5.8.7_2
WWW: http://www.grubbybaby.com/mod_log_mysql/
Port: mod_log_sql-1.100
Path: /usr/ports/www/mod_log_sql2
Info: Allows Apache to log to a MySQL database
Maint: apache@FreeBSD.org
B-deps: apache-1.3.34_3 expat-1.95.8_3 gettext-0.14.5 gmake-3.80_2
libiconv-1.9.2_1 mysql-client-4.1.16_1 perl-5.8.7_2
R-deps: apache-1.3.34_3 expat-1.95.8_3 mysql-client-4.1.16_1 perl-5.8.7_2
WWW: http://www.outoforder.cc/projects/apache/mod_log_sql/
/usr/ports/>
Нашлось, аж 2 штуки. Как самый умный, я решил поставить второй - /usr/ports/www/mod_log_sql2, но, тут меня ждал облом - он не хотел собираться... Кое-как собрал - не работает... Плюнул, снёс, поставил другой - /usr/ports/www/mod_log_sql - этот сразу поставился, и заработал. Надо заметить, что, на самом деле, оба порта - один и тот же модуль, но разных версий... Итак:
/usr/ports/>cd /usr/ports/www/mod_log_sql
/usr/ports/www/mod_log_sql/>make && make install && make clean
После установки, создаём БД, заводим пользователя и даём ему привилегии на эту БД:
/usr/home/lissyara/>mysql --user=root --password=root_password \
? --execute="CREATE DATABASE apache_logs"
/usr/home/lissyara/>mysql --user=root --password=root_password \
? --execute="GRANT USAGE ON *.* TO apache@localhost IDENTIFIED \
? BY 'apache' WITH MAX_QUERIES_PER_HOUR 0 \
? MAX_CONNECTIONS_PER_HOUR 0 MAX_UPDATES_PER_HOUR 0"
/usr/home/lissyara/>mysql --user=root --password=root_password \
? --execute="GRANT ALL PRIVILEGES ON apache_logs.* \
? TO apache@localhost WITH GRANT OPTION"
/usr/home/lissyara/>
<IfModule mod_log_sql.c>
# инфа для соединения с MySQL -
# хост, имя пользователя, пароль
LogSQLLoginInfo localhost apache apache
# БД, в которую будут писаться логи
LogSQLDatabase apache_logs
# Создавать или нет таблицу, для хранения логов
# (В принципе, никто не запрещает создать её самому,
# у такого решения будут даже плюсы - не будет лишних
# граф...)
LogSQLCreateTables on
# Сокет MySQL
LogSQLSocketFile /tmp/mysql.sock
# Порт, на котором висит MySQL - Если порт стандартный (3306)
# то можно эту строчку закомментировать (или просто не писать :))
LogSQLTCPPort 3306
# имя таблицы, в которую писать логи
LogSQLTransferLogTable access_log
</IfModule>
Для расширенной настройки пригодится следующая табличка:
?
что означает
имя колонки
тип колонки
пример
A
User agent
agent
varchar(255)
Mozilla/4.0(compat;MSIE 6.0;Windows)
a
CGI arguments
request_args
varchar(255)
user=Smith&cart=1231
b
байт передано
bytes_sent
int unsigned
32561
c
текст cookie
cookie
varchar(255)
Apache=syn.line.net.1300102700823
H
HTTP протокол
request_protocol
varchar(10)
HTTP/1.1
h
имя удал. хоста
remote_host
varchar(50)
blah.foobar.com
I
Request ID
id
char(19)
POlFcUBRH30AAALdBG8
l
Ident user info
remote_logname
varchar(50)
bobby
M
Machine ID
machine_id
varchar(25)
web01
m
HTTP метод запроса
request_method
varchar(6)
GET
P
PID процесса
child_pid
smallint unsigned
3215
p
HTTP порт
server_port
smallint unsigned
80
R
реферер
referer
varchar(255)
http://www.biglinks4u.com/page.html
r
полный запрос
request_line
varchar(255)
GET /foo.htm HTTP/1.1
S
время в UNIX
time_stamp
int unsigned
1005598029
s
статус запроса
status
smallint unsigned
404
T
время обработки
request_duration
smallint unsigned
2
t
время
request_time
char(28)
[02/Dec/2001:15:01:26 -0800]
U
краткий запрос
request_uri
varchar(255)
/books-cycroad.html
u
узер (из авторизации)
remote_user
varchar(50)
bobby
v
виртуальный хост
virtual_host
varchar(50)
www.lissyara.su
А собственно расширенная конфигурация будет выглядеть примерно так: /usr/local/etc/apache/httpd.conf
<IfModule mod_log_sql.c>
# инфа для соединения с MySQL -
# хост, имя пользователя, пароль
LogSQLLoginInfo localhost apache apache
# БД, в которую будут писаться логи
LogSQLDatabase apache_logs
# Создавать или нет таблицу, для хранения логов
# (В принципе, никто не запрещает создать её самому,
# у такого решения будут даже плюсы - не будет лишних
# граф...)
LogSQLCreateTables on
# Сокет MySQL
LogSQLSocketFile /tmp/mysql.sock
# Порт, на котором висит MySQL - Если порт стандартный (3306)
# то можно эту строчку закомментировать (или просто не писать :))
LogSQLTCPPort 3306
# Таблица, в которую будут записываться логи (можно сделать несколько
# и разместить их внутри директив `VirtualHost` - тогда каждый
# виртуальный хост будет писать логи в свою таблицу)
LogSQLTransferLogTable access_log
# что писать, а что нет в таблицу с логами. В данном варианте, пишется
# вообще всё - но если не хотите писать всё, то неиспользуемые колонки
# будут содержать `NULL`
LogSQLTransferLogFormat AabcHhIlMmPpRrSsTtUuv
# также можно настроить и исключения - что писать, а что нет
# в логи:
# Следующий параметр определяет что писать в логи (если не подходит
# под шаблон - то не пишется. Если параметр не задан - пишется всё)
# также надо заметить, что эти параметры являются регистрозависимыми
# т.е. *.JPG файлы не пройдут по нижепредложенному варианту...
LogSQLRequestAccept *.gif *.jpg *.html
# какие файлы надо игнорировать (если по предыдущей, разрешающей,
# директиве они прошли, можно зарезать их тут), также в доках на модуль
# приводится интересный пример использования этой директивы - чтобы не
# засирать логи попытками малолетних кулхацкеров взомать сервер, надо
# поместить в неё следующие словечки: root.exe cmd.exe default.ida ...
# Также можно зарезать всю графику в логах: .jpg .gif .png
LogSQLRequestIgnore statistic.html test.gif
# Какие удалёные хосты игнорировать при ведении логов
# в этом примере не будут учитываться запросы со всех моих
# хостов - forum.lissyara.su, www.lissyara.su, mx.lissyara.su и других...
LogSQLRemhostIgnore lissyara.su
# следующий параметр предназначен для автоматического создания
# всех таблиц для всех виртуальных хостов машины - например для
# машины где очень много виртуальных хостов - соответственно руками
# всё прописывать очень обломно :)
LogSQLMassVirtualHosting on
# надо заметить, что есть ещё интересные параметры - можно регистрировать
# работу других модулей, и их результатов - в оригинале, на сайте
# разаработчика есть пример для модуля mod_gzip,
# но я пока с этим не разбирался...
</IfModule>
Вот такой будет конфиг... Также неплохо бы создать индексы - пригодится если будете делать выборки из этой таблицы... После внесения всех необходимых пунктов перезапускаем апач, и смотрим, создались ли таблицы:
Замеченные баги: Самое главное - недостаточный размер некоторых столбцов, создаваемых автоматически - в частности `referer` - бывает достаточно длинным (если чувак пришёл с поисковика, например) и он не влазиет весь. Пришлось поменять тип столбца на `text`, аналогично со столбцом `request_uri`. Также, по неизвестной причине, не пишет скока байт отдано скриптами - типа *.php... Абидно...