|
Лог-файлы web-сервера - что в них?
29/04/2007
Когда путешествующий по Интернету посетитель web-страниц направляет браузер на тот или иной адрес, то браузер, извлекая страницу с web-сервера, соответствующего адресу, генерирует множество запросов, выполняемых сервером. Сведения о каждом запросе браузера web-сервер записывает в особый файл, называемый "лог-файлом" (от англ. log - судовой журнал, в данном случае).
Обычно одному запросу в лог-файле соответствует одна текстовая строка, отформатированная особым образом. Получение браузером одной web-страницы традиционно порождает несколько запросов к web-серверу, а не единственный, как можно подумать. Дело в том, что получение с сервера каждого элемента страницы (например, каждого графического файла) - это один запрос. Современная же web-страница часто содержит десяток, а иногда многим более, файлов с графикой.
На формат записей лог-файлов существуют специальные стандарты, подробное рассмотрение которых пока остаётся за рамками нашей статьи. Отметим лишь, что в каждой записи обычно содержатся сведения об IP-адресе источника запроса, о типе запроса и результатах его выполнения, о типе клиентского (пользовательского) браузера, о типе операционной системы на клиентском компьютере, о запрашиваемом с сервера элементе. Сохраняется и другая информация.
Интересно, что не все поля из сохранённой в лог-файл записи достоверны с гарантией. Так, браузер передаёт информацию о себе самом (так сказать, представляется) и о типе операционной системы из которой он, браузер, работает. Конечно, web-сервер не может проверить эту информацию и принимает её как есть. В подавляющем большинстве случаев данные, передаваемые с компьютера посетителя, верны. Но иногда они могут быть изменены находчивым продвинутым пользователем.
IP-адрес источника запроса также достоверен лишь с какой-то степенью точности, по нынешним временам не высокой: вовсе не обязательно, что конечный компьютер, пославший запрос, имеет именно тот IP-адрес, который в запросе указан. Дело в том, что между web-сервером и компьютером посетителя очень часто оказывается специальный узел-ретранслятор, по тем или иным причинам не просто передающий пакеты данных, но и скрывающий исходный адрес (вовсе не обязательно, что это делается для целей обеспечения анонимности).
А вот данные о запрошенной с web-сервера странице, её адресе - точны (если система настроена верно), ведь эти данные и составляют основной предмет запроса.
Несмотря на все возможные неточности, лог-файлы web-сервера остаются самым полным источником статистики посещаемости, просто потому, что все другие методы сбора этой статистики предоставляют ещё более туманные данные.
Будьте первым комментатором, заполните форму ниже!
-
Комментарии: 5 -
Комментарии: 0 -
Комментарии: 0 -










