Технологический мониторинг

Рубрика Интернет-маркетинг | 30-01-2010

0

Технические аспекты

Для получения первичных статистических данных в настоящее время в Интернете используется одна из следующих технологий: специальные системы сбора статистики (усовершенствованные счетчики – SpyLog, например), логии сервера (log-файлы). Рассмотрим их поподробнее.

Системы сбора статистики работают следующим образом. На каждую страничку исследуемого ресурса устанавливается специальный счетчик, который воплощен в виде рисунка (SpyLog) или пикселя (Rambler). На самом же деле этот рисунок или пиксель есть результат работы серверного скрипта, установленного на удаленном сервере провайдера услуги по сбору статистики, который вызывается при загрузке странички. В качестве параметров этот скрипт получает данные о машине пользователя, о его браузере, об имени той странички, с которой пришел пользователь и т.д. Таким образом, на удаленной машине ведется полный конспект действий каждого посетителя исследуемого ресурса.

Теперь разберемся, что такое логи. При запросе пользователем HTML-страницы браузер генерирует запрос к серверу, на котором размещается сайт, причем для каждого отдельного файла станицы браузер должен сгенерировать отдельный запрос. Log-файлы это текстовые файлы, в которые построчно записывается информация о каждом запросе того или иного файла у web-сервера. Например, при запросе НТМL-страницы, содержащей пять графических элементов, браузер сгенерирует шесть запросов к серверу и в log-файле появятся шесть новых строк. Таким образом, в log-файл помещается информация обо всех корректных запросах, полученных сервером.

Некорректные запросы (например, несуществующих документов) также регистрируются, но в другом файле – файле регистрации ошибок. Запрос регистрируется не в момент его прихода, а только после его полной обработки. Таким образом, по своей сути лог-файл представляет собой как бы «бортовой журнал» сайта. Он фиксирует практически любую активность пользователей на нем.

Структура записи в log-файле может быть самой разнообразной. Она зависит не только от используемого сервера, но и от настроек, произведенных Web-мастером. Наибольшее распространение получили два формата – «обычный», использованный самым первым Web-сервером, и «комбинированный», называемый также NCSA-форматом, так как впервые он появился у сервера NCSA – прародителя всемирно известного Apache. Строка log-файла обычного формата выглядит следующим образом:

194.221.198.72 – admin [23/Feb/2003:22:48:05 +0300] «GЕТ /admin/ НТТР/1.0» 200 9059.

Все поля записи разделяются пробелами (если значение заключено в двойные кавычки или, в случае с датой, в квадратные скобки, то оно интерпретируется как одно поле), если значение какого-то поля отсутствует, то на его месте ставится дефис.

Страницы: 1 2 3

Write a comment