ФорумПрограммированиеPHP для идиотов → Статистика посещений

Статистика посещений

  • Professor

    Сообщения: 2089 Репутация: N Группа: Адекваты

    Spritz 14 августа 2008 г. 23:51

    Добрый вечер(день)
    =)
    Пишу скрипт ведущий статистику посещения сайта пользователями.О как.
    Ботов исключаю следующим образом
    if(preg_match('#[a-z]+#',$_SERVER['HTTP_REFERER'])!=0)
    {

    }

    Но иногда попадаются страницы(с которых пользователь зашел),где нет ссылки на сайт.
    Вопрос: может ли бот выдавать ложный $_SERVER['HTTP_REFERER']?
  • vasa_c

    Сообщения: 3131 Репутация: N Группа: в ухо

    Spritz 15 августа 2008 г. 0:08, спустя 16 минут 37 секунд

    да
  • Professor

    Сообщения: 2089 Репутация: N Группа: Адекваты

    Spritz 15 августа 2008 г. 0:28, спустя 20 минут 25 секунд

    А зачем???
  • sap

    Сообщения: 2701 Репутация: N Группа: Кто попало

    Spritz 15 августа 2008 г. 0:29, спустя 37 секунд

    Отсеивать по рефереру не вариант. Если ты имеешь в виду поисковых ботов, то отслеживай по имени хоста:
    gethostbyaddr($_SERVER['REMOTE_ADDR']);

  • Professor

    Сообщения: 2089 Репутация: N Группа: Адекваты

    Spritz 15 августа 2008 г. 0:39, спустя 10 минут 22 секунды

    А как по хосту отсеивать??
    Вот хост 93.interwave.ru О чем мне это говорит?
  • Professor

    Сообщения: 2089 Репутация: N Группа: Адекваты

    Spritz 15 августа 2008 г. 1:04, спустя 24 минуты 34 секунды

    Повторюсь,Зачем боты ложную нинформацию дают??
    Ну хорошо,скачал я список ботов тут http://www.user-agents.org/allagents.xml
    И это мне каждого пользователя проверять по нему нужно????
    Этож скока времени надо??
  • sap

    Сообщения: 2701 Репутация: N Группа: Кто попало

    Spritz 15 августа 2008 г. 1:12, спустя 8 минут 6 секунд

    Могут не значит дают. Те боты, которые хотят ко мне (гуглебот, яндексбот, лайвсирч, вебалта, мсн и еще что-то там) — все ходят без реферера. Но не будешь же ты отсеивать всех, кто пришел без реферера :) Что, человек уже не имеет права просто твой адрес набрать и зайти? :) Так что да, проверяй по хосту. Не так уж много времени на это уходит.
    if (in_array (gethostbyaddr($_SERVER['REMOTE_ADDR']), $bot_hosts))
  • md5

    Сообщения: 11960 Репутация: N Группа: в ухо

    Spritz 15 августа 2008 г. 9:03, спустя 7 часов 50 минут 56 секунд

    http://pyha.ru/forum/topic/61.0
    все умрут, а я изумруд
  • Professor

    Сообщения: 2089 Репутация: N Группа: Адекваты

    Spritz 15 августа 2008 г. 10:28, спустя 1 час 24 минуты 56 секунд

    Могут не значит дают.

    Ну по всей вдимости,всетака дают.
    Что, человек уже не имеет права просто твой адрес набрать и зайти? :)

    Имеет конечно право,но для статистики бесполезен))
    Хочется знать,с каких страниц заходит человек.А тут выдают страницы вообще не по теме и бес сылок на мой сайт.
    Вопрос,как человек пришел с сайта,с которого нет ссылки?
    А если это робот,то зачем он врет?
    И можно ли по какому то признаку определить,что это бот?Не обязательно чей,откуда и и куда.
    Я считал что отсутствие $_SERVER['HTTP_REFERER'] это критерий


    P.S.
    http://pyha.ru/forum/topic/61.0

    извините,нашел только статью vasa_c
  • sap

    Сообщения: 2701 Репутация: N Группа: Кто попало

    Spritz 15 августа 2008 г. 11:53, спустя 1 час 25 минут 26 секунд

    Вопрос,как человек пришел с сайта,с которого нет ссылки?

    Дай мне ссылку на свой сайт, я тебе хоть с реферером microsoft.com зайду =)

    И можно ли по какому то признаку определить,что это бот?Не обязательно чей,откуда и и куда.

    Со 100%-ой вероятностью — нет.

    Я считал что отсутствие $_SERVER['HTTP_REFERER'] это критерий

    Повторяю, это не критерий. Все, что начинается в HTTP_ — не критерий, т.к. может быть подделано.

Пожалуйста, авторизуйтесь, чтобы написать комментарий!