ФорумСообщество/dev/null → Помогите с регуляркой

Помогите с регуляркой

  • pup0k

    Сообщения: 10 Репутация: N Группа: Кто попало

    Spritz 3 мая 2009 г. 18:28, спустя 38 секунд



    preg_match("#($_GET|$_GET/).*?(/services/bookmark/id/\d+)#ism",$responce,$link);
    Что сделал нетак ? Хотел предусмотреть варианты с http://site.com/ и http://site.com

    preg_match('#$_GET.*?(/services/bookmark/id/\d+)#ism",$html,$link);


    Вы прямо без проверки мне этот код написали ? Я говорю про первый код,т.к увас в нём небольшая ошибка ))
    В начале апостров а в конце двойные ковычки…
    Просто интересно )
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 3 мая 2009 г. 18:28, спустя 16 секунд

    AlexB, согласен. пусть сами учатся, а то пишут граберы нашими руками
    Сапожник без сапог
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 3 мая 2009 г. 18:29, спустя 35 секунд




    preg_match("#($_GET|$_GET/).*?(/services/bookmark/id/\d+)#ism",$responce,$link);
    Что сделал нетак ? Хотел предусмотреть варианты с http://site.com/ и http://site.com

    preg_match('#$_GET.*?(/services/bookmark/id/\d+)#ism",$html,$link);


    Вы прямо без проверки мне этот код написали ? Я говорю про первый код,т.к увас в нём небольшая ошибка ))
    В начале апостров а в конце двойные ковычки…
    Просто интересно )
    ты думаешь я такую херню проверять должен? … я бесплатно даже блокнот не открою.
    Сапожник без сапог
  • mario

    Сообщения: 6067 Репутация: N Группа: Джедаи

    Spritz 3 мая 2009 г. 19:24, спустя 55 минут 22 секунды


    Мля, как уже задрали вопросы посвященные теме "спереть контент". Предлагаю сносить их сразу в dev/null и не отвечать на них …

    не буду спорить что этот человек пишит грабер, а если надо например со своего же сайта(другого) грабить… Это так мысли в слух… :D
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 3 мая 2009 г. 19:27, спустя 3 минуты 23 секунды



    Мля, как уже задрали вопросы посвященные теме "спереть контент". Предлагаю сносить их сразу в dev/null и не отвечать на них …

    не буду спорить что этот человек пишит грабер, а если надо например со своего же сайта(другого) грабить… Это так мысли в слух… :D
    не отмазывай :)
    Сапожник без сапог
  • ubica

    Сообщения: 530 Репутация: N Группа: Кто попало

    Spritz 3 мая 2009 г. 19:31, спустя 3 минуты 44 секунды

    mario, пусть из бд берет
  • AlexB

    Сообщения: 4306 Репутация: N Группа: в ухо

    Spritz 3 мая 2009 г. 19:34, спустя 2 минуты 42 секунды


    если надо например со своего же сайта(другого) грабить…
    Тогда нормальные люди XML обмен юзают, а не говнопарсинг регулярками.
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 3 мая 2009 г. 19:40, спустя 6 минут 4 секунды



    если надо например со своего же сайта(другого) грабить…
    Тогда нормальные люди XML обмен юзают, а не говнопарсинг регулярками.
    регулярками хорошо парсится все)) самое сложное в моей жизни парсинга попалось на амазоне - там был дополнительный ксс файл с рандом стилями и тп, и в хтмл были помехи в виде спанов. нужный текст в спанах и ненужный тоже. приходилось скачивать этот ксс парсить его и выкиывать плохие спаны))) молодцы, потрудились :)
    Сапожник без сапог
  • ubica

    Сообщения: 530 Репутация: N Группа: Кто попало

    Spritz 3 мая 2009 г. 19:44, спустя 4 минуты 6 секунд




    если надо например со своего же сайта(другого) грабить…
    Тогда нормальные люди XML обмен юзают, а не говнопарсинг регулярками.
    регулярками хорошо парсится все)) самое сложное в моей жизни парсинга попалось на амазоне - там был дополнительный ксс файл с рандом стилями и тп, и в хтмл были помехи в виде спанов. нужный текст в спанах и ненужный тоже. приходилось скачивать этот ксс парсить его и выкиывать плохие спаны))) молодцы, потрудились :)
    помню, выдирал из html фрейм, занимающий более 50% площади страницы. нечто подобное
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 3 мая 2009 г. 19:45, спустя 44 секунды

    по 50 грамм??
    Сапожник без сапог
  • ubica

    Сообщения: 530 Репутация: N Группа: Кто попало

    Spritz 3 мая 2009 г. 19:45, спустя 35 секунд

    не пью)
  • phpdude

    Сообщения: 26646 Репутация: N Группа: в ухо

    Spritz 3 мая 2009 г. 19:47, спустя 1 минуту 23 секунды


    не пью)
    из мелкой тары??
    Сапожник без сапог
  • mario

    Сообщения: 6067 Репутация: N Группа: Джедаи

    Spritz 3 мая 2009 г. 20:38, спустя 51 минуту 4 секунды




    Мля, как уже задрали вопросы посвященные теме "спереть контент". Предлагаю сносить их сразу в dev/null и не отвечать на них …

    не буду спорить что этот человек пишит грабер, а если надо например со своего же сайта(другого) грабить… Это так мысли в слух… :D
    не отмазывай :)

    я же сказал что даже спорить не буду что человек для граббера пишит…. и не думал отмазывать.


    если надо например со своего же сайта(другого) грабить…
    Тогда нормальные люди XML обмен юзают, а не говнопарсинг регулярками.

    вот про это не подумал…
  • AlexB

    Сообщения: 4306 Репутация: N Группа: в ухо

    Spritz 3 мая 2009 г. 20:47, спустя 9 минут 3 секунды


    регулярками хорошо парсится все))
    Разумеется, на то они и регулярки, что теоритически могут быть сколь угодно большой сложности. Просто сам по себе подход - имеет низкую производительность, расширяемость, устойчивость и удобство поддержки. Так что если это "свой" сайт - можно сделать нормальную выгрузку данных, а если чужой - дык пусть неповадно будет воровать и засирать интернет.
  • mario

    Сообщения: 6067 Репутация: N Группа: Джедаи

    Spritz 3 мая 2009 г. 20:50, спустя 2 минуты 59 секунд



    регулярками хорошо парсится все))
    Разумеется, на то они и регулярки, что теоритически могут быть сколь угодно большой сложности. Просто сам по себе подход - имеет низкую производительность, расширяемость, устойчивость и удобство поддержки. Так что если это "свой" сайт - можно сделать нормальную выгрузку данных, а если чужой - дык пусть неповадно будет воровать и засирать интернет.

    опять таки, я не кого не защищаю, но например грабер погоды, грабер валюты и тому подобные фишки… AlexB, это просто мысли вслух, без обид. :)
    UPD
    хотя тут тоже могу ошибаться… в силу неопытности.

Пожалуйста, авторизуйтесь, чтобы написать комментарий!