ФорумПрограммированиеPHP для идиотов → Маска для парсера

Маска для парсера

  • Pavell

    Сообщения: 5 Репутация: N Группа: Кто попало

    Spritz 2 января 2009 г. 8:32

    Вобщем хочу написать парсер который будет ходить по сайту и собирать телефонные номера. Да вот только для этого
    нужно правильно сделать шаблон(маску) по которому будут искаться номера. Как правильно составить незнаю, помогите пожалуйста справится с задачей?
  • welder

    Сообщения: 2945 Репутация: N Группа: в ухо

    Spritz 2 января 2009 г. 8:37, спустя 4 минуты 37 секунд

    ты б хотябы попытался что сам сделать .. выложить код .. не чего сложного там нет
  • Pavell

    Сообщения: 5 Репутация: N Группа: Кто попало

    Spritz 2 января 2009 г. 8:45, спустя 8 минут 16 секунд

    Я уже пытался составлять регулярные выражения, в итоге получается сам незнаю что. И как туда впихнуть метод поиска по страницам, тоже недоганяю.
  • AlexB

    Сообщения: 4290 Репутация: N Группа: в ухо

    Spritz 2 января 2009 г. 9:02, спустя 16 минут 36 секунд

    Pavell, ты сначала хотя бы просто сформулируй на русском языке, какие сочетания символов ты считаешь телефонными номерами, а потом уже думай про регулярные выражения для этих сочетаний.
  • AlexB

    Сообщения: 4290 Репутация: N Группа: в ухо

    Spritz 2 января 2009 г. 9:06, спустя 3 минуты 36 секунд


    не чего сложного там нет
    Ну писать паук, который ходит по сайтам не самая простая задача. Я бы как раз советовал начать с чего-нибудь попроще ….
  • Trej Gun

    Сообщения: 5299 Репутация: N Группа: в ухо

    Spritz 2 января 2009 г. 9:06, спустя 56 секунд

    И как туда впихнуть метод поиска по страницам

    судя по этому предложению ты не знаешь о чем говоришь
    посмотри тут был батл на создание паука который шариться по сайтам
    глянь как он работает
  • kendo

    Сообщения: 446 Репутация: N Группа: Адекваты

    Spritz 2 января 2009 г. 9:25, спустя 18 минут 35 секунд

    К слову, написать регулялку, которая бы номера собирала тоже не такая уж и простая задача. Учитывая, что оформление может совершенно различным для разных стран и городов… К примеру, (666) 777-77, или 86667777, или 666-7-7777. В общем, гиблое дело, я считаю :(
  • Trej Gun

    Сообщения: 5299 Репутация: N Группа: в ухо

    Spritz 2 января 2009 г. 9:29, спустя 3 минуты 44 секунды

    KENDO, посмотри на скайп
  • adw0rd

    Сообщения: 22905 Репутация: N Группа: в ухо

    Spritz 2 января 2009 г. 9:32, спустя 3 минуты 17 секунд

    А еще можно начать с того, для чего эти номера нужны топикстартеру?
    adw/0
  • welder

    Сообщения: 2945 Репутация: N Группа: в ухо

    Spritz 2 января 2009 г. 9:52, спустя 20 минут 7 секунд



    не чего сложного там нет
    Ну писать паук, который ходит по сайтам не самая простая задача. Я бы как раз советовал начать с чего-нибудь попроще ….


    ну а пауке там и слова не было =))

    Вобщем хочу написать парсер который будет ходить по сайту и собирать телефонные номера
  • Pavell

    Сообщения: 5 Репутация: N Группа: Кто попало

    Spritz 2 января 2009 г. 10:10, спустя 17 минут 55 секунд

    да неважно В каком виде номер будет, привести его в порядок я смогу после сбора. мне главное чтобы любые номера собирались!
  • Professor

    Сообщения: 2089 Репутация: N Группа: Адекваты

    Spritz 2 января 2009 г. 10:13, спустя 2 минуты 53 секунды

    ТОесть любые цифры?
  • Pavell

    Сообщения: 5 Репутация: N Группа: Кто попало

    Spritz 2 января 2009 г. 10:29, спустя 16 минут 8 секунд

    да любые, включая все способы задания номеров. Тойсть +346354364, (434)3436453, и.т.д
  • Trej Gun

    Сообщения: 5299 Репутация: N Группа: в ухо

    Spritz 2 января 2009 г. 10:38, спустя 8 минут 48 секунд

    \+?([\d \(\)])+

    это выдерет тебе то что похоже на телефонный номер
    +346354364
    (434)3436453
    а также то что на него не похоже
    +3( )5
  • phpdude

    Сообщения: 26624 Репутация: N Группа: в ухо

    Spritz 2 января 2009 г. 11:33, спустя 55 минут 3 секунды

    http://phpdude.ru/archives/442
    Сапожник без сапог

Пожалуйста, авторизуйтесь, чтобы написать комментарий!