ФорумПрограммированиеPHP для идиотов → Регулярки

Регулярки

  • FjuZ

    Сообщения: 64 Репутация: N Группа: Кто попало

    Spritz 29 декабря 2010 г. 12:56

    Хочу спарсить инфу между тегами. Но даже это
    $url="http://www.pro-remont.com.ua/view.articles/mode.view/id.412/";
    $get=file_get_contents($url);
    preg_match_all("#\<html\>(.*)\<\/html\>#", $get, $matches);
    print_r($matches);
    выдает пустой массив. Где ошибка?
  • ivanscm

    Сообщения: 1251 Репутация: N Группа: Джедаи

    Spritz 29 декабря 2010 г. 12:57, спустя 58 секунд

    сезон регулярок на пиха ру
    С возвращением, Пiха! hyperoff.ru - качественный хостинг php
  • adw0rd

    Сообщения: 22959 Репутация: N Группа: в ухо

    Spritz 29 декабря 2010 г. 13:02, спустя 4 минуты 40 секунд

    #<html.*?>(.*)<\/html>#s
    Спустя 49 сек.
    http://pyha.ru/fishki/regexp/ вот вам в помощь
    https://smappi.org/ - платформа по созданию API на все случаи жизни
  • FjuZ

    Сообщения: 64 Репутация: N Группа: Кто попало

    Spritz 29 декабря 2010 г. 13:10, спустя 8 минут 17 секунд

    adw0rd, спасибо
  • andipas

    Сообщения: 170 Репутация: N Группа: Кто попало

    Spritz 29 декабря 2010 г. 13:18, спустя 7 минут 46 секунд

  • FjuZ

    Сообщения: 64 Репутация: N Группа: Кто попало

    Spritz 29 декабря 2010 г. 23:06, спустя 9 часов 47 минут 59 секунд

    И ещё вопрос. Когда получаю контент:
    $url="http://newspoker.ru/poker_online/v-yanvare-startuet-uboc-6.html";
    $url=file_get_contents($url);

    echo $url;

    выводит крякозябрами. как исправить кодировку?
  • Troy

    Сообщения: 2532 Репутация: N Группа: Джедаи

    Spritz 29 декабря 2010 г. 23:15, спустя 9 минут 4 секунды

    iconv()
  • FjuZ

    Сообщения: 64 Репутация: N Группа: Кто попало

    Spritz 29 декабря 2010 г. 23:16, спустя 49 секунд

    Troy, а из какой кодировки в какую?
  • mario

    Сообщения: 6067 Репутация: N Группа: Джедаи

    Spritz 29 декабря 2010 г. 23:23, спустя 6 минут 37 секунд

    ухаха! пиздец.. FjuZ, но а попробовать самому узнать? ;)
    Спустя 85 сек.
    файл скрипта наверное у тебя в cp-1251, а данные на том сайте в utf-8 )
  • FjuZ

    Сообщения: 64 Репутация: N Группа: Кто попало

    Spritz 29 декабря 2010 г. 23:28, спустя 5 минут 52 секунды

    $url="http://newspoker.ru/poker_online/v-yanvare-startuet-uboc-6.html";
    $urle=file_get_contents($url);

    echo iconv("UTF-8", "cp-1251", $urle);

    вообще пусто
  • FjuZ

    Сообщения: 64 Репутация: N Группа: Кто попало

    Spritz 2 января 2011 г. 22:20, спустя 3 дня 22 часа 51 минуту

    Ещё вопрос. Ставлю в вычислитель регулярок регулярку
    #<td>&nbsp;&nbsp;.{21}</td>#

    и текст
    <td>&nbsp;&nbsp;Азербайджанский манат</td>

    А совпадений нет :( Почему?
  • Faster

    Сообщения: 1159 Репутация: N Группа: Кто попало

    Spritz 2 января 2011 г. 22:59, спустя 39 минут 12 секунд

    точка лишняя в регулярке
  • master

    Сообщения: 3244 Репутация: N Группа: Джедаи

    Spritz 2 января 2011 г. 23:59, спустя 59 минут 18 секунд

    FjuZ, какая кодировка? попробуй модификатор u для юникода
    не всё полезно, что в swap полезло
  • fgets

    Сообщения: 1099 Репутация: N Группа: Кто попало

    Spritz 3 января 2011 г. 0:51, спустя 52 минуты 31 секунду

    <td>&nbsp;&nbsp;Азербайджанский манат</td>


    <?php
    $text = '<td>&nbsp;&nbsp;Азербайджанский манат</td>';
    preg_match_all('/td\>(&nbsp;)+(.+?)<\/', $text, $matches, PREG_PATTERN_ORDER);
    print_r($matches[2]);


    или я не правильно понял?

Пожалуйста, авторизуйтесь, чтобы написать комментарий!