ФорумПрограммированиеPHP для идиотов → Хуево. Парсинг сайта.

Хуево. Парсинг сайта.

  • technobulka

    Сообщения: 4540 Репутация: N Группа: Джедаи

    Spritz 20 августа 2010 г. 15:22, спустя 24 минуты 25 секунд

    а че, тот вариант не пашет?
    Высокоуровневое абстрактное говно
  • ivanscm

    Сообщения: 1251 Репутация: N Группа: Джедаи

    Spritz 20 августа 2010 г. 15:29, спустя 7 минут 24 секунды

    Вот например первый линк http://kinomob.info/cheat,1,1,106.htm. там видишь текст
    С самого первого свистка и с самого первого матча FIFA 07 поможет вам окунуться в атмосферу профессиональной игры нового футбольного сезона. Вас ждет реалистичный и захватывающий футбол, каждый виртуальный матч станет событием в вашей жизни. И вы не сможете предугадать, что готовит вам следующая встреча, ведь FIFA 07  это всегда непредсказуемая и по-настоящему интересная игра. В FIFA 07 вы найдете 27 национальных Лиг из 20 разных стран мира. В игру точно перенесены более 510 футбольных команд. Игра настолько реалистична, что вы даже сможете узнать звезд футбола по стилю их игры и «фирменным» финтам, которые скопированы со знаменитых игроков с максимальной точностью.
    его надо и урл формы кнопки закачки. а название, картинку, и страницу игры мы со списка вытаскиваем
    С возвращением, Пiха! hyperoff.ru - качественный хостинг php
  • technobulka

    Сообщения: 4540 Репутация: N Группа: Джедаи

    Spritz 20 августа 2010 г. 16:04, спустя 34 минуты 48 секунд

    только я не силен в регулярках, вытащил заголовок и картинку… нуна еще описание и форму с кнопкой "скачать"…

    Высокоуровневое абстрактное говно
  • ivanscm

    Сообщения: 1251 Репутация: N Группа: Джедаи

    Spritz 20 августа 2010 г. 16:14, спустя 9 минут 33 секунды


    только я не силен в регулярках, вытащил заголовок и картинку… нуна еще описание и форму с кнопкой "скачать"…


    я тебя не понял :(
    С возвращением, Пiха! hyperoff.ru - качественный хостинг php
  • technobulka

    Сообщения: 4540 Репутация: N Группа: Джедаи

    Spritz 20 августа 2010 г. 16:17, спустя 3 минуты

    это значит, что я хз, как вытащить описание и ссылку…
    Высокоуровневое абстрактное говно
  • ivanscm

    Сообщения: 1251 Репутация: N Группа: Джедаи

    Spritz 20 августа 2010 г. 16:21, спустя 3 минуты 57 секунд

    ну со страницы списка же вытащил как то
    С возвращением, Пiха! hyperoff.ru - качественный хостинг php
  • pasha

    Сообщения: 1048 Репутация: N Группа: Адекваты

    Spritz 20 августа 2010 г. 18:12, спустя 1 час 51 минуту 15 секунд

    http://kinomob.info/cheat,1,1,106.htm


    как вариант http снифером можно посмотреть ссылку на скачку
    http://kinomob.info/index.php?p=cheats&action=downloadcheat&cheatid=106
  • pasha

    Сообщения: 1048 Репутация: N Группа: Адекваты

    Spritz 20 августа 2010 г. 18:19, спустя 7 минут 12 секунд

    тянем ссылку на скачку игры

    $text = '<form method="post" action="index.php?p=cheats&action=downloadcheat&cheatid=106">
    <div style="text-align:center;padding:5px">
    <input class="button" type="submit" value="Скачать / Download" />
    </div>
    </form>
    ';

    preg_match('#<form.*?action="(.*?)"#is', $text, $m);
    $downloadUrl = str_replace('ИАМП', '&', $m[1]);

    print $downloadUrl;
  • ivanscm

    Сообщения: 1251 Репутация: N Группа: Джедаи

    Spritz 20 августа 2010 г. 18:19, спустя 23 часа 59 минут 53 секунды

    аха, а мне описание надо :(
    С возвращением, Пiха! hyperoff.ru - качественный хостинг php
  • pasha

    Сообщения: 1048 Репутация: N Группа: Адекваты

    Spritz 20 августа 2010 г. 18:30, спустя 10 минут 46 секунд

    $body = file_get_contents('http://kinomob.info/cheat,3,1,141.htm');

    preg_match_all('#<h1>(.*?)</h1>.*?<font.*?;">(.*?)</span>#is', $body, $m);

    $data = array(strip_tags($m[1][0]),
    strip_tags($m[2][0])
    );

    print_r ($data);


    у md5 была статья как парсить. проще паренной репы

Пожалуйста, авторизуйтесь, чтобы написать комментарий!