Знакомый на днях попросил подумать над парсером для одного сайта.
Суть такая:
Теория: Есть сайт, где проходит тест. Вопросов тысячи. Каждый из них расположен на отдельной html страничке. 4 варианта ответа, распологающиеся в рандомном порядке. Проходить тест можно раз в 24 часа. Необходимо сделать парсер, который бы проходил по ссылкам и запоминал ответы, чтобы пройдя 4 раза тест, ответить на все вопросы правильно.
Практика: Итак, парсер… Как я представил себе структуру.
<?
//Подключение к базе
//Авторизация и переход в тестирование
//Тестирование.
$content = file_get_contents("http://bla-bla");
$content = mb_convert_encoding($content, "cp1251", "utf-8");
//Номер вопроса
$Nomer=$_GET['vopros'];
//Ответы
$otvet1= strstr($content, "<div>Вопрос1</div><a http://bla-bla");
$otvet2= strstr($content, "<div>Вопрос2</div><a http://bla-bla");
$otvet3= strstr($content, "<div>Вопрос3</div><a http://bla-bla");
$otvet4= strstr($content, "<div>Вопрос4</div><a http://bla-bla");
$fuck = strstr($content, "Не правильно");
if ($fuck!="")
{echo 'не правильно';
//Записываем в базу номер вопроса, варианты
ответов, и выбранный нами не правильный ответ}
else
{//Записываем в базу номер вопроса, варианты
ответов, и выбранный нами правильный ответ}
//Переходим к следующему вопросу
$content = mb_convert_encoding($content, "utf-8", "cp1251");
echo $content;
?>
Поправьте пожалуйста меня, знаю что говно код)))
А вопросы собственно вот в чем:
1) Каким образом можно зарегаться на сайте через парсер? Направьте по ссылкам или лучше код покажите, у кого есть)))
2) Каким образом можно эмулировать нажатие кнопки submit все в той же форме авторизации? С ссылками то понятно, как по ним переходить. В хедер или мету с задержкой.
3) Ну и собственно, а в правильном ли я направлении иду?))
Конечно изъетая тема, но парсера до этого момента я не писал)))