katenka141

ege.org.ru ege.net.ru

Статус

Активный

Последние сообщения katenka141

Расширения PHP → Как быстро и тихо спарсить каталог сайта? • 15 мая 2017 г. 20:13

Он может где угодно лежать, посмотри robots.txt, может повезет. Но вообще я бы не парсил сихронно, надо асинхронно парсить сайтик. Например через Scrapy (python). Суть в том, чтобы сделать одновркменно сотни запросов на страницы и коллбеками обрабатывать ответы, тогда не особо важно сколько ген...

Он может где угодно лежать, посмотри robots.txt, может повезет.

Но вообще я бы не парсил сихронно, надо асинхронно парсить сайтик. Например через Scrapy (python). Суть в том, чтобы сделать одновркменно сотни запросов на страницы и коллбеками обрабатывать ответы, тогда не особо важно сколько генерирется страница