Форум → Программирование → PHP для идиотов → Получить содержимое сетевой папки
Получить содержимое сетевой папки
Страницы: ← Следующая страница →
-
Стоит задача - перебор всех файлов определенного интернет-ресурса (скажем, для индексации). Для этого пользователь вводит адрес начальной страницы (скажем, http://mail.ru), а программа должна:
1. Открыть каталог
2. Взять первый файл
3. Открыть и прочитать его
4. Перейти к следующему и т.д. (п. 3-4)
Набросал такой уод, но видимо, это не то:
<?php
$_POST['url']="http://mail.ru";
var_dump($_POST['url']);
$cd=chdir($_POST['url']);
$od=opendir($_POST['url']);
$rd=readdir($_POST['url']);
var_dump($rd);
?> -
Апрель 25, 2008, 11:12 д.п., спустя 26 минут 48 секунд
<?php
$_POST['url']="http://mail.ru";
var_dump($_POST['url']);
$cd=chdir($_POST['url']);
$od=opendir($_POST['url']);
$rd=readdir($_POST['url']);
var_dump($rd);
?>
О_о
с чего вы взяли, что это директории?все умрут, а я изумруд -
Апрель 25, 2008, 11:48 д.п., спустя 35 минут 32 секунды
Я имел ввиду сетевые директории (на другом сервере). То есть на mail.ru есть же файл индекс.хтмл, а также другие файлы и директории. Вот их-то и надо "поддеть". Получить список директорий на сервере, перейти в них и пооткрывать файлы. В итоге надо найти и перебрать все файлы на сервере. Поисковики же это как-то делают… Это возможно? -
Апрель 25, 2008, 11:51 д.п., спустя 3 минуты 20 секунд
они не открывают никакие директории, их вообще может не быть!
Поисковики запрашивают документ по определенному URL, получают его, парсят ссылки и идут дальше по ним…все умрут, а я изумруд -
Апрель 25, 2008, 12:01 п.п., спустя 9 минут 30 секунд
А как, не подскажете? Примерчик. Или хотя бы что почитать (доступное :)) по вопросу работы с файлами стороннего сервера? -
Апрель 25, 2008, 12:08 п.п., спустя 6 минут 47 секунд
http://pyha.ru/forum/topic/252.0 так получаем страницы
вытаскиваем ссылки и идем дальше по ним
и фактически делаем вот это http://pyha.ru/forum/topic/223.30все умрут, а я изумруд -
Апрель 25, 2008, 1:11 п.п., спустя 1 час 3 минуты 31 секунду
по вопросу работы с файлами стороннего сервера?
ЭТО НЕВОЗМОЖНО.
Читай вот это до полного просветления:
http://www.phpfaq.ru/paths -
Апрель 25, 2008, 1:20 п.п., спустя 8 минут 58 секунд
Прочитал, вроде понял даже.Самый простой способ - это использование file_get_contents()
А с возвращаемым содержимым можно потом работать как с текстом (это ведь хтмл?), то есть применять регулярные выражения и прочее?
И про парсинг ссылок. Мы просто через те же регуляры отбираем ссылки?
ЗЫ: Про баттл тоже прикольно (и полезно), только не понял, где можно ознакомиться с готовыми решениями, которые сделали участники форума? -
Апрель 25, 2008, 1:21 п.п., спустя 1 минуту 18 секунд
Прочитал, вроде понял даже.Самый простой способ - это использование file_get_contents()
А с возвращаемым содержимым можно потом работать как с текстом (это ведь хтмл?), то есть применять регулярные выражения и прочее?
да
И про парсинг ссылок. Мы просто через те же регуляры отбираем ссылки?
тоже да
ЗЫ: Про баттл тоже прикольно (и полезно), только не понял, где можно ознакомиться с готовыми решениями, которые сделали участники форума?
завтра свой выложувсе умрут, а я изумруд -
Апрель 25, 2008, 1:24 п.п., спустя 3 минуты 3 секунды
Прочитал, вроде понял даже.Самый простой способ - это использование file_get_contents()
А с возвращаемым содержимым можно потом работать как с текстом (это ведь хтмл?), то есть применять регулярные выражения и прочее?
Да, ты понял правильно.
Просто надо еще понимать, что не смотря на слово file в названии file_get_contents, при скармливании ей URI никакого файла не открывается, а посылается http запрос. Разработчики PHP, сделав ряд функций слишком универсальными, посеяли хаос в мозгах многих начинающих програмистов. ))) -
Апрель 25, 2008, 1:26 п.п., спустя 1 минуту 35 секунд
md5: завтра свой выложу
А остальные? :) Буду ждать…
И еще вопросик - я не очень дружу с регулярными выражениями, не подскажете масочку для урлов? -
Апрель 25, 2008, 1:26 п.п., спустя 12 секунд
тебе книги писать пора )))
Прочитал, вроде понял даже.Самый простой способ - это использование file_get_contents()
А с возвращаемым содержимым можно потом работать как с текстом (это ведь хтмл?), то есть применять регулярные выражения и прочее?
Да, ты понял правильно.
Просто надо еще понимать, что не смотря на слово file в названии file_get_contents, при скармливании ей URI никакого файла не открывается, а посылается http запрос. Разработчики PHP, сделав ряд функций слишком универсальными, посеяли хаос в мозгах многих начинающих програмистов. )))все умрут, а я изумруд -
Апрель 25, 2008, 1:28 п.п., спустя 1 минуту 28 секунд
остальные умерли
md5: завтра свой выложу
А остальные? :) Буду ждать…
И еще вопросик - я не очень дружу с регулярными выражениями, не подскажете масочку для урлов?
масочка для урлов называется регулярное выражение и будет выложена там же
а пока — http://pyha.ru/forum/topic/19.0
и очень полезно — http://pyha.ru/forum/topic/181.0все умрут, а я изумруд -
Апрель 25, 2008, 1:28 п.п., спустя 28 секунд
Прочитал, вроде понял даже.Самый простой способ - это использование file_get_contents()
А с возвращаемым содержимым можно потом работать как с текстом (это ведь хтмл?), то есть применять регулярные выражения и прочее?
Да, ты понял правильно.
Просто надо еще понимать, что не смотря на слово file в названии file_get_contents, при скармливании ей URI никакого файла не открывается, а посылается http запрос. Разработчики PHP, сделав ряд функций слишком универсальными, посеяли хаос в мозгах многих начинающих програмистов. )))
Спасибо за совет. прочитал Вашу ссылку - интересно - будем копать глубже, уж очень хочется действительно понять всек тонкости PHP. Язык очень простой (по сравнению с классическими языками ООП) и это увлекает. При этом здесь масса возможностей. Классно! -
Страницы: ← Следующая страница →
Пожалуйста, авторизуйтесь, чтобы написать комментарий!