
Возможно, необходимо когда-нибудь содержание, или его часть, Веб, нужно ли собирать данные или для любого из мониторинг о чем-то, или просто потому, что вы хотите создать свой собственный гусеничные, какие сайты сканирования, как сделать Боты Google, Бинг, Yahoo,…
Есть очень полезная библиотека, которая помогает нам выполнять эту задачу в PHP. Его имя Завиток и это позволяет вам подключаться к другим средам, с использованием различных протоколов. Использование cURL, мы будем видеть, как вы можете получить содержание веб-сайта на PHP.
Как получить содержимое веб-страницы с использованием библиотеки PHP cURL
Использование cURL библиотеки, Вы можете получить содержание полный веб-сайт. Как только вы имеете ваше содержание, Любой поиск можно выполнять на нем. В качестве примера, в коде в PHP что мы покажем вам здесь, У нас есть функция, которая возвращает содержимое веб-сайта, чей URL-адрес передается в качестве параметра, и возвращает строку, представляющую веб-страницы.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | function getContenidoWeb($url){ $ch = curl_init(); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_URL, $url); $data = curl_exec($ch); curl_close($ch); return $data; } //Ejemplo de uso $cadena = getContenidoWeb('http://www.web.com'); |
Как только у вас есть веб-содержимое в строку, Одна из возможностей parsearlo и превратить его в объект XML o ДОМ, так много проще обработка.
Примером этого использование класса DOMDocument. С помощью этого класса можно разобрать строку, полученный ранее и превратить его в объект XML или его соответствующих DOM-дерево. В качестве примера заключается в следующем:
1 2 | $doc = new DOMDocument(); $doc->loadHTML($cadena); |
В этом коде, Мы видим, как, Прежде всего, Мы создаем документ DOMDocument, которая впоследствии загрузить содержимое переменной $цепь, Это один получил ранее функции getContenidoWeb.
Таким образом вы можете получить содержимое веб-страницы с использованием PHP и затем преобразовать XML, или его соответствующих дерево DOM, чтобы иметь возможность управлять лучше.
