
Möglicherweise haben benötigt immer die Inhalte zu erhalten, oder ein Teil davon, ein Web, ob die Daten gesammelt oder für jede Art von Überwachung über etwas, oder nur weil Sie Ihre eigenen erstellen möchten Crawler, die Scan-websites, ebenso wie die Bots Google, Bing, Yahoo,…
Es gibt eine sehr nützliche Bibliothek, die uns hilft, diese Aufgabe in PHP. Sein Name ist Locken und es können Sie Herstellen einer Verbindung mit anderen Umgebungen mit verschiedenen Protokollen. Mit cURL, werden wir sehen, wie Sie den Inhalt einer Seite in PHP.
Wie man den Inhalt einer Webseite unter Verwendung der PHP-Bibliothek cURL
Mithilfe der Bibliothek cURL, Kann man die Inhalt vollen Web Site. Sobald Sie Ihre Inhalte haben, Sie können darauf Suche durchführen.. Als Beispiel, im Code in PHP dass wir Ihnen hier zeigen, Wir haben eine Funktion, die den Inhalt einer Website ruft deren URL-Adresse als Parameter übergeben wird, und gibt eine Zeichenfolge, die die Webseite darstellt..
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | function getContenidoWeb($url){ $ch = curl_init(); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_URL, $url); $data = curl_exec($ch); curl_close($ch); return $data; } //Ejemplo de uso $cadena = getContenidoWeb('http://www.web.com'); |
Sobald Sie haben die Web-Inhalte in einer Zeichenfolge, Eine Möglichkeit ist parsearlo und schalten Sie ihn in ein Objekt XML o DOM, so viel einfachere Handhabung.
Ein Beispiel hierfür ist die Klasse verwenden. DOMDocument. Mithilfe dieser Klasse können analysieren Sie die Zeichenfolge, die Sie zuvor erworben und verwandeln es in ein XML-Objekt oder seine jeweiligen DOM-Struktur. Ein Beispiel hierfür ist die folgende:
1 2 | $doc = new DOMDocument(); $doc->loadHTML($cadena); |
In diesem code, Wir sehen uns als, Zuallererst, Wir erstellen ein DOMDocument-Dokument, die anschließend den Inhalt der Variablen laden $Kette, Das ist die zuvor erhaltenen Funktion getContenidoWeb.
Auf diese Weise können Sie erhalten den Inhalt einer Webseite mit PHP und später wandeln es in XML und ihre jeweiligen DOM-Struktur, die es besser verwalten zu können.
