EspañolDeutschFrançaisItalianoPortuguêsРусскийΕλληνικά日本語中文(简体)हिन्दी; हिंदीالعربية
Configura come lingua predefinita
Domande di PF - Cose da fare

Come ottenere il contenuto di un sito Web in PHP. Ottieni il tuo Crawler.

Programmazione PHP  
 
Come ottenere il contenuto di un sito Web in PHP. Ottieni il tuo Crawler.

Forse hanno bisogno mai ottenere il contenuto, o parte di esso, un sito Web, Se si desidera raccogliere dati o per qualsiasi tipo di monitoraggio di una cosa, o semplicemente perché si desidera creare il proprio crawler, quali siti di scansione, come fare il bot Google, Bing, Yahoo,…

C'è una biblioteca molto utile che ci aiuta a svolgere questo compito in PHP. Il suo nome è Ricciolo e ti permette di connetterti ad altri ambienti utilizzando protocolli diversi. Utilizzando cURL, ci accingiamo a vedere come è possibile ottenere il contenuto di un sito Web in PHP.

Come ottenere il contenuto di un sito Web in PHP. Ottieni il tuo Crawler - Immagine 1 - Professor-falken.com

Come ottenere il contenuto di una pagina Web utilizzando la libreria PHP cURL

 

Utilizzando la libreria cURL, È possibile ottenere il contenuto sito Web completo. Una volta che hai il tuo contenuto, È possibile eseguire qualsiasi ricerca su di esso. Come un esempio, nel codice in PHP che vi mostriamo qui, Abbiamo una funzione che ottiene il contenuto di un sito Web cui indirizzo URL viene passato come parametro, e restituisce una stringa che rappresenta la pagina web.

Una volta che hai il contenuto web in una stringa, Una possibilità è parsearlo e trasformarlo in un oggetto XML o DOM, tanta più facile gestione.

Un esempio di questo è utilizzando la classe DOMDocument. Utilizzo di questa classe si può analizzare la stringa ottenuta in precedenza e trasformarlo in un oggetto XML o i suoi rispettivo albero DOM. Un esempio di questo è la seguente:

In questo codice, Possiamo vedere come, Innanzitutto, Creiamo un DOMDocument-documento, che successivamente caricare il contenuto della variabile $catena, che è quella ottenuta in precedenza funzione getContenidoWeb.

In questo modo è possibile ottenere il contenuto di una pagina Web utilizzando PHP e successivamente convertirla in XML, o suo rispettivo albero DOM per essere in grado di gestire meglio.

 

Entrare nel canale di Telegramma

Lasciaci un commento o accedere allaCose da fare
Condividerlo Share on FacebookTweet about this on TwitterShare on Google+Pin on PinterestShare on RedditShare on VKShare on StumbleUponShare on TumblrShare on LinkedInEmail this to someonePrint this page

Articoli correlati

Lasciare una risposta