如何在 PHP 中获取网站的内容

可能有需要不断获得的内容, 或它的一部分, Web, 是否收集数据或任何种类的监测对某事, 或只是因为你想要创建您自己 爬网程序, 哪些扫描网站, 像那样 机器人 谷歌, 必应, 雅虎,…

有是一个非常有用的库，帮助我们进行这项工作在 PHP 中. 他的名字是卷毛它允许您连接到其他环境中使用不同的协议和. 使用 cURL，我们要看看，你如何能 PHP 网站的内容.

如何在 PHP 中获取网站的内容. 让你自己爬网程序 - 图像 1 - 教授-falken.com

如何获得使用 cURL PHP 库 Web 页的内容

使用 cURL 库, 你可以得到内容完整的网站. 一旦你有了你的内容, 你可以对它执行任何搜索. 作为一个例子, 在代码中 PHP 我们在这里向您展示, 我们有一个函数，获取网站的 URL 地址作为参数传递的内容, 返回一个字符串，表示 web 页.

function getContenidoWeb($url){

	$ch = curl_init();

	curl_setopt($ch, CURLOPT_HEADER, 0);
	curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
	curl_setopt($ch, CURLOPT_URL, $url);

	$data = curl_exec($ch);
	
	curl_close($ch);

	return $data; 
}

//Ejemplo de uso

$cadena = getContenidoWeb('http://www.web.com');

function getContenidoWeb($url){

$ch = curl_init();

curl_setopt($ch, CURLOPT_HEADER, 0);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_URL, $url);

$data = curl_exec($ch);

curl_close($ch);

return $data;

}

//Ejemplo de uso

$cadena = getContenidoWeb('http://www.web.com');

你曾经在一个字符串中的 web 内容, 一种可能性是 parsearlo 并把它变成一个对象 XML o DOM, 这么多的更容易处理.

一个这样的例子使用类 DOMDocument. 使用此类可以解析你以前获得的字符串并把它变成一个 XML 对象或其各自的 DOM 树. 一个这样的例子是以下:

$doc = new DOMDocument();
$doc->loadHTML($cadena);

1 2	$doc = new DOMDocument(); $doc->loadHTML($cadena);

在这段代码, 我们可以看到作为, 首先, 我们创建一个 DOMDocument 文档, 而随后加载变量的内容 $链, 这是一个以前获得功能 getContenidoWeb.

以这种方式你可以获得使用 PHP Web 页的内容和以后将转换为 XML，或其各自的 DOM 树，以便能够更好地管理.

我们的留言或输入到论坛

标签: web 页

教授 Falken - 看到和感受到的技术，围绕着你

如何在 PHP 中获取网站的内容. 让你自己爬网程序.

如何获得使用 cURL PHP 库 Web 页的内容

相关的文章