
可能有需要不断获得的内容, 或它的一部分, Web, 是否收集数据或任何种类的 监测 对某事, 或只是因为你想要创建您自己 爬网程序, 哪些扫描网站, 像那样 机器人 谷歌, 必应, 雅虎,…
有是一个非常有用的库,帮助我们进行这项工作在 PHP 中. 他的名字是 卷毛 它允许您连接到其他环境中使用不同的协议和. 使用 cURL,我们要看看,你如何能 PHP 网站的内容.
如何获得使用 cURL PHP 库 Web 页的内容
使用 cURL 库, 你可以得到 内容 完整的网站. 一旦你有了你的内容, 你可以对它执行任何搜索. 作为一个例子, 在代码中 PHP 我们在这里向您展示, 我们有一个函数,获取网站的 URL 地址作为参数传递的内容, 返回一个字符串,表示 web 页.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | function getContenidoWeb($url){ $ch = curl_init(); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_URL, $url); $data = curl_exec($ch); curl_close($ch); return $data; } //Ejemplo de uso $cadena = getContenidoWeb('http://www.web.com'); |
你曾经在一个字符串中的 web 内容, 一种可能性是 parsearlo 并把它变成一个对象 XML o DOM, 这么多的更容易处理.
一个这样的例子使用类 DOMDocument. 使用此类可以解析你以前获得的字符串并把它变成一个 XML 对象或其各自的 DOM 树. 一个这样的例子是以下:
1 2 | $doc = new DOMDocument(); $doc->loadHTML($cadena); |
在这段代码, 我们可以看到作为, 首先, 我们创建一个 DOMDocument 文档, 而随后加载变量的内容 $链, 这是一个以前获得功能 getContenidoWeb.
以这种方式你可以获得使用 PHP Web 页的内容和以后将转换为 XML,或其各自的 DOM 树,以便能够更好地管理.

我们的留言或输入到论坛