EspañolDeutschFrançaisItalianoPortuguêsРусскийΕλληνικά日本語中文(简体)हिन्दी; हिंदीالعربية
设置为默认语言
PF 问题 - 论坛

如何在 PHP 中获取网站的内容. 让你自己爬网程序.

PHP 编程  
 
如何在 PHP 中获取网站的内容. 让你自己爬网程序.

可能有需要不断获得的内容, 或它的一部分, Web, 是否收集数据或任何种类的 监测 对某事, 或只是因为你想要创建您自己 爬网程序, 哪些扫描网站, 像那样 机器人 谷歌, 必应, 雅虎,…

有是一个非常有用的库,帮助我们进行这项工作在 PHP 中. 他的名字是 卷毛 它允许您连接到其他环境中使用不同的协议和. 使用 cURL,我们要看看,你如何能 PHP 网站的内容.

如何在 PHP 中获取网站的内容. 让你自己爬网程序 - 图像 1 - 教授-falken.com

如何获得使用 cURL PHP 库 Web 页的内容

 

使用 cURL 库, 你可以得到 内容 完整的网站. 一旦你有了你的内容, 你可以对它执行任何搜索. 作为一个例子, 在代码中 PHP 我们在这里向您展示, 我们有一个函数,获取网站的 URL 地址作为参数传递的内容, 返回一个字符串,表示 web 页.

你曾经在一个字符串中的 web 内容, 一种可能性是 parsearlo 并把它变成一个对象 XML o DOM, 这么多的更容易处理.

一个这样的例子使用类 DOMDocument. 使用此类可以解析你以前获得的字符串并把它变成一个 XML 对象或其各自的 DOM 树. 一个这样的例子是以下:

在这段代码, 我们可以看到作为, 首先, 我们创建一个 DOMDocument 文档, 而随后加载变量的内容 $链, 这是一个以前获得功能 getContenidoWeb.

以这种方式你可以获得使用 PHP Web 页的内容和以后将转换为 XML,或其各自的 DOM 树,以便能够更好地管理.

 

我们的留言或输入到论坛
Share on Facebook Tweet about this on Twitter Share on Google+ Pin on Pinterest Share on Reddit Share on VK Share on StumbleUpon Share on Tumblr Share on LinkedIn Email this to someone Print this page
标签:

相关的文章