EspañolDeutschFrançaisItalianoPortuguêsРусскийΕλληνικά日本語中文(简体)हिन्दी; हिंदीالعربية
设置为默认语言
PF 问题 - 论坛

如何在 PHP 中获取网站的内容. 让你自己爬网程序.

PHP 编程
如何在 PHP 中获取网站的内容. 让你自己爬网程序.

可能有需要不断获得的内容, 或它的一部分, Web, 是否收集数据或任何种类的 监测 对某事, 或只是因为你想要创建您自己 爬网程序, 哪些扫描网站, 像那样 机器人 谷歌, 必应, 雅虎,…

有是一个非常有用的库,帮助我们进行这项工作在 PHP 中. 他的名字是 卷毛 它允许您连接到其他环境中使用不同的协议和. 使用 cURL,我们要看看,你如何能 PHP 网站的内容.

如何在 PHP 中获取网站的内容. 让你自己爬网程序 - 图像 1 - 教授-falken.com

如何获得使用 cURL PHP 库 Web 页的内容

 

使用 cURL 库, 你可以得到 内容 完整的网站. 一旦你有了你的内容, 你可以对它执行任何搜索. 作为一个例子, en el código en PHP 我们在这里向您展示, 我们有一个函数,获取网站的 URL 地址作为参数传递的内容, 返回一个字符串,表示 web 页.

你曾经在一个字符串中的 web 内容, 一种可能性是 parsearlo 并把它变成一个对象 XML o DOM, 这么多的更容易处理.

一个这样的例子使用类 DOMDocument. 使用此类可以解析你以前获得的字符串并把它变成一个 XML 对象或其各自的 DOM 树. 一个这样的例子是以下:

在这段代码, 我们可以看到作为, 首先, creamos un documento DOMDocument, en el que posteriormente cargamos el contenido de la variable $链, que es la obtenida anteriormente de la función getContenidoWeb.

以这种方式你可以获得使用 PHP Web 页的内容和以后将转换为 XML,或其各自的 DOM 树,以便能够更好地管理.

 

加入的频道 电报

我们的留言或输入到论坛
分享它 Share on FacebookTweet about this on TwitterShare on Google+Pin on PinterestShare on RedditShare on VKShare on StumbleUponShare on TumblrShare on LinkedInEmail this to someonePrint this page

相关的文章

标签:

留言

您的电子邮件地址将不会发布. 标记必填的字段 *