
ãŠãらã今ã¾ã§ã‚³ãƒ³ãƒ†ãƒ³ãƒ„ã‚’å–å¾—ã™ã‚‹å¿…è¦, ãれã®å…¨ä½“ã¾ãŸã¯ä¸€éƒ¨, Web, データをåŽé›†ã™ã‚‹ã‹ã©ã†ã‹ã€ã¾ãŸã¯ä»»æ„ã®ç¨®é¡žã® 監視 何ã‹ã«ã¤ã„ã¦, ã¾ãŸã¯ã‚ãªãŸè‡ªèº«ã‚’作æˆã™ã‚‹ç†ç”± クãƒãƒ¼ãƒ©ãƒ¼, スã‚ャン サイト, 行ã†ã¨ã€ ボット Google, ビング, ヤフー,…
PHP ã§ã“ã®ã‚¿ã‚¹ã‚¯ã‚’実行ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™éžå¸¸ã«ä¾¿åˆ©ãªãƒ©ã‚¤ãƒ–ラリãŒã‚りã¾ã™ã€‚. å½¼ã®åå‰ã¯ カール ç•°ãªã‚‹ãƒ—ãƒãƒˆã‚³ãƒ«ã‚’使用ã—ã¦ä»–ã®ç’°å¢ƒã«æŽ¥ç¶šã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€. カールを使用ã—ã¦ã€æˆ‘々 ã¯ã€PHP ã® web サイトã®ã‚³ãƒ³ãƒ†ãƒ³ãƒ„ã‚’å–å¾—ã™ã‚‹æ–¹æ³•ã‚’å‚ç…§ã—ã¦ãã ã•ã„ã—ã¦ã„ã¾ã™ã€‚.
カール㮠PHP ライブラリを使用ã—㦠Web ページã®å†…容をå–å¾—ã™ã‚‹æ–¹æ³•
CURL ライブラリを使用ã—ã¦ãã ã•ã„。, ã‚ãªãŸãŒå¾—ã‚‹ã“ã¨ãŒã§ãる〠コンテンツ 完全ãªã‚¦ã‚§ãƒ–サイト. ã‚ãªãŸã®ã‚³ãƒ³ãƒ†ãƒ³ãƒ„を作æˆã—ãŸã‚‰, ä»»æ„ã®æ¤œç´¢ã‚’実行ã§ãã¾ã™ã€‚. 例ã¨ã—ã¦, コード㧠PHP ã“ã“ã§ã¯ã€è¡¨ç¤º, 我々 ã¯ãƒ‘ラメーターã¨ã—ã¦æ¸¡ã•れる URL アドレスをæŒã¤ web サイトã®ã‚³ãƒ³ãƒ†ãƒ³ãƒ„ã‚’å–å¾—ã™ã‚‹æ©Ÿèƒ½ã‚’æŒã£ã¦ã„ã¾ã™ã€‚, ãŠã‚ˆã³ web ãƒšãƒ¼ã‚¸ã‚’è¡¨ã™æ–‡å—列を返ã—ã¾ã™.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | function getContenidoWeb($url){ $ch = curl_init(); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_URL, $url); $data = curl_exec($ch); curl_close($ch); return $data; } //Ejemplo de uso $cadena = getContenidoWeb('http://www.web.com'); |
一度文å—列㫠web コンテンツãŒã‚りã¾ã™ã€‚, 1 ã¤ã®å¯èƒ½æ€§ã¯ã€ã—ã¾ã™ã€‚ parsearlo オブジェクトã«ãれを回ã™ã¨ XML o DOM, ãã‚“ãªã«ç°¡å˜ã«å‡¦ç†.
ã“ã®ä¾‹ã¯ã€ã‚¯ãƒ©ã‚¹ã‚’使用ã—ã¦ãã ã•ã„。 DOMDocument. ã“ã®ã‚¯ãƒ©ã‚¹ã‚’使用ã—ã¦ä»¥å‰ã«å–å¾—ã—ãŸæ–‡å—列を解æžã—ã€ãã®ãれãžã‚Œã® DOM ツリーã¾ãŸã¯ XML オブジェクトã«ãれを回ã™ã“ã¨ãŒã§ãã¾ã™ã€‚. ã“れã®ä¾‹ã¯æ¬¡ã®ã¨ãŠã‚Š:
1 2 | $doc = new DOMDocument(); $doc->loadHTML($cadena); |
ã“ã®ã‚³ãƒ¼ãƒ‰ã§, 我々 ã¯ã€ã‚’見るã“ã¨ãŒã§ãã¾ã™ã€‚, 最åˆã§ã™, DOMDocument ドã‚ュメントを作æˆã—ã¾ã™ã€‚, 後ã«å¤‰æ•°ã®å†…容をãƒãƒ¼ãƒ‰ã—ã¾ã™ã€‚ $ãƒã‚§ãƒ¼ãƒ³, ãれ㯠1 ã¤ã®é–¢æ•°ã¯ä»¥å‰ã«å–å¾— getContenidoWeb.
ã“ã®ã‚ˆã†ã« PHP を使用ã—㦠Web ページã®å†…容をå–å¾—ã€å¾Œã« XMLã€ã¾ãŸã¯ãれã®ã‚ˆã‚Šè‰¯ã„管ç†ã§ãるよã†ã«ã€ãれãžã‚Œã® DOM ツリーを変æ›ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚.
