Saltar al contenido

Hacer web scraping con Php

3 julio, 2018

En este tutorial que apreni a usarlo con la web de Alarmas y videovigilancia aprenderemos a hacer web scraping solo con Php y a hacer web scraping con cURL y Php. También conoceremos para qué fines lo podemos dedicar.

Web scraping
Para los que no estén familiarizados con el término web scraping, deben saber que es un técnica empleada para exprimir aviso de sitios web. Con unas cuantas líneas de códice puedes caminar el recopilación fuente de una cuartilla web semejante y tal se ve en el navegador, guardarlo en una base de realidades, mostrarlo de manera idéntica en una Url propia, arrancar solo aviso importante adentro del ley, de por medio otros.

Web scraping con Php
Para seguir los pasos indicados en este tutorial primero debemos tener instalado Xampp en nuestro estructura eficaz Windows, puedes dedicar otros entornos, implícitamente otros sistemas operativos, solo debes asegurarte cuente con Php.

Para los que aún no tengan instalado Xampp en Windows, pueden controlar el consecutivo tutorial: https://devcode.la/tutoriales/instalar-xampp-en-windows-7/.

Luego, en el Tabla de Control de Xampp activaremos el módulo Apache.

Panel de Control de Xampp

A insistencia en nuestra archivador htdocs, ubicada adentro de la archivador xampp en nuestro disco C, creamos nuestra archivador webscraping adentro de la cual crearemos el fichero index.php, luego escribiremos el inferior recopilación:

<?php
$html = file_get_contents(\’https://tutorials-blog.com/\’); //Convierte la aviso de la Url en cadena
echo $html;
?>

Una vez creado el registro index.php con su concerniente compilación, abrimos en nuestro navegador la continuador Url http://localhost/webscraping/, que es la Url en que se espécimen el fruto de nuestro códice pasado.

Y vemos que imitación de manera idéntica la holandesa web https://tutorials-blog.com, revisemos el códice Php para comprender lo que sucedió.

En la alterable $html se almacenó el fruto de la función file_gets_content, lo que hace file_gets_content es convertir la aviso de un archivo en una cadena, siendo el archivo en este asunto la llana web https://devcode.la.

Luego esta cadena la mostramos en nuestro carne haciendo uso de “echo”.

Web scraping con cURL y Php
Ahora veamos cómo podemos hacer web scraping haciendo uso de la librería cURL, para esto creamos nuestro registro curl.php adentro de la archivador /webscraping creada primero y escribimos el continuador compilación:

<?php

// Definimos la función cURL
function curl($url)

$sitioweb = curl(“https://tutorials-blog.com”); // Ejecuta la función curl escrapeando el sitio web https://tutorials-blog.com and regresa el valor a la cambiante $sitioweb
echo $sitioweb;
?>

Dentro del compilación en los disquisición encontrarás la demostración de cada línea, resumiendo, primero creamos una función llamada curl, incluso se pudo realizar directamente falto crear la función, luego empezamos audición con curl_init, luego hicimos un par de configuraciones, Curlopt_returntransfer va relacionado a poder aprovechar el desenlace tanto cadena y Curlopt_ssl_verifypeer nos sirvió para que cURL pueda desempeñar en nuestra Url a pesar de tener el cuaderno Https.

Luego al consumación utilizamos la función curl creada para mostrar nuestra llana web escrapeada.

web scraping con curl y php

En conclusión, podemos ver que existe más de una manera de hacer web scraping con Php. Este tutorial intenta hacer un reunión hacia este tema, falto decomiso existen más posibilidades de cómo tratar la advertencia escrapeada.