lunes, 17 de febrero de 2014

¿Sabes qué es el Web Scraping?

Es una forma de robar datos o de realizar plagio, por lo que hoy en día el Web Scraping o simplemente Scraping, es considerada como una de las amenazas más fuertes para los negocios que cuentan con páginas en Internet.

Es una técnica usada por los programadores para extraer y recolectar contenidos que afectan directamente la competitividad de un negocio. Evidentemente no es una acción legal, ya que están plagiando contenidos que afectan a los negocios, llegando a provocar incluso la pérdida de clientes.

El concepto de Web Scraping incluye desde cuando hacemos manualmente “copy-paste” (copiar y pegar) para una tarea de la escuela o proyecto de trabajo, robándonos información sin reconocer el trabajo o autoría de otras personas; hasta ingresar a la base de datos de las empresas y obtener, tablas, formatos o contenidos muy específicos para perjudicarlas en sus negocios.

El asunto de los contenidos duplicados, plagiados y robados va desde las implicaciones legales al violar las leyes de derechos de autor y propiedad intelectual, el desprestigio y la mala reputación online de la marca o empresa, e incluso penalizaciones de Google, que al encontrar contenidos duplicados los elimina de los resultados de su buscador.

Para evitar ser víctima del Web Scraping es aconsejable utilizar cookies o Javascript para verificar que el visitante es un navegador web; introducir códigos Captchas para saber si el visitante es humano, y bloquear la dirección IP de los competidores para que nunca caigan en tu página. Las empresas grandes se protegen de los “scrapers” a través de la propiedad intelectual.



No hay comentarios:

Publicar un comentario