Saltar al contenido
Codifíca.me | Desarrollo web | Programación

¿Cuánta gente ve mi blog? Muchas menos de la que crees

15 febrero, 2015

Sin robots no bots

Cuando se tiene un sitio web, mirar las estadísticas es una práctica común, conocer de dónde provienen las visitas, en que posiciones estás en Google, ver si bajan o suben las visitas cuando publicas un artículo… ¿Pero qué me dirías si te digo que la mayoría de las visitas de esas cifras son falsas? O mejor aun, no son generadas por personas.

Esta semana invité a Jorge Enrique Aguayo, SEO peruano y autor de “Un blog de link-building”, a comentarnos sobre una de aquellas cosas que casi todos los bloggers deberían saber, pero que pocos saben realmente: que las estadísticas de tu sitio web en realidad no son lo que parecen ser. Aquí les dejo con él.

Hola:

Gracias por entrar al blog… ¡y por la invitación también! En efecto, una de las cosas que poca gente sabe sobre el mundo de la Internet es que los software de estadísticas no nos están mostrando cifras reales. Enseguida les cuento por qué pasa esto y cómo, si desean, pueden sincerar las cifras de sus reportes de estadísticas.

Cómo funcionan los contadores de visitas

En general, los contadores de visitas funcionan usando una de dos maneras de captar el tráfico que recibe una página web: o bien utilizan un script (escrito casi siempre en Javascript), o bien utilizan una imagen invisible. El mecanismo es simple: cada vez que alguien visite una página donde el contador está instalado, el navegador del visitante hará una solicitud de “descarga de imagen” o de “ejecución del script“. El software contará cuántas veces ocurre esto y las irá sumando (y armando tablas de estadísticas con todos esos conteos). Así, un administrador puede revisar los reportes y hacerse una idea clara de cuánta gente está entrando a la página en realidad.

Todos los software y servicios de contador para web funcionan basados en este principio. Y para hacer más adecuado el conteo, la mayoría utiliza hoy ambos métodos: por un lado instalan el script y por el otro utilizan una etiqueta “noscript” para incluir la imagen invisible en caso alguien esté navegando por la web con Javascript desactivado.

Aquí tienes un ejemplo de código, extraído de StatCounter.com:

<!– Start of StatCounter Code for Default Guide –>

<script type=”text/javascript”>

var sc_project=XXXXXXX; var sc_invisible=1; var sc_security=”XXXXXXX”; var scJsHost = ((“https:” == document.location.protocol) ? “https://secure.” : “http://www.”); document.write(“<sc”+”ript type=’text/javascript’ src='” + scJsHost+ “statcounter.com/counter/counter.js’></”+”script>”);</script>

<noscript><div class=”statcounter”><a title=”hits counter” href=”http://statcounter.com/” target=”_blank”><img class=”statcounter” src=”http://c.statcounter.com/XXXXXXX/0/XXXXXXX/1/” alt=”hits counter”></a></div></noscript>

<!– End of StatCounter Code for Default Guide →

¿Ves cómo hay una sección “script” y una “noscript” en el código? Bien, es así como se implementan en casi todos los casos.

De dónde salen las visitas falsas

El sistema de conteo tiene un principio muy simple y, en teoría tiene todo para funcionar extraordinariamente bien. Solo tiene un error de concepto: asume que todas las peticiones de descarga de imagen o de ejecución de script que el contador sumará para sus reportes provienen de la computadora de un ser humano.

La realidad, lamentablemente, es otra: alrededor de sesenta por ciento (sí, 60 %) del tráfico de Internet es tráfico generado por robots, pero también son contadas como visitas.

Por lo tanto, te ve mucha menos gente de la que crees.

Demuéstramelo

Colocar una afirmación así en un blog es algo que no debería hacerse si no puede demostrarse, ¿cierto? Bien, demostraré que lo que estoy afirmando es cierto de dos maneras distintas:

Por un lado, el año pasado Google Analytics incluyó la opción de ver las estadísticas sustrayendo las visitas de robots del conteo final. Si usas Google Analytics, pruébala tú mismo entrando a tu cuenta y luego a la sección Administrador > Ver configuración. Marca la casilla “Excluye todas las visitas de robots y de arañas conocidos.” y luego vuelve a ver tus cifras. Te sorprenderás con el cambio. Algunos hasta podrían deprimirse.

Por el otro, puedo mostrar como prueba el fortísimo descenso en mis propias estadísticas cuando decidí comenzar a bloquear los robots y quedarme con la mayor cantidad de visitas reales que me fuese posible.

visitas

Si deseas, también puedes comprobarlo tú. Lo único que necesitas hacer es cambiar uno o dos archivos en tu sitio web. Enseguida te explico cómo hacerlo.

Cómo bloquear robots para obtener estadísticas más reales

Si eres como yo y la presencia de bots en tus estadísticas te resulta molesta, hacer algo para reducir esas cifras infladas es sencillo y no requiere ninguna programación avanzada. Solo necesitas aprender a bloquear los robots correctamente.

¿Qué robots nos interesa bloquear?
Nos interesa bloquear principalmente los siguientes:

• Los robots de aquellos software que se usan para descargar o copiar una web, por ejemplo HTTrack
• Los robots que entran a una web a buscar direcciones de correo electrónico para spammers
• Los robots que entran a una web a buscar vulnerabilidades conocidas que un hacker pueda explotar

¡Y muchos otros! La lista podría llegar a ser bastante larga, en realidad.

¿Cómo bloquearlos? Lo único que necesitas hacer es incluir los bots maliciosos en la lista de prohibiciones del archivo robots.txt de tu web. Quien quiera ser más agresivo podría considerar bloquearlos vía .htaccess también.

¿Dónde obtener una lista de bots a bloquear? Tranquilo, no hay que romperse la cabeza horas buscando en la web. La lista de SEObook.com me parece bastante completa y digna de copiar y pegar… perdón, de imitar.

Muchas gracias por dejarme aportar en el blog y, a todos… ¡hasta la próxima!