El imparable ascenso del not provided y su influencia en la analítica a corto plazo

Asumo que la mayoría de la gente que se pasa de vez en cuando por este blog es webmaster o similar, por lo cual conocéis de sobra la polémica del not provided. Si queda algún despistado, que eche un vistazo por aquí para “ponerse al día”.

Antes de seguir con este post, muestro un pequeño gráfico que demuestra el imparable ascenso de los datos not provided en Google Analytics.

fundacion dedalo
En el gráfico se representa el % de palabras clave señaladas como not provided en relación con el total del tráfico aportado cada mes por Google a una de mis páginas web. Creo que esta forma es la mejor para darnos cuenta que está pasando en lugar de otros gráficos que he visto en el que se representa únicamente el número de not provided totales mensuales, cifras que se pueden ver alteradas por pérdidas o ganancias del tráfico que suministra mensualmente Google a un proyecto.

¿Cómo afecta todo este tema a la analítica? Está claro que a medio/largo plazo este % va a crecer lo cual nos va a obligar a hacer ajustes en la forma de medir. Muchos ya plantean diferentes soluciones. Yo de momento acepto para mi la desarrollada por Miguel López en el post anterior: “Si asumimos que la distribución de las keyword not provided sigue la misma distribución que el resto de keyword, para realizar nuestros análisis de ranking de keywords, marca contra no marca, short, médium y long tail, etc, podemos utilizar los porcentajes que nos de Google Analytics excluyendo todas las visitas desde keywords not provided”.

Y es que al final, no parece lógico pensar que estar logueado en Gmail altere tu forma de buscar en Google

Teniendo en cuenta todo lo anterior, en algunas de las estadísticas de mis webs he tenido que hacer reajustes. Por ejemplo, me gusta controlar el número de visitas que recibo de gente que busca en los buscadores mi marca (o dominio exacto, según el caso).

En este aspecto, el número de palabras claves referentes a la marca deja de tener valor, ya que no es lo mismo 200 kw con un 5% de datos not provided que 200 kw con 25% de datos “capados” por Google.

Para ello, y teniendo en cuenta como ya comenté que asumo que los datos siguen la misma distribución, recojo los siguientes datos para prorratear la cantidad de tráfico total que llega a mi web desde los buscadores gracias a mi marca:

fundacion dedalo
Los datos que obtengo tras el prorrateo tienen mayor sentido que quedarse únicamente con el número de visitas que trae la marca (recordar, como se vio claro en el gráfico anterior, el avance imparable que está teniendo el not provided).

Eso si, no podemos obviar que:

  • Es una aproximación, no un dato real. Por ejemplo, en el tratamiento que hago de los datos doy por hecho que el 100% de keyword las trae Google cuando no lo es (pero casi, por encima del 95% del tráfico que recibo de buscadores es de Google).
  • Cuanto más suba el not provided, más inexacto serán los datos que prorrateo. Si en el futuro llegan, por ejemplo, al 80% este sistema perderá bastante fiabilidad…

Un pensamiento en “El imparable ascenso del not provided y su influencia en la analítica a corto plazo

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *