Qué es el umbral de datos en GA4 y cómo eliminarlo

Seguramente te ha pasado ya: has sacado unos datos por la API de GA4 bien sea en sheets bien sea con el Query Explorer o bien sea con Looker Studio y te encuentras con que el dato no es el mismo en la interfaz que extraído vía API.

Query explorer - Page path

GA4 - Exploracion _ Umbral aplicado

Y además ves que en el informe de exploración arriba a la derecha te aparece un icono como el que ves en la captura de pantalla.

GA4 - Umbral aplicado

 

¿Qué es el umbral de datos?

Es la forma que tiene google de llamar a la ocultación de datos. Así cuando google aplica un umbral de datos te los está ocultando, eso es todo.

No confundir nunca con el sampleo o sampling de los datos.

Google aplica este umbral para proteger la identidad de los usuarios y aparece cuando el número de usuarios es menor a un nivel determinado por ellos. 

En el ejemplo que que veso, es una cantidad muy pequeña de usuarios que han visitado esa url, así que para que no se pueda identificar al usuario oculta parte de los datos. 

Este umbral lo puedes encontrar en:

  • Toda la interfaz de GA4: informes estándar, de exploración, personalizados….
  • Todos los datos que se exportan a BigQuery

¿Por qué ocurre esto?

Porque está activado Google Signals. Google Analytics recopila información sobre las visitas y la asocia con la información de Google de las cuentas de los usuarios registrados que han dado su consentimiento a esta asociación con el fin de personalizar los anuncios. 

Para que quede más claro: unifica usuarios que navegan logueados con gmail, con Google Signals proporciona los informes demográficos (sexo y edad de los usuarios) y permite crear audiencias que luego se pueden exportar a Google Ads para hacer campañas de remarketing.

¿Cómo evitar el umbral de datos?

Si has leído hasta aquí, tu primera respuesta sería: desactivar Google Signals.

La buena noticia es que no hace falta desactivarlo para que no se aplique el umbral, simplemente debes elegir otro modelo de identificación de usuarios.

Google Analytics 4 ha puesto a disposición varias formas de identificar al usuario, tal y como se explica en este otro post.

Ve a la configuración de GA4 y haz clic en Identidad para los informes o Reporting Identity (si tienes la interfaz en inglés)

GA4 - Config _ Report Identity

Seguramente tendrás seleccionado el mezclado o blended y como indica en su propia definición lo que hace este modelo es combinar el User ID (si lo tenemos implementado en nuestra web), los datos de Google Signals, el ID de dispositivo (lo que ya hacía Universal Analytics, identificación por cookie) y datos modelados.

GA4 - Report Identity _ Blended

Como este modelo sí se hace servir de Google Signals, aplicará el umbral de datos cuando los datos de informe impliquen a pocos usuarios.

El otro modelo que ves es el observado o observed que combina el User ID o ID de usuario, Google Signals i el ID de dispositivo.

GA4 - Report Identity _ Observed

Obviamente, si seleccionas este tendrás el mismo problema que con el blended ya que también utiliza Google Signals.

Pero verás que abajo de la caja de opciones, a la derecha, sin llamar mucho la atención hay un “Mostrar todo”.

GA4 - Report Identity _ Show all

Al hacer clic sobre “Mostrar todo” aparece un nuevo tipo de identificación de usuarios basado en el dispositivo y que por su definición no usa Google Signals. 

Digamos que este es el modelo más sencillo o más simple de identificar a los usuarios, que es el que ya usaba Universal Analytics por el id de la cookie. Este modelo no unifica usuarios como los dos anteriores. La identificación de usuarios será menos precisa.

GA4 - Report Identity _ Devide ID

Si activas este tipo de identificación de usuarios ya no se aplicará el umbral de datos y seguirás conservando activo Google Signals para los informes demográficos y para las audiencias, pero no se usara la para la identificación de usuarios. o los informes demográficos y las audiencias. También es probable que aumenten algunas métricas, como los usuarios, ya que como no agrupa usuarios tendrás más. 

Si este es el modelo que quieres haz clic en Guardar

Los cambios son retroactivos y no se pierden cuando cambiamos de modelo de identificación de usuarios, simplemente se procesan de forma distinta, es decir, en cualquier momento podemos venir de nuevo a la configuración y cambiar el tipo de identificación a cualquiera de las dos primeras.

GA4 - Exploracion _ Sin Umbral aplicado

 

A modo de resumen

El umbral no es sampleo de datos. El umbral es ocultación de datos para que no se pueda identificar al usuario y ocurre en los siguientes casos:

  • Está activado Google Signals
  • Está activada la identificación de usuarios del tipo: combinado u observado
  • El informe contiene filas con cantidades pequeñas de usuarios, sesiones o eventos. 

Puedes activar un tipo de identificación de usuarios y desactivarlo cuando necesites.

ANTERIOR
SIGUIENTE

TIPS DE EXPERTOS

Suscríbete para impulsar tu negocio.

ÚLTIMOS ARTÍCULOS

Claude 4.0: una nueva era en chatbots de IA

La inteligencia artificial (IA) continúa avanzando a pasos agigantados, y Claude 4.0, desarrollado por Anthropic, representa un hito significativo en este camino. Este modelo de lenguaje de última generación destaca por su capacidad para comprender contextos complejos, ofrecer respuestas precisas y adaptarse a diversas necesidades empresariales.

AlphaEvolve: El nuevo agente de codificación impulsado por Gemini

En un mundo donde la tecnología avanza con una rapidez sin precedentes, la inteligencia artificial se consolida como un motor clave de transformación. Entre las innovaciones más prometedoras del momento destaca AlphaEvolve, un agente de codificación evolutivo que combina la potencia creativa de los modelos de lenguaje de gran escala (LLM) con evaluadores automatizados, abriendo nuevas fronteras en el desarrollo de software, la optimización de algoritmos y la resolución de problemas complejos en matemáticas y computación.

Cómo la IA está revolucionando el diseño y desarrollo

En el marco de su evento Config 2025, Figma ha dejado claro que el futuro del diseño digital estará profundamente marcado por la inteligencia artificial. Más allá de presentar nuevas funciones, la compañía subraya un cambio de paradigma: el diseño ya no es un proceso aislado, sino el núcleo que conecta creatividad, tecnología y desarrollo de producto.

El servidor MCP de HubSpot: Nueva integración, nuevas posibilidades

HubSpot ha dado un paso clave con el lanzamiento del servidor MCP, actualmente disponible en beta pública. Esta nueva plataforma permite que clientes de inteligencia artificial como Cursor y Claude se conecten directamente con los datos de HubSpot, habilitando un ecosistema de integración más robusto y dinámico, tanto para empresas B2B como B2C.

data
Mallorca 184, 08036
Barcelona, Spain