BigQuery + GA4: Informe de navegación por páginas

Si ya llevas un tiempo trasteando con GA4, ya te habrás dado cuenta de que hay ciertas dimensiones y métricas que sí estaban en Universal Analytics, y que no están en GA4, por ejemplo, el informe de Navegación en el que elegíamos una url de nuestra web y nos indicaba en porcentajes la ruta de la página anterior y la ruta de la página siguiente:

UA - Navigation Summary

Ninguna de las dos dimensiones que ves: Previous Page Path (Ruta de la página anterior) y Next Page (Página Siguiente) existen para GA4. Sin embargo, este informe de navegación que existía para Universal Analytics siempre ha resultado muy útil cuando queremos conocer el comportamiento general durante la navegación centrándose en un contenido concreto. Sirve para entender el flujo de usuario y mejorar la experiencia de navegación o la estrategia de contenido de la web. 

En este post te vamos a explicar cómo sacar este informe desde BigQuery

No queremos que te asustes, si aún no se te ha ocurrido entrar en BigQuery a hacer ninguna consulta pese a que ya tienes hecha la conexión entre GA4 y BigQuery, no salgas corriendo porque en este post te lo vamos a pintar fácil fácil, solo vas a tener que copiar y pegar la query que te vamos a dar y a cambiar una serie de cosas. 

Si te vamos a explicar lo que hace cada parte de la función por si te interesa, pero si no es así solo tienes que bajar a donde está la query y copiarla. 

Esta consulta de BigQuery utiliza datos de Google Analytics 4 para analizar la navegación de los usuarios en un sitio web, específicamente alrededor de una URL de página dada. Se realiza en varias etapas:

1. Subconsulta "prep":

  • Selecciona 'user_pseudo_id' (un identificador anónimo para el usuario), 'session_id' (identificador de la sesión de un usuario), 'page' (la URL de la página vista), y 'event_timestamp' (el momento en que ocurrió la vista de la página).
  • Filtra para incluir solo eventos que son vistas de página (event_name = 'page_view').
  • Los datos se extraen de las tablas de eventos para un rango de fechas específico del conjunto de datos de Google Analytics 4 (en este caso, para el año 2023).


2. Subconsulta "prep_navigation":

  • Utiliza la tabla temporal 'prep' para obtener una secuencia de páginas visitadas por cada usuario y sesión.
  • Aplica las funciones de ventana LAG y LEAD para obtener la página anterior ('previous_page') y la siguiente ('next_page') respectivamente, para cada vista de página, ordenadas por 'event_timestamp' de forma ascendente. Esto está particionado por 'user_pseudo_id' y 'session_id', lo que significa que la secuencia de páginas es específica para cada sesión de un usuario.

3. Consulta principal:

  • Reemplaza las páginas anteriores y siguientes nulas con '(entrance)' y '(exit)' respectivamente, lo que indica que si no hay página anterior, la página en cuestión es la entrada al sitio, y si no hay página siguiente, es la salida.
  • Cuenta el número de sesiones únicas ('count') donde la página específica ha sido visitada, utilizando 'COUNT(DISTINCT ...)' sobre la concatenación de 'user_pseudo_id' y 'session_id'.
  • Filtra para mostrar la información solo para la URL de la página específica que quieres consultar.
  • Agrupa los resultados por 'previous_page', 'page' y 'next_page'.
  • Filtra para asegurarse de que la page no sea igual a 'previous_page' ni a 'next_page' para no contar autoreferencias.
  • Ordena los resultados por 'count' en orden descendente.

Atento. Esta es la query que necesitas:

with prep as (

select

   user_pseudo_id,

   (select value.int_value from unnest(event_params) where event_name = 'page_view' and key = 'ga_session_id') as session_id,

   (select value.string_value from unnest(event_params) where event_name = 'page_view' and key = 'page_location') as page,

   event_timestamp

from

-- Aquí pon el nombre de tu conjunto de datos de GA4.En events_2023* puedes poner una fecha concreta: _20231001 (1 de octubre de 2023), _202310* (todo octubre de 2023), _2023* (todo lo que llevamos de 2023)...

   `pruebas-bigquery-351807.analytics_313378230.events_2023*`

where

   event_name = 'page_view'),

  

prep_navigation as (

select

   user_pseudo_id,

   session_id,

   lag(page,1) over (partition by user_pseudo_id,session_id order by event_timestamp asc)as previous_page,

   page,

   lead(page,1) over (partition by user_pseudo_id,session_id order by event_timestamp asc)as next_page,

   event_timestamp

from

   prep)

select

   ifnull(previous_page,'(entrance)')as previous_page,

   page,

   ifnull(next_page,'(exit)') as next_page,

   count(distinct concat(user_pseudo_id,session_id)) as count

from

       prep_navigation

where

 -- Copia y pega abajo la url de la página que quieres consultar.

   page = "https://www.hikeproject.com/como-visualizar-porcentajes-en-un-scorecard-de-data-studio/"

group by

   previous_page,

   page,

   next_page

having

   page != previous_page

   and page != next_page

order by

   count desc

Si quieres un rango de fechas “cerrado”, por ejemplo del 2 de septiembre al 15 de octubre. 

Coge este fragmento de la query de arriba: 

from

-- Aquí pon el nombre de tu conjunto de datos de GA4.En events_2023* puedes poner una fecha concreta: _20231001 (1 de octubre de 2023), _202310* (todo octubre de 2023), _2023* (todo lo que llevamos de 2023)...

   `pruebas-bigquery-351807.analytics_313378230.events_2023*`

where

   event_name = 'page_view'),

Y lo sustituyes por: 

from

 `pruebas-bigquery-351807.analytics_313378230.events_*`

where

event_name = 'page_view'

and _TABLE_SUFFIX between '20230902' and '20231015'),

¡Y listo!

Al ejecutar la query obtendrías una tabla así: 

BQ - Query Results-1

La columna central corresponde a la url seleccionada para analizar (Page), la columna a su izquierda nos indica la página anterior y la columna a la derecha, la página siguiente.

De esta forma vemos que el post: 

https://www.hikeproject.com/como-visualizar-porcentajes-en-un-scorecard-de-data-studio/

En el periodo del 2 de septiembre al 15 de octubre han habido:

 

Con este tipo de informes no sólo puedes hacer el análisis de un contenido concreto de tu web, también son muy útiles para analizar el comportamiento del usuario en un proceso o una tarea, por ejemplo en una página de reservas de vuelos, puedes analizar qué hacen los usuarios tras realizar una búsqueda, qué porcentaje de ellos vuelven a la home tal vez a realizar otra búsqueda, qué porcentaje de usuarios pasan a la pantalla siguiente a elegir tarifas…

También es muy útil para hacer un análisis de la home de la web sobre todo para sitios web que tienen más de un objetivo en su home, volviendo al ejemplo de una página de reservas de vuelos: buscar vuelos, realizar el check in de un vuelo de una reserva, encontrar información sobre un vuelo ya comprado, contactar para una incidencia o duda…

 

¿Usabas los informes de navegación en Universal Analytics? ¿Los estabas echando de menos en GA4?

 

ANTERIOR
SIGUIENTE

TIPS DE EXPERTOS

Suscríbete para impulsar tu negocio.

ÚLTIMOS ARTÍCULOS

Sin base sólida, no hay IA que funcione: el reto de la Data Foundation

En un contexto empresarial donde la IA se ha convertido en el nuevo estándar de eficiencia y escalabilidad, muchas organizaciones se enfrentan a una paradoja: disponen de tecnología avanzada, pero no logran resultados consistentes. La razón no suele estar en el algoritmo, sino en los cimientos. La Data Foundation es la verdadera protagonista del éxito o fracaso de cualquier estrategia de IA, automatización o CRM.

La automatización inteligente llega al CRM: Salesforce lanza Agentforce

Salesforce ha vuelto a marcar el ritmo de la innovación con el anuncio de Agentforce y Marketing Cloud Next, dos soluciones que redefinen la automatización en el ecosistema CRM. Estas novedades no solo incorporan inteligencia artificial, sino que sitúan a la IA generativa en el centro de las operaciones comerciales, permitiendo que agentes virtuales actúen con autonomía en procesos de ventas, marketing y atención al cliente.

En este artículo analizamos las claves de esta evolución y su impacto en la productividad comercial, desde una perspectiva de CRM y analítica avanzada.

Cómo Amazon usa IA en Prime Day 2025 para personalizar la experiencia de compra

Amazon prepara su Prime Day 2025, que se celebrará del 8 al 11 de julio, con un enfoque claro en mejorar la experiencia de compra mediante herramientas impulsadas por inteligencia artificial. Durante las 96 horas de ofertas exclusivas para miembros Prime, la IA facilitará que los usuarios encuentren exactamente lo que buscan a precios atractivos, optimizando tiempo y relevancia.

AdTegral e Improvado se alían para aplicar IA al análisis de marketing

En un entorno donde la rapidez y la precisión marcan la diferencia, la reciente colaboración entre AdTegral e Improvado demuestra que la integración efectiva de datos y AI es un paso estratégico imprescindible. Su alianza permite reducir en un 70 % la latencia en reporting programático, conectando directamente campañas con inteligencia accionable y sin depender de tecnología compleja.

data
Mallorca 184, 08036
Barcelona, Spain