BigQuery + GA4: Informe de navegación por páginas
Si ya llevas un tiempo trasteando con GA4, ya te habrás dado cuenta de que hay ciertas dimensiones y métricas que sí estaban en Universal Analytics, y que no están en GA4, por ejemplo, el informe de Navegación en el que elegíamos una url de nuestra web y nos indicaba en porcentajes la ruta de la página anterior y la ruta de la página siguiente:
Ninguna de las dos dimensiones que ves: Previous Page Path (Ruta de la página anterior) y Next Page (Página Siguiente) existen para GA4. Sin embargo, este informe de navegación que existía para Universal Analytics siempre ha resultado muy útil cuando queremos conocer el comportamiento general durante la navegación centrándose en un contenido concreto. Sirve para entender el flujo de usuario y mejorar la experiencia de navegación o la estrategia de contenido de la web.
En este post te vamos a explicar cómo sacar este informe desde BigQuery.
No queremos que te asustes, si aún no se te ha ocurrido entrar en BigQuery a hacer ninguna consulta pese a que ya tienes hecha la conexión entre GA4 y BigQuery, no salgas corriendo porque en este post te lo vamos a pintar fácil fácil, solo vas a tener que copiar y pegar la query que te vamos a dar y a cambiar una serie de cosas.
Si te vamos a explicar lo que hace cada parte de la función por si te interesa, pero si no es así solo tienes que bajar a donde está la query y copiarla.
Esta consulta de BigQuery utiliza datos de Google Analytics 4 para analizar la navegación de los usuarios en un sitio web, específicamente alrededor de una URL de página dada. Se realiza en varias etapas:
1. Subconsulta "prep":
- Selecciona 'user_pseudo_id' (un identificador anónimo para el usuario), 'session_id' (identificador de la sesión de un usuario), 'page' (la URL de la página vista), y 'event_timestamp' (el momento en que ocurrió la vista de la página).
- Filtra para incluir solo eventos que son vistas de página (event_name = 'page_view').
- Los datos se extraen de las tablas de eventos para un rango de fechas específico del conjunto de datos de Google Analytics 4 (en este caso, para el año 2023).
2. Subconsulta "prep_navigation":
- Utiliza la tabla temporal 'prep' para obtener una secuencia de páginas visitadas por cada usuario y sesión.
- Aplica las funciones de ventana LAG y LEAD para obtener la página anterior ('previous_page') y la siguiente ('next_page') respectivamente, para cada vista de página, ordenadas por 'event_timestamp' de forma ascendente. Esto está particionado por 'user_pseudo_id' y 'session_id', lo que significa que la secuencia de páginas es específica para cada sesión de un usuario.
3. Consulta principal:
- Reemplaza las páginas anteriores y siguientes nulas con '(entrance)' y '(exit)' respectivamente, lo que indica que si no hay página anterior, la página en cuestión es la entrada al sitio, y si no hay página siguiente, es la salida.
- Cuenta el número de sesiones únicas ('count') donde la página específica ha sido visitada, utilizando 'COUNT(DISTINCT ...)' sobre la concatenación de 'user_pseudo_id' y 'session_id'.
- Filtra para mostrar la información solo para la URL de la página específica que quieres consultar.
- Agrupa los resultados por 'previous_page', 'page' y 'next_page'.
- Filtra para asegurarse de que la page no sea igual a 'previous_page' ni a 'next_page' para no contar autoreferencias.
- Ordena los resultados por 'count' en orden descendente.
Atento. Esta es la query que necesitas:
with prep as (
select
user_pseudo_id,
(select value.int_value from unnest(event_params) where event_name = 'page_view' and key = 'ga_session_id') as session_id,
(select value.string_value from unnest(event_params) where event_name = 'page_view' and key = 'page_location') as page,
event_timestamp
from
-- Aquí pon el nombre de tu conjunto de datos de GA4.En events_2023* puedes poner una fecha concreta: _20231001 (1 de octubre de 2023), _202310* (todo octubre de 2023), _2023* (todo lo que llevamos de 2023)...
`pruebas-bigquery-351807.analytics_313378230.events_2023*`
where
event_name = 'page_view'),
prep_navigation as (
select
user_pseudo_id,
session_id,
lag(page,1) over (partition by user_pseudo_id,session_id order by event_timestamp asc)as previous_page,
page,
lead(page,1) over (partition by user_pseudo_id,session_id order by event_timestamp asc)as next_page,
event_timestamp
from
prep)
select
ifnull(previous_page,'(entrance)')as previous_page,
page,
ifnull(next_page,'(exit)') as next_page,
count(distinct concat(user_pseudo_id,session_id)) as count
from
prep_navigation
where
-- Copia y pega abajo la url de la página que quieres consultar.
page = "https://www.hikeproject.com/como-visualizar-porcentajes-en-un-scorecard-de-data-studio/"
group by
previous_page,
page,
next_page
having
page != previous_page
and page != next_page
order by
count desc
Si quieres un rango de fechas “cerrado”, por ejemplo del 2 de septiembre al 15 de octubre.
Coge este fragmento de la query de arriba:
from
-- Aquí pon el nombre de tu conjunto de datos de GA4.En events_2023* puedes poner una fecha concreta: _20231001 (1 de octubre de 2023), _202310* (todo octubre de 2023), _2023* (todo lo que llevamos de 2023)...
`pruebas-bigquery-351807.analytics_313378230.events_2023*`
where
event_name = 'page_view'),
Y lo sustituyes por:
from
`pruebas-bigquery-351807.analytics_313378230.events_*`
where
event_name = 'page_view'
and _TABLE_SUFFIX between '20230902' and '20231015'),
¡Y listo!
Al ejecutar la query obtendrías una tabla así:
La columna central corresponde a la url seleccionada para analizar (Page), la columna a su izquierda nos indica la página anterior y la columna a la derecha, la página siguiente.
De esta forma vemos que el post:
https://www.hikeproject.com/como-visualizar-porcentajes-en-un-scorecard-de-data-studio/
En el periodo del 2 de septiembre al 15 de octubre han habido:
- 33 sesiones en las que el usuario ha entrado a la web a través de esa url y después se ha marchado
- 3 sesiones en las que el usuario ha entrado a la web directamente a esa url y ha recargado la página
- 1 sesion en la que el usuario ha entrado a la web directamente a esa url y luego ha leido https://www.hikeproject.com/funcion-case-en-data-studio-categoriza-limpia-o-reescribe-para-personalizar-tu-dashboard/
Con este tipo de informes no sólo puedes hacer el análisis de un contenido concreto de tu web, también son muy útiles para analizar el comportamiento del usuario en un proceso o una tarea, por ejemplo en una página de reservas de vuelos, puedes analizar qué hacen los usuarios tras realizar una búsqueda, qué porcentaje de ellos vuelven a la home tal vez a realizar otra búsqueda, qué porcentaje de usuarios pasan a la pantalla siguiente a elegir tarifas…
También es muy útil para hacer un análisis de la home de la web sobre todo para sitios web que tienen más de un objetivo en su home, volviendo al ejemplo de una página de reservas de vuelos: buscar vuelos, realizar el check in de un vuelo de una reserva, encontrar información sobre un vuelo ya comprado, contactar para una incidencia o duda…
¿Usabas los informes de navegación en Universal Analytics? ¿Los estabas echando de menos en GA4?