BigQuery + GA4: Informe de páginas de salida

¿Recuerdas de Universal Analytics los informes de salida? 

Era un informe de las principales páginas de salida de nuestra web. En el informe tal y como su nombre indicaba mostraba las principales urls por la que los usuarios se marchan de nuestro sitio web.UA - Exit pagesEl propósito de esta consulta es identificar cuáles son las páginas de salida más comunes en un sitio web, lo que puede proporcionar información valiosa sobre el comportamiento del usuario, posibles puntos de fricción en el diseño del sitio web o el flujo del usuario, y oportunidades para mejorar la retención de usuarios o optimizar las conversiones, especialmente si previamente has creado agrupaciones de contenido en GA4 para segmentar mejor tu análisis.

Te ofrecemos también una descripción de lo que hace la consulta por si quieres saberlo, pero puedes saltarte la explicación y copiar y pegar directamente la query.

Esta consulta de BigQuery está diseñada para identificar las páginas de salida de las sesiones de usuarios en un sitio web utilizando datos de Google Analytics 4 exportados a BigQuery. Aquí está el desglose de lo que hace la consulta:

  • Subconsulta "prep":
      • Selecciona los identificadores de usuario ('user_pseudo_id'), los identificadores de sesión ('session_id'), y las URL de las páginas ('page') donde se ha producido un evento de vista de página ('page_view').
      • Recoge el 'event_timestamp' para cada evento de vista de página.
      • Filtra para incluir sólo eventos que son vistas de página (event_name = 'page_view').
      • Ordena los resultados por 'event_timestamp' para obtener una secuencia de eventos por tiempo.
  • Subconsulta "prep_exit":
      • Utiliza la tabla temporal 'prep' para seleccionar los mismos campos.
      • Aplica la función de ventana 'FIRST_VALUE' para obtener la última página vista ('exit_page') en cada sesión por usuario, ordenando los eventos por 'event_timestamp' de manera descendente, lo que significa que obtiene la página con el último timestamp como la página de salida.
  • Consulta principal:
    • Selecciona la página ('exit_page') solo si coincide con la última página vista en la sesión (indicando que es la página de salida).
    • Cuenta el número de sesiones únicas ('exits') que terminaron en cada página de salida específica, usando 'COUNT(DISTINCT ...') sobre la concatenación de 'user_pseudo_id' y 'session_id'.
    • Agrupa los resultados por 'exit_page'.
    • Filtra para incluir solo aquellas filas donde 'exit_page' no es nula, asegurando que solo se cuentan las páginas de salida.
    • Ordena los resultados por el número de salidas en orden descendente.

Te vamos a pasar la query que has de usar en Bigquery en tu dataset o conjunto de datos de GA4 de tu web para poder ver este tipo de informe.

Recuerda que para hacer esto no es necesario que sepas Bigquery, solo has de copiar y pegar lo que viene a continuación.


WITH prep AS (
  SELECT
    user_pseudo_id,
    (SELECT value.int_value FROM UNNEST(event_params) WHERE event_name = 'page_view'AND KEY = 'ga_session_id') AS session_id,
    (SELECT value.string_value FROM UNNEST(event_params) WHERE event_name = 'page_view'AND KEY = 'page_location') AS page,
    event_timestamp
  FROM
    -- Aquí pon el nombre de tu conjunto de datos de GA4.En events_2023* puedes poner una fecha concreta: _20231001 (1 de octubre de 2023), _202310* (todo octubre de 2023), _2023* (todo lo que llevamos de 2023)...
    `<project>.<dataset>.events_2023*`
  WHERE
    event_name = 'page_view'
  ORDER BY
    event_timestamp
),
  prep_exit AS(
  SELECT
    user_pseudo_id,
    session_id,
    page,
    event_timestamp,
    FIRST_VALUE(CONCAT(page, event_timestamp)) OVER (PARTITION BY user_pseudo_id, session_id ORDER BY event_timestamp DESC) AS exit_page
  FROM
    rep
  ORDER BY
    event_timestamp
  )
SELECT
  CASE
    WHEN concat (page, event_timestamp) = exit_page THEN page
  ELSE
  NULL
END
  AS exit_page,
  COUNT(DISTINCT CONCAT(user_pseudo_id,session_id)) AS exits
FROM
  prep_exit
GROUP BY
  exit_page
HAVING
  exit_page IS NOT NULL
ORDER BY
  exits desc

Si quieres un rango de fechas “cerrado”, por ejemplo del 8 de agosto al 23 de septiembre. 

Coge este fragmento de la query de arriba: 


FROM
  -- Aquí pon el nombre de tu conjunto de datos de GA4.En events_2023* puedes poner una fecha concreta: _20231001 (1 de octubre de 2023), _202310* (todo octubre de 2023), _2023* (todo lo que llevamos de 2023)...
  `<project>.<dataset>.events_2023*`
WHERE
  event_name = 'page_view'

Y lo sustituyes por: 


FROM
  `<project>.<dataset>.events_*`
WHERE
  event_name = 'page_view'
  AND _TABLE_SUFFIX BETWEEN '20230808'
  AND '20230923'

Y listo!

Al ejecutar la query obtendrías una tabla así:

BQ - Query Results

En la tabla ya podremos ver las principales páginas de salida de nuestra web y las veces que los usuarios han salido por ellas en el periodo seleccionado.

Hasta aquí el artículo de hoy. Espero que sea útil y provechoso. Si te han quedado dudas puedes ponerte en contacto con nosotros.

Preguntas frecuentes sobre páginas de salida en Google Analytics 4 y BigQuery 

¿Qué es una página de salida en Google Analytics 4?

Una página de salida es la última URL que un usuario visita antes de abandonar tu sitio web. Analizarlas permite detectar puntos de fricción, oportunidades de optimización y mejoras en la experiencia de usuario. En GA4 no existe el informe nativo de páginas de salida, por lo que su cálculo se realiza mediante BigQuery.

¿Cómo obtener un informe de páginas de salida en GA4 usando BigQuery?

Puedes obtener este informe mediante una consulta SQL que identifica la última página vista por sesión. Solo necesitas tener la exportación de datos de GA4 a BigQuery activada y ejecutar la query en tu dataset. No requiere conocimientos avanzados de SQL, ya que basta con copiar y pegar la consulta proporcionada.

¿Por qué es útil analizar las páginas por las que los usuarios abandonan mi web?

Permite detectar dónde se pierde tráfico, identificar contenidos que no retienen al usuario, localizar puntos de fuga en el embudo de conversión y mejorar la estructura del sitio. Es un análisis clave para optimizar UX, SEO y CRO.

 

ANTERIOR
SIGUIENTE

TIPS DE EXPERTOS

Suscríbete para impulsar tu negocio.

ÚLTIMOS ARTÍCULOS

La importancia del CRM en la industria del fitness

La mayoría de gimnasios no empiezan siendo un negocio digitalmente sofisticado. Empiezan siendo personas apasionadas por ayudar a otras personas a estar más sanas. Y casi siempre, antes de que te des cuenta, el día a día empieza a convertirse en un ejercicio continuo de malabarismos: atender a los socios, gestionar reservas, responder mensajes, revisar pagos, recordar renovaciones, entender por qué unas clases funcionan y otras no… todo mientras intentas mantener viva la esencia del lugar.

Caso de éxito: Clickferry mejora la atención al cliente con Service Hub

Clickferry es una plataforma líder en movilidad y transporte que conecta a los usuarios con soluciones de transporte de manera flexible y adaptada a la demanda. Con un modelo de negocio dinámico y estacional, garantizar una atención al cliente ágil y organizada es clave para ofrecer una experiencia satisfactoria y confiable.

Cómo transformar la captación y retención en centros educativos con CRM

La mayoría de instituciones siguen gestionando leads, inscripciones, comunicaciones y seguimiento de estudiantes con sistemas dispersos, hojas de cálculo y procesos que dependen demasiado de cada persona.

Este es el origen de muchos de los problemas que vemos en universidades, escuelas y plataformas educativas: pérdida de leads, tiempos de respuesta lentos, baja trazabilidad del proceso de admisión, campañas de marketing poco efectivas y una débil relación con exalumnos. Y es justamente aquí donde un CRM educativo moderno deja de ser una herramienta y se convierte en un acelerador directo de ingresos.

Qué es la data sintética y por qué redefine el futuro de la IA

Introducción

La data sintética —o datos sintéticos— se ha convertido en una de las herramientas más prometedoras para la evolución de la inteligencia artificial (IA) y la automatización empresarial. En un contexto en el que los datos reales son cada vez más costosos, limitados o sensibles, las organizaciones buscan alternativas seguras y escalables para entrenar modelos de machine learning sin comprometer la privacidad.

Pero ¿qué es exactamente la data sintética? ¿Cómo se genera? ¿Y por qué está revolucionando sectores como la sanidad, las finanzas o la industria manufacturera? Este artículo responde esas preguntas con un enfoque práctico y estratégico para empresas que apuestan por la innovación.

data
Mallorca 184, 08036
Barcelona, Spain