GA4 y Consent Mode: los datos modelados de Google

El otro día publicaba en LinkedIn una serie de conclusiones que venían dadas por la reciente publicación de Google de su Behavioural Modelling en Google Analytics 4. Básicamente este anuncio del gigante venía a decirnos que a partir de ahora vamos a poder utilizar datos modelados para rellenar los huecos que están generando -y que cada vez serán mayores- las diferentes medidas de privacidad y compliance que se están adaptando en todo el mundo tecnológico, a saber:

  • Restricciones en navegadores: siendo Brave el navegador que más esfuerzos a puesto en este tipo de solución «bloqueadora» de cookies, tenemos muchos ejemplos ahora mismo. La «total cookie protection» de Mozilla es uno de los más recientes.
  • Apple. Así, como regla general. Apple ha puesto toda la carne en el asador en el tema de la privacidad, convirtiéndola en prácticamente su bandera de marca. Medidas como el Intelligent Tracking Prevention o el App Tracking Transparency han supuesto un cambio de paradigma en el mundo de la analítica digital.
  • GDPR. Sí, hay otros marcos de privacidad en el mundo que también tratan el tema de los datos, pero ninguno ha puesto tanto foco en la privacidad de los usuarios como el europeo. La implantación de la llamada «política de cookies» es algo ya habitual en todas las webs europeas, algo que ha hecho reducir nuestra capacidad de análisis de las interacciones de los usuarios entre un 20% y un 60% (dependiendo de la web y la implantación).

Sabiendo que este es el escenario en el que nos encontramos y que seguramente, más medidas similares seguirán apareciendo en nuestro camino, la decisión de Google sobre la incorporación de datos modelados en Google Analytics 4 parece muy acertada. Pero, ¿qué significa exactamente que vamos a poder tener datos modelados? ¿Qué requisitos son necesarios para que esto empiece a funcionar? ¿Qué papel tiene el consent mode en todo este proceso?

Todas estas preguntas y más son las que vamos a intentar resolver en este artículo. No os relajéis, esto no va a ser un post explicando las maravillas de los datos modelados, aquí vamos a meternos con casco y linterna en los agujeros más recónditos de las cuevas de Google, ¿os atrevéis? Los puntos sobre los que vamos a asentarnos van a ser:

  1. Ya estamos modelando en GA4
  2. Implementación de Consent Mode para GA4 en un TMS
  3. Qué datos podemos ver con Consent Mode en GA4 y BQ
  4. Conclusiones

1. Ya estamos modelando en GA4

Pues sí, ahora mismo, en el momento de leer esto, Google ya está recogiendo datos que le servirán para generar modelos de machine learning con los que alimentar los huecos de los que hemos hablado. Pero eso sí, sólo podrá hacerlo si previamente hemos configurado correctamente Consent Mode (CoMo en adelante) en nuestra web. Para esto, podéis seguir los pasos que ya adelanté en su momento en este post. Eso sí, en el siguiente punto veremos las especificaciones para que la conexión con GA4 sea completa y correcta. En cualquier caso, los puntos fundamentales de esta proceso de modelado son:

Modeled vs Observed: los datos «observables» serán aquellos de los usuarios que han dado su consentimiento para que podamos recoger su información. Los «modelados» son los que no dan este consentimientoGoogle los genera basándose en estos modelos inteligentes que se han generado en base al comportamiento de los usuarios «observados».

-Existen unos prerequisitos mínimos que cumplir para que funcione el modelado: como ya hemos dicho, debemos activar consent mode, pero también tener al menos 1000 eventos diarios sin consentimiento en los últimos 7 días y tener al menos 1000 usuarios con consentimiento en los últimos 7 o 28 días.

-Los datos modelados no están disponibles para todas las features de GA4: esta funcionalidad no está soportada en audiencias, informes en tiempo real, explore (sólo aceptado las tablas), segmentos, métricas predictivas y data export.

Importante: podemos decidir si queremos observar datos modelados dentro de la propia plataforma o no. Ahora, en Reporting Identity Options tenemos una tercera opción llamada Blended. Esta es la que nos permitirá tener datos modelados. Las otras opciones serán Observed y Device-based, que mantienen sus respectivas funcionalidades:

Que esto esté disponible y que suponga un gran paso en algunas situaciones que ya hemos mencionado, no quiere decir que siempre vaya a ser la mejor opción. Por lo que tener esto controlado y elegir la mejor forma de recoger la información va a ser algo crucial en nuestra estrategia de análisis. Eso sí, siempre tengamos en cuenta el orden con el que se recoge la información. Por ejemplo, si elegimos blended para obtener los datos modelados, el orden de prioridad siempre será este:

Es decir, los datos modelados se activarán en el caso de que no podamos obtener ninguna otra información sobre el usuario. Google chequeará, por este orden, si tenemos el user-id, sino buscará en google signals, si este también falla pasaremos al device-id y si este último tampoco fuera identificable, pasaríamos al modelado. Normalmente este será el caso para los usuarios que no acepten cookies, pero también podría ser para un usuario que navega con un iPhone en Safari, por ejemplo.

Vale, ya hemos visto que para que todo el proceso funcione lo primero que tenemos que tener es la configuración de consent mode realizada correctamente. Siguiendo los pasos que dejé en mi guía y que ya os he enlazado anteriormente tendríamos el 95% del trabajo hecho, pero, como suele pasar con Google, hay una serie de caveats a tener en cuenta cuando estemos haciendo la implementación, especialmente en GA4. Antes de pasar a esto, me gustaría comentar un par de puntos muy relevantes cuando estamos haciendo el auditado de la configuración, que nos ayudarán mucho a saber si la hemos hecho correctamente.

  • Parámetro gcs: esto ya lo comenté en la guía, pero no está de más recordarlo. Si consent mode está activado, todos las requests a servicios de Google que acepten consent mode (Google Ads, Floodlight y Google Analytics), deberían tener este parámetro añadido. Recordad, si el valor es G100 querrá decir que los usuarios no han aceptado cookies, si tenemos G101 han aceptado sólo cookies de analítica y si tenemos G111 los usuarios han aceptados todas las categorías de cookies. Para comprobarlo, podemos ir al network de nuestra página y observar esto:
  • Google syndication: ojo con los auditados de Google Ads y Floodlight, porque dejan de ser como hasta ahora. Si los usuarios no han aceptado cookies, esto quiere decir que esta información deberá trasladarse de forma anonimizada a ese «cajón» donde google guarda las cosas para realizar el proceso del modelado. Cuando esto ocurra, el request a estas dos plataformas ya no será a doubleclick o fls, sino que veremos una llamada a googlesyndication:

Ahora sí, teniendo esto ya claro, vamos a por qué la implementación de consent mode es especial para GA4. El problema fundamental viene en el aterrizaje del usuario en nuestra web antes de que haya tomado una decisión sobre las cookies. Es decir, cuando aparece el ya famosísimo banner preguntando si aceptas o rechazas las cookies:

Este es un momento crucial, ya que determinará la correcta recolección de gran parte de los datos. Si no lo hacemos correctamente, podemos estar perdiendo información muy valiosa. Pues bien, si ya hemos configurado consent mode en nuestro TMS de confianza y nos aparece esta pantalla, la idea es que deberíamos recoger la información de Google Analytics sin problema. Por supuesto, con el parámetro gcs=g100 porque no hemos aceptado cookies. Para ello, habremos puesto un trigger normal de All Pages a nuestras etiquetas básicas de Universal Analytics y GA4, y quitado todas las restricciones o bloqueadores que pudiera haber para que esto no saltara hasta que el usuario aceptase. Siguiendo todos estos pasos, la sucesión que debería aparecer es la siguiente:

Todo parece funcionar correctamente hasta ahora. Si todo siguiera la lógica esperada, cuando aceptásemos cookies se deberían relanzar estas llamadas con el gcs=g111, lo cual haría que esta información llegara a Analytics de la manera estándar. Pero lo que ocurre a continuación os sorprenderá:

Sí, efectivamente. Se relanza la request de Universal Analytics, pero no la de GA4. ¿Por qué ha hecho Google que la que tiene la lógica que se espera sea su herramienta en extinción? Cosas que nunca podremos llegar a entender. Lo que sí entendemos es que con esta configuración nuestro envío de información a GA4 estaría sesgado porque perderíamos los datos de los usuarios una vez aceptan cookies. Es decir, no tendríamos el aterrizaje de nuevos usuarios en nuestra web. Para solucionarlo, lo que debemos utilizar es un evento que se genera TRAS haberse cargado la información en consent mode. En este caso, por ejemplo, utilizaré el evento que lanza la maravillosa template de Simo Ahava para implementar consent mode que véis más arriba (gtm_consent_update). Vamos a ver ahora qué secuencia tendríamos con esta configuración.

Siguiendo esta lógica podemos ver que obtenemos toda la información que necesitamos y que cumple con los estándares de consent mode. Sin esto, estaríamos yendo en la dirección opuesta a lo que intentamos conseguir con consent mode y los datos modelados.

Qué datos podemos ver con Consent Mode en GA4 y BigQuery

Queda la pregunta de los datos que van a estar disponibles con el modelado y qué vamos a poder hacer con ellos. Dentro de la propia herramienta, la idea es que, cuando todo funcione y se cumplan los requisitos, podamos saber que en nuestros reportes que estamos viendo información modelada, algo como esto:

De momento todavía no he visto ninguna cuenta que cumpliera con todos los requisitos para empezar a observar estos mensajes, por lo que no he podido comprobar si esto es así y cómo vamos a poder interactuar con esto en GA4, pero nos hacemos una ligera idea de lo que será. Eso sí, en ningún momento vamos a poder observar cómo realiza Google estos modelados ni por qué nos entrega la información que nos entrega.

La idea fundamental de esto es que gracias al modelado conseguiremos un mayor volumen de datos sobre nuestros usuarios, ya que vamos a dotar de inteligencia a la herramienta para «simule» las interacciones de aquellos que no podemos observar. Cómo se consigue esto es algo que evidentemente Google va a mantener en secreto en su caja negra. Aquí, como decíamos antes, entra en el entendimiento del proyecto de cada cual el saber si este modelo se adapta mejor o peor a las necesidades del análisis.

Por otro lado, queda el apartado de BigQuery. ¿Se podrá ver el modelado dentro del export que realizamos al warehouse? ¿Qué datos se recogen de los usuarios si no han aceptado las cookies? Pues esto es bastante interesante. Tal y como ya hemos apuntado arriba, el tema de la lógica del modelado es algo a lo que no vamos a tener acceso, pero los datos de las interacciones de usuarios con el parámetro gcs=g100 (es decir, aquellos que no han aceptado cookies), sí que llegan a la plataforma. Aquí van las principales conclusiones de lo que recogemos o no dependiendo de esta aceptación:

El user_pseudo_id se elimina cuando el usuario no acepta cookies, aunque seguimos recogiendo todas sus interacciones:

Tampoco podemos obtener la fuente de tráfico a través de la cual se han producido esos eventos:

Una nota importantísima a esta recogida de información es que si en la misma sesión el usuario primero rechaza las cookies y, más tarde, las acepta, la información se recogerá como si nunca se hubieran rechazado, haciendo que todos los pings con gcs=g100 anteriores se transformen en gcs=g111 de forma retroactiva. Esto, aunque no se pueda comprobar de manera factible en GA4, entendemos que es algo que comparte el motor de la herramienta con BQ.

Esto hace que sin duda BQ se convierta una vez más en la opción referente a la hora de realizar nuestros análisis de GA4. Aquí vamos a disponer de toda la información que existe en nuestra cuenta, lo que nos da una fiabilidad mucho mayor que la que teníamos hasta ahora.

Conclusiones

El consent mode y los datos modelados es un gran paso para todos los que trabajamos con Google. Y es un paso en todas direcciones: es un paso que nos va a llevar a mayor incertidumbre en nuestros análisis, va a ampliar una capacidad de tracking que estábamos perdiendo por segundos, va a hacer que necesitemos ser todavía más técnicos y, por supuesto, creo que va a conseguir que nos preocupemos cada vez más por la privacidad del usuario.

No sé si esta será la solución definitiva para seguir haciendo analítica digital sobre las interacciones en webs y apps respetando las decisiones de nuestros usuarios sobre su privacidad. Lo que sí sé es que es una opción que abre puertas hacia nuevos senderos. Y eso siempre es muy emocionante.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s