Cubos OLAP en Analítica Web
Cuando se manejan grandes cantidades de datos, su procesamiento se convierte en una tarea complicada, que requiere importantes cantidades de tiempo. Un claro ejemplo es el procesamiento de los datos generados por el tráfico web: Tratar con logs de millones de líneas, volcar su contenido a base de datos, y procesarlo conlleva un coste tanto temporal como computacional muy elevado.
Para solventar este problema, las herramientas e-business intelligence utilizan cubos OLAP, esto es, bases de datos multidimensionales. Los cubos OLAP se pueden entender como bases de datos formados por “una sola tabla”, con un campo para cada dimensión, y otro campo para cada métrica.
Esta tecnología es muy útil cuando solo necesitamos acceder a los datos (hacer consultas), ya que los tiempos de respuesta son mucho más bajos que en las bases de datos relacionales, sobre todo cuando el volumen de datos es considerable.
Por consiguiente, cuando nuestra web genera una cantidad de datos importantes, es indispensable asegurarse de que nuestra herramienta de reporting/e-business intelligence disponga de esta tecnología para conseguir unos tiempos de respuesta aceptables.
Trabajando sobre muestras
Como se recogía la semana pasada en “Expansión”, el panel de audiencias de TNS Sofres utilizado por anunciantes y medios audiovisuales en televisión hace uso de audímetros colocados en 3.850 hogares para después extrapolar sus resultados a una estimación de los contenidos consumidos por 14,8 millones de hogares “principales”.
Por supuesto, esta estimación excluye los canales desplegados sobre cable, Internet y satélite. También excluye visualizaciones pregrabadas, televisión móvil y una multitud de canales en TDT (Televisión Digital Terrestre), que están aún a la espera de la elaboración de un sistema consensuado de medición por parte de asociaciones de medios y anunciantes.
Al ojo de aquellos que ya nos hemos acostumbrado a un entorno tan sumamente medible (Web), resulta curioso que multimillonarias inversiones en publicidad audiovisual estén tomando como base un conjunto de cifras que a lo sumo podrían calificarse de orientativas a la hora de medir el impacto de nuestra publicidad sobre la audiencia. Y esto por no hablar, por supuesto, de la completa falta de visibilidad entre el punto de acceso (a la publicidad) y el momento de la atribución de los resultados (mérito de la venta final, por ejemplo).
Aún así, somos conscientes de que el entorno audiovisual es herencia de otros tiempos y aceptamos sus limitaciones con resignación. También aceptamos que la aureola creativa que ha acompañado a la publicidad a lo largo de su historia exige que depositemos nuestra confianza en una nube de efectos colaterales enormemente beneficiosos para la marca.
Lo que resulta realmente duro es tener que aceptar una situación de ceguera análoga para nuestras inversiones en entornos que son medibles por naturaleza. No podemos confiar nuestras decisiones a datos aislados facilitados por cada una de nuestras agencias de medios para cada tipo de campaña realizada. Resulta esencial aglutinar internamente toda la información para su homogeneización y análisis a largo plazo.
Inteligencia Artificial en Analítica Web
La inteligencia artificial (y más en concreto, el uso de redes bayesianas para la emulación del sistema de razonamiento humano) está cada vez más presente en nuestras actividades de análisis, segmentación y optimización. Es muy probable, de hecho, que sea esta disciplina la que aporte una respuesta más sólida a la eterna disyuntiva entre el análisis individualizado de orden cualitativo y la significancia estadística de la que tanto hemos hablado en este blog.
Repasando dos usos ya mencionados a colación de diferentes problemáticas:
- Behavioural Targeting: Una vez más, la definición de diferentes segmentos de usuarios a partir de sus patrones de interacción con la web hace uso de cálculos de aprendizaje automático.
- Open-text Voice of the Customer Surveys: La indexación y categorización de respuestas de campo abierto (desestructurado) en encuestas online (como las facilitadas por Foresee o iPerceptions) requiere tecnologías complejas de interrelación e indexación para su ulterior intercruzado con los segmentos predefinidos en la estrategia de análisis de la empresa. Y éste es precisamente el Talón de Aquiles de muchos de estos sistemas.
El uso de cálculos ya puestos a prueba por empresas como Autonomy o Fast (recién adquirida por Microsoft) en sus propias propuestas de “Enterprise Search” podría tener la clave para solventar estas limitaciones.