Creación dinámica de música 🎮 (y de datos)

El mundo de los videojuegos al igual que otras industrias tecnológicas tienen en su ADN la innovación y desarrollo contaste, pero en un modo mucho más acelerado y descontrolado por la búsqueda de la inmersión total y automatización de los millones de cosas que un videojuego necesita para existir. Todo esto sin contar los más habituales de segmentación publicitaria o gestión de la seguridad/trampas, claro.

El problema de estas ideas del millón es que no se piensa en cosas como “privacidad por diseño”, “privacidad por defecto”, “minimización”, “llamar al DPO”, “hacer lo contrario que Zuckerberg” o “¿en serio necesitamos tratar datos personales para esto?”, y la cosa acaba como acaba. De entre todas ellas hoy vamos a destacar la “creación dinámica de música de Sony“, porque, aunque por el mero concepto parezca inofensiva y alejada de los datos personales, lo cierto es que tiene su telita.

Todo lo que se comentará, salvo la valoración de protección de datos que supone, sale de la patente (PatentScope). Veremos en el futuro si esto se queda en papel o viene al mundo a dar guerra.

1) ¿En qué consiste este sistema de creación dinámica de música?

Como su propio nombre indica es un sistema automatizado que permite generar y asociar determinadas piezas de música a una serie de emociones para lograr una mayor inmersión en el jugador. Dicho así, no distaría mucho de una versión automatizada de lo que se hace en cine cuando el compositor es bueno y sabe crear una pieza en función a la emoción que le piden que transmita, pero se organiza en base a dos cositas “chulas”, o lo que es lo mismo, dos tratamientos de datos personales:

  • Un modelo powered by machine learning que generará una base de datos y correlaciones de información obtenida de varias fuentes: podcasts, webs, redes sociales, críticas y demás cosicas accesibles desde internet. Lo que viene siendo un data scraping potente (dejamos para otro día el tema de los metadatos y datos mixtos).
  • Un “opcional” perfilado del comportamiento y personalidad del jugador para atinar más en tu corazoncito que una flecha de Cupido.

Como una imagen vale más que mil palabras, aquí tenemos el esquema principal del funcionamiento de este tema según la patente:

2) Data Scraping o trincar datos personales de unos cuantos sitios

El primer paso que nos interesa desde el punto de vista datero es esta obtención de información de múltiples fuentes (en molón, “data scraping”) mencionada, por esa necesidad de alimentar al monstruo del machine learning para que haga este sistema fiable de catalogación y correlación de música y emociones asociables a cada pista. Aquí tenemos el esquema de esta fase para dar contexto y que se vea mejor:

Puede parecer algo habitual y que no afecta para nada a datos personales, por aquello de las fuentes accesible al público (ya no es un concepto tan molón que sirva como patente de corso, como ha descubierto Equifax por guantazo – explicado clarito en Twitter por Secuoya Group) y que realmente no se estén pescando datos personales, pero lo cierto es que, por un lado, hay datos personales en esas fuentes que estás recopilando (por no hablar de la propia voz en el caso del podcast) y por otro, y más importante para este sistema, es que la información que se utilice tiene que venir de gente identificada que realmente sepa de lo que habla. Luego podríamos hablar de si se anonimiza la información al recopilarla, aunque eso no quitaría tampoco que en un inicio estuviera tratando datos personales y que debamos comernos sin guarnición el RGPD hasta esa anonimización.

Asimismo, el trincar datos de la fuente solo podría hacerse si es algo permitido por la propia plataforma en sus términos y condiciones. Esto no es protección de datos, pero es bien importante para evitar problemas.

3) Perfilado del comportamiento y personalidad del jugador

El otro paso o tratamiento, que se encuentra casi al final del flujo del sistema, es ese perfil que nos permitiría conocer al jugador para hacerle llorar o reír con lo que escuche, y que nos mete en el proceloso mar del Big Data por la escala del sector de los videojuegos.

En lo que nos interesa, este perfil sería uno más que se añade a los que ya se llevan a cabo en los videojuegos de gran pastizal o triple A, junto con la necesaria comprobación en materia de seguridad y trampas, otros menos extendidos para lograr una mayor inmersión del jugador, o el siempre discutible perfilado con fines de segmentación publicitaria.

Aquí tenemos otro esquema de cómo se organizaría este perfilado del jugador, y en el que se menciona que al puchero se puede echar el historial de juego del jugador y una “matriz predicitiva”.

Este perfilado que sería totalmente automatizado, porque no queda otra para esto funcione a la escala que se necesita, podría tener un easter egg un poco desagradable ya que al jugar a perfilar la personalidad del jugador te podrías estar metiendo en datos de categoría especial al inferir fácil un perfil psicológico del jugador.

4) Análisis conjunto

Para no duplicar apartados o hacerlo muy confuso, lo más operativo es comentar diversos puntos de manera conjunta de estos dos tratamientos tan chachis con todas esas cosas que deberían haber supuesto alguna línea en los flujos y descripción de la patente.

Información previa y bien

En ambos casos toca información clara, concisa y previa. Del artículo 13 del RGPD para los jugadores previo al perfilado + info del perfilado, y del 14 (fuente y tipo de datos) para los entendidos en música por utilizar su sabiduría y datos sin habérselos pedido a ellos directamente.

Como la tentación es fuerte en internet la info debe ser previa a trincar los datos, y habrá que meter limitaciones para evitar que se vampirice más de la cuenta, como, por ejemplo, limitación la búsqueda a palabras claves concretas. Cuanta más ofrendas se pongan en el altar de la minimización de datos, más efectiva será la oración a las deidades de la protección de los datos en las ponderaciones de interés legítimo (o “LIA” en molón) y evaluaciones de impacto (o “PIA” en molón).

Legitimación

Llegando a uno de los puntos críticos en un tratamiento de datos personales, tendríamos, prácticamente una vía real para intentar justificar ambos tratamientos: el interés legítimo. Obviamente, el consentimiento sería practicable, pero por aquello de que te lo tienen que dar, ser libre y que pueden revocártelo en cualquier momento sin trabas, no pinta a la mejor solución.

Lo de hacerlo pasar por algo necesario para poder prestar el servicio al jugador (ejecución del contrato) tampoco tendría un pasar, ya que ni en Andromeda sería necesario estos tratamientos para prestar ocio electrónico del bueno.

Volviendo al interés legítimo, tocaría dejar oponerse previamente y meter un sistema de oposición para que el jugador te pueda mandar a freír espárragos, y la más crítica ponderación de la necesidad y proporcionalidad de esta creación dinámica de música en relación a los derechos y libertades de los jugadores, aportando garantías concretas y reales.

En la propia ponderación puede haber mambo del bueno, en atención a que tendría que justificarse un alcance seguramente global del data scraping, que el sistema en su conjunto afectará a todos los jugadores de Sony (mínimo PS5, y seguramente PS4), la total automatización del sistema porque no cabe otra, que este sistema sea necesario y no queda otra vía menos invasiva para lograrlo, y como último clavo, ese perfilado “opcional” del comportamiento y personalidad del jugador. Un follón.

¿22 o no? Esa es la cuestión

Tenemos un tratamiento totalmente automatizado de los de verdad, pero no caería dentro del cajón del artículo 22 del RGPD porque, a primera vista, no cumpliría con el otro requisito necesario: “produzca efectos jurídicos o significativamente similares sobre la persona….”. Cosa que si pasaría en aquel tratamiento enfocado a detectar y castigar al jugador que salta las normas con una expulsión temporal o definitiva (no te dejen acceder al servicio contratado).

Que no encaje en el artículo 22, no significa, como nos recuerda el EDPB en sus famosas directrices sobre decisiones automatizadas y perfilado, que no se le deba informar al jugador de que se va a llevar a cabo la elaboración de un perfil y de que se tomarán decisiones en base a el mismo.

DPO y evaluación de impacto

Delegado de protección de datos toca por narices al encajar en apartado b del artículo 37.1 del RGPD porque al igual que un Hospital, el tratamiento de datos personales es consustancial a lo que hace el responsable, en este caso, la filial de Sony especializada en videojuegos para que el jugador haga lo propio. El famoso: ” Las actividades principales del responsable requieran la observación habitual y sistemática de interesados a gran escala”.

Evaluación de impacto también, aunque en este caso habría que ir más a mirar el listado de supuestos sometidos a evaluaciones de impacto de la AEPD para sacar que cumple el mínimo de dos para asegurarla + tres adicionales de propina:

  • Tratamientos que impliquen perfilado o valoración que cubran varios aspectos de la personalidad o sobre los hábitos de la persona.
  • Tratamientos que impliquen el uso de datos a gran escala.
  • Tratamientos que impliquen la asociación, combinación o enlace de registros de bases de datos de dos o más tratamientos con finalidades diferentes o por responsables distintos (además del data scraping de los entendidos en música, no hay que olvidarse del historial de juego del jugador mencionada para meter en la mezcla).
  • Tratamientos de datos de menores de 14 años (sería muy extraño en el marco actual de los videojuegos que se restringiera a mayores de edad).
  • Tratamientos que impliquen la utilización de nuevas tecnologías o un uso innovador de tecnologías consolidadas.

La valoración se torna complicada con elementos problemáticos de justificar parecidos a los comentados en la ponderación del interés legítimo, y echando el resto en las garantías y medidas que se apliquen para que el sistema no sea lesivo. A título personal, la forma menos lesiva para hacer todo esto y conseguir que la gente se emocione con la música es contratar a Hans Zimmer y dejarle que haga su magia. 0% tratamiento de datos personales y 100% de éxito en tu cometido.

Datos de categoría especial

Como último rizo de la patente se deja caer la posibilidad de compatibilizar el sistema con sistemas biométricos que midan al jugador cosas como la frecuencia cardiaca o la respiración para darle el susto de su vida con la elección de pista de audio, por ejemplo. En este caso, más que una imagen de algún esquema toca la parte de texto de la ideaza:

Actualmente, esta posibilidad ya presente en otras patentes como mandos (biofeedback) no se lleva a cabo, pero de hacerse nos metemos en el jardín de las plantas carnívoras del artículo 9 por tratar datos biométricos con el problemilla de ver a qué excepción de este artículo nos agarramos (solo veo el consentimiento explícito) y valorar si se puede escapar por la excepción del 2.1 del RGPD o el debate de la identificación/verificación.

4) Conclusiones

  • Siempre hay más datos personales de lo que parece, principalmente, porque no nos paramos a pensar el follón legal que puede traer después y si se puede hacer algo sin necesidad de tratarlos.
  • El principio de privacidad por diseño y el DPO están para usarse. El DPO de Sony en Europa debe andar muy aburrido por Londres si no le llaman para estas cosas.
  • Las patentes las carga el diablo.