Google actualizó sus políticas de privacidad para aclarar que sus servicios que funcionan con Inteligencia Artificial (IA), como el chatbot Bard y Cloud AI, podrán ser entrenados con datos públicos que la empresa ha extraído de la web, según informó el portal Gizmodo.

En la más reciente actualización de su política de privacidad, lanzada el 1 de julio de 2023, Google explicó que "usa información para mejorar" sus "servicios y desarrollar nuevos productos, funciones y tecnologías que benefician" a los "usuarios y al público".

Según sostiene la compañía, para ello solo se sirve de "información públicamente disponible online", con la que entrenarán a varias de sus aplicaciones como Google Translate, Bard y también sus capacidades de IA en la nube.

"Nuestra política de privacidad ha sido transparente durante mucho tiempo en cuanto a que Google usa información disponible públicamente de la web abierta para entrenar modelos de lenguaje para servicios como Google Translate", declaró la portavoz de Google Christa Muldoon a The Verge.

Muldoon agregó que "esta última actualización simplemente aclara que también se incluyen servicios más nuevos como Bard. Incorporamos principios y salvaguardas de privacidad en el desarrollo de nuestras tecnologías de IA, de acuerdo con nuestros Principios de IA".

Sin embargo, en sus nuevas políticas de privacidad la empresa hace un cambio llamativo con respecto a las anteriores, puesto que aclaran que desde ahora podrán usar esa información en el desarrollo de "modelos de IA" en lugar de "modelos de lenguaje", algo que amplía sus posibilidades en cuanto a las herramientas que podrán entrenar con los datos recopilados.

Google recopilará información "pública" para el entrenamiento de sus modelos de IA.

Aunque la política actualizada especifica que la "información disponible públicamente" se utiliza para entrenar los productos de inteligencia artificial de Google, no aclara si la compañía evitará los materiales protegidos por derechos de autor, y aún no hay regulaciones de consenso internacional para la protección de datos que se encuentran al alcance de las grandes tecnológicas. 

Además, tampoco queda claro de qué manera se procesan esas grandes cantidades de información, y no solo por parte de Google sino también de sus competidores. OpenAI, empresa desarrolladora de ChatGPT, limita la información difundida sobre cómo se entrena su modelo grande de lenguaje (LLM, por sus siglas en inglés) para evitar entregarle datos a la competencia.

La puja por la "información pública" disponible en Internet

Estos cambios en las políticas de privacidad de Google se dan en un contexto en el que otras grandes compañías de Internet están cerrando las puertas de acceso a su información. En los casos de Twitter y Reddit, dos plataformas sociales que contienen grandes cantidades de información pública, sus directivos limitaron el acceso a sus API's exigiendo a quienes quieran usarlas a pagar.

Estos cambios anti-scraping han afectado negativamente las experiencias centrales de los usuarios de esas redes sociales.

Gannett, el editor de periódicos más grande de los Estados Unidos, está demandando a Google y su empresa matriz, Alphabet, alegando que los avances en la tecnología de IA han ayudado al gigante de las búsquedas a tener el monopolio del mercado de publicidad digital. Los productos como la versión beta de búsqueda de IA de Google también han sido denominados "motores de plagio" y criticados por privar de tráfico a los sitios web.