La discusión por la inteligencia artificial generativa está en todos lados. Desde que ChatGPT se lanzó al público masivo hace un año, la sigla IA se apoderó de todos los rubros en el mundo del trabajo. Sin embargo, los desarrollos de esta tecnología vienen desde hace tiempo y tienen a un protagonista omnipresente: el “transformer”.
“Es como una maquinita que va leyendo el texto, o cualquier secuencia, y va ‘aprendiendo’ cómo predecir el próximo elemento. Hace eso porque tiene una memoria de qué es lo que ya he leído, va aprendiendo las relaciones entre los elementos de la secuencia, entonces ahí se maneja con un modelo estadístico que “entiende” cuando ve ‘hola’ que es una posibilidad muy alta que siga ‘cómo estás’”, explicó a Clarín Freddy Boulton, ingeniero de software de Hugging Face, una de las empresas de IA más grandes del mundo.
Sin embargo, hay una discusión que se plantea en este ambiente y es el de la propiedad de los modelos: quiénes los hacen, bajo qué licencias y qué decisiones éticas. En este contexto, Hugging Face es “open-source”, o de código abierto, lo que significa que los más de 250 mil recursos que están disponibles en su plataforma se pueden usar de manera libre, pero bajo ciertos estándares de responsabilidades.
Para muchos, se trata del “Github del machine learning”, en referencia al repositorio de código fuente más grande de mundo, pero aplicado a la inteligencia artificial. En este contexto, la compañía participó de Media Party, una convención que se realiza desde hace 10 años, todos los años, para discutir la intersección entre medios de comunicación, tecnología y, este año, inteligencia artificial.
Boulton, cientista de datos, trabaja en la compañía desde hace un año y medio. Antes, trabajó en Aptiv en la ingeniería detrás de la conducción autónoma de vehículos. Habló con Clarín.
─La IA tiene una historia de varias décadas. ¿Por qué explotó este último año?
─Yo creo que tiene que ver con dos cuestiones: lo primero es que los modelos son mucho más poderosos que lo que eran hace unos años. La inteligencia artificial existe desde los años 50, pero antes era más un juguete, hacía cosas muy específicas. Ahora es mucho más fácil compartir estos modelos con gente no técnica.
─Hugging face se dedica al desarrollo del “transformer”. ¿Por qué es importante esto y qué desafíos representa?
─Cualquier secuencia se puede modelar con un transformers, de hecho, yo antes trabajaba en una compañía que hacía vehículos autónomos y el problema de qué decisiones tomar se puede ver como una secuencia de: primero acelerar, después cruzar, etc. Todo eso se puede moldear con un transformer. Desarrollar software no es lo más complicado, lo difícil es poder compartir los resultados para los que van a usar el modelo y para eso en general necesitás crear una página web con un API y ponerle un servidor para que todo el mundo pueda usar. Es un proceso muy complicado, muy manual y eso es lo que hacemos en Hugging Face. Muchos proyectos se mueren antes de ver la luz del día porque es muy difícil de compartir esos modelos, entonces de ahí es de dónde partimos: hacer que estos modelos sean muy fácil de compartir. El desafío es que la IA sea fácil de compartir.
─Y tu trabajo, en ese contexto, ¿cuál es?
─Yo trabajo en la parte de de crear y compartir demos de estos modelos de inteligencia artificial, entonces cuando vos ya tenés el modelo y lo querés compartir con tus usuarios o con la comunidad, ¿cómo hacés? Se puede crear un sitio web para lo que necesités en 5 minutos, y automáticamente lo puede usar cualquier persona del mundo. Desarrollamos, con un equipo de 9 personas, esa parte de la plataforma.
Hacia una IA “open source”
─¿Qué es un modelo abierto de inteligencia artificial?
─Un modelo abierto, por lo general, implica que la información que se utilizó para entrenar el modelo es abierta: todo el mundo puede acceder y analizarla. Cualquier persona la pueda bajar de internet y utilizar en su propia computadora. La contraposición es con un modelo cerrado, donde no sabés exactamente de dónde viene la data, ni qué modelo se aplica para que genere lo que está generando, sólo podés interactuar con el modelo de forma muy cerrada, como pasa con ChatGPT que sólo se puede usar una interfaz que propone la empresa (el chatbot, en este caso).
─¿Y por qué trabaja de manera abierta Hugging Face?
─Porque es importante para que la gente pueda evaluar sus decisiones, porque el desarrollo de la inteligencia artificial es un proceso muy humano, la crean humanos que, a fin de cuentas, toman decisiones acerca qué data incluir, cuál excluir, qué tanto, o sea, ¿cuándo paramos de entrenar al modelo? Esto impacta en los resultados y en el usuario. Si el proceso es abierto, la gente puede evaluar. ¿Qué es lo que se hizo y cómo mejorarlo? La inteligencia artificial se hace mejor si todo el mundo participa en su desarrollo.
─¿Qué pensás del “riesgo existencial” de la IA, es decir, la idea de que se vuelva contra su “creador”?
─Yo insisto en que lo más importante es que todos puedan acceder a estos modelos de inteligencia artificial, porque el colectivo es parte de la comunidad que desarrolla y evalúa estos modelos, el riesgo existencial disminuye mucho, porque el modelo está evaluado por todo el mundo.
─En cambio, la desinformación, los deepfakes, sí son un problema real.
─Sí, totalmente. Y si la gente está acostumbrada a usar modelos generativos open source, yo creo que va a ir desarrollando el ojo para poder distinguir entre una imagen real de una creada por inteligencia artificial. El usuario va desarrollando una intuición de qué es lo que pueden hacer estos modelos, que es lo que no pueden hacer. Hay que desarrollar estas cosas de manera abierta y democrática para disminuir ese ese riesgo. La respuesta siempre es que hay que trabajar en un ambiente abierto.
─En cuanto a los medios de comunicación, se debate por el periodismo generado por IA. Recientemente, el medio tech Gizmodo echó a toda su redacción en español para usar una (muy mala) traducción automática. ¿Qué panorama ves en el periodismo?
─Pienso que la IA es una herramienta para los periodistas y no lo veo como algo que va a reemplazarlos. Un artículo puede ser traducido por una IA, pero eso no significa que esté bien traducido, que se respete el sentido original. Siempre va a necesitar el toque humano para poder entender de lo que se habla, para agregar valor. Creo que la IA puede hacer a los medios más eficientes, pero no veo que vaya a reemplazar a los periodistas.
─Estas discusiones, además, se dan hoy en todo el mundo del trabajo.
─Claro que sí, en la programación por ejemplo. Hay sistemas que pueden escribir código y los programadores se preocupan, pero en realidad estás liberándolos de un trabajo tedioso: todos los trabajos tienen partes tediosas. A fin de cuentas, vas a necesitar un humano para poder distinguir qué es lo que en realidad queremos construir, tomar esas decisiones. El modelo no sabe lo que hay que construir, sólo obedece órdenes.
─El mes pasado Hugging face recibió una inversión de 235 millones de dólares. ¿En qué se invertirá?
─Queremos avanzar en la frontera de los modelos Open Source en inteligencia. Que todo el mundo pueda usarlos para combatir estos problemas de la desinformación del mundo actual, mejorar las condiciones de producción de la IA. Queremos darle poder a la gente para usar la inteligencia artificial. Y en cuanto a los medios, que me preguntabas, queremos que los periodistas y los medios entrenen modelos de inteligencia artificial. La inversión va a ir en ese sentido: crear nuevos equipos para aumentar lo que podemos hacer y contribuir a la sociedad.
─Si tuvieses que pensar una proyección, ¿en qué dirías que la IA le va a cambiar la vida a la gente?
─Bueno, yo creo que la inteligencia artificial va a ser una parte más de nuestras vidas. O sea, como antes un celular era algo que solo existía para unos pocos y ahora está en el bolsillo de todo el mundo, yo creo que va a pasar algún parecido con la IA y que ahora estamos en un modelo muy general pero que se va a tornar cada vez más específico y, como tal, más poderoso. Ahí aparecerán nuevos usos que no me animo a predecir, pero que ya estamos trabajando para hacerlos mejores y, a fin de cuentas, open source. Eso va a generar más habilidades y puede que sean herramientas indispensables de lo que hacemos todos los días.