Darío Gil, IBM Research: “Este año habrá el primer modelo de inteligencia artificial en español con casos de uso”

Darío Gil, vicepresidente de IBM y jefe de la división de investigación global de la compañía.

El cerebro humano es la estructura natural más compleja del universo conocido, con 86 mil millones de neuronas que transmiten 1.000 impulsos por segundo. Imitar sólo una parte de esa extraordinaria maquinaria biológica para aprender, comprender y responder en el español que hablan más de 500 millones de personas es la monumental tarea encargada por el Gobierno y en la que se ha embarcado el Barcelona Supercomputing Center (BSC) con su superordenador MareNostrum y la multinacional IBM, que pondrá a disposición del proyecto todo su potencial de programación, investigación e infraestructuras globales de inteligencia artificial.

Darío Gil, un murciano criado en Madrid que cumplirá 49 años en 2024, ha sido el principal valedor tecnológico de esta aventura al frente de la división de investigación global de IBM. Participa en esta entrevista poco después de firmar el acuerdo que dará lugar al primer gran modelo de lenguaje de inteligencia artificial nacido en español. Convencido de que este avance es exponencial y sólido -«una revolución», proclama-, apuesta por una arquitectura abierta y colaborativa donde quepa todo, desde las actas de las sesiones parlamentarias hasta la Real Academia Española o cualquier universidad o grupo de habla hispana. Estima que las primeras novedades podrán mostrarse este año.

Preguntar. ¿Por qué IBM apuesta por la inteligencia artificial en español?

Respuesta. Nuestro punto de vista sobre la inteligencia artificial nos permite alinearnos con la estrategia del Gobierno. Creemos firmemente que el futuro de la inteligencia artificial se creará y definirá a través de un ecosistema abierto y eso contrasta con otras empresas. Sucedió con los sistemas operativos hace más de 20 años y se hizo bien en su momento. Era una apuesta decidida a que el futuro de los sistemas operativos, tanto en la supercomputación como para todos los sistemas distribuidos en Internet, etc., se basaría en el código abierto. Hemos llegado a la misma convicción y la comunidad quiere participar en la creación de inteligencia artificial.

P. ¿Cómo será la participación?

r. Vamos a crear entornos colaborativos para desarrollar modelos fundacionales basados en código abierto donde haya transparencia en los datos que se utilizarán para el preentrenamiento y una metodología. Es muy importante ir aumentando la capacidad de los modelos de forma discreta y día a día. Los modelos fundamentales existentes requieren de seis a nueve meses de capacitación previa y versiones de lanzamiento una vez al año. Si tenemos un modelo base para toda la comunidad de desarrolladores, para todos los que quieran sumar conocimientos o capacidades, trabajaremos juntos para crear los mejores modelos fundacionales abiertos en español y los idiomas cooficiales.

Si hay burbuja es de catastrofistas, pero la base tecnológica de la inteligencia artificial es potente y sólida

P. ¿Cómo se va a desarrollar?

R. Desde un punto de vista informático, utilizaremos las capacidades existentes en el BSC. Con su MareNostrum existe el compromiso del ministro (para la Transición Digital, José Luis Escrivá) de seguir invirtiendo para acelerar la transición de MareNostrum 5 a 6. Por nuestra parte, aportamos centros de supercomputación dedicados a la inteligencia artificial y los últimos avances de Investigación de IBM.

P. ¿Cuáles son los sectores prioritarios a los que se dirige el modelo?

r. A todos, pero al Gobierno le interesa garantizar que se beneficien las pequeñas y medianas empresas, donde hay mayor inhibición o complejidad a la hora de adoptar este tipo de innovaciones, y la Administración del Estado. Hemos definido casos de uso para implementar la difusión de la inteligencia artificial en estos dos sectores.

El modelo utilizará datos públicos, pero existe el deseo de utilizar documentos que sean propiedad del Estado, lo cual es una cuestión muy singular e interesante. Las transcripciones de todos los debates del Parlamento son un ejemplo.

P. ¿Cuánto cuesta?

r. No hay una respuesta concreta. Pero, si sirve como aproximación, puedo decir que para crear un modelo fundacional de alto rendimiento se necesitan miles de unidades de procesamiento, cada una de las cuales cuesta al menos 35.000 dólares (32.300 euros). Son proyectos muy ambiciosos; No se trata de dos personas hablando una tarde y haciendo un PowerPoint. En IBM Research contamos con 3.600 científicos e ingenieros participando y nuestros propios equipos de supercomputación dedicados exclusivamente a la creación de modelos fundamentales. Y, al ser un sistema abierto, habría que sumar la comunidad de desarrolladores de habla hispana que quieran participar. Son esfuerzos que van en paralelo.

P. ¿De dónde vendrán los datos para alimentar el modelo?

r. Serán datos públicos, pero se quiere utilizar documentos que son propiedad del Estado, lo cual es un tema muy singular e interesante. Las transcripciones de todos los debates parlamentarios son un ejemplo. Pero también está prevista la colaboración de las bibliotecas nacionales y de la Real Academia Española. Serán datos que serán públicos.

Puedes pedirle al modelo respuestas acordes con la experiencia argentina y se comportará así, aprenderá del contexto desde el que se genera la interacción.

P. ¿Y cómo se salva la diversidad de hispanohablantes?

r. Desde el punto de vista matemático se pueden incorporar una gran diversidad de lenguajes. La diversidad está dentro de la misma red neuronal y luego, cuando la sintonia FINA (adaptación o mejora), se adapta, aunque haya sido entrenado con los documentos base, a las diferentes variaciones del español. Puedes pedirle al modelo respuestas acordes con la experiencia argentina y se comportará así, aprenderá del contexto desde el que se genera la interacción.

P. Pero “pedir una cita” en español puede no tener el mismo significado en algunos países latinoamericanos, por poner un ejemplo de un caso de uso administrativo.

r. El modelo base irá aumentando, especializándose y ganando habilidades con el esfuerzo de todos para que comprenda contextos específicos. El modelo de código abierto permite esta enorme diversidad. Y el objetivo es expandirlo tanto como sea posible, incluso a Brasil. Iberoamérica es un enorme mercado de oportunidades y es importante aprovechar la ventaja competitiva del español.

El objetivo es expandirlo tanto como sea posible, incluso a Brasil. Iberoamérica es un enorme mercado de oportunidades y es importante aprovechar la ventaja competitiva del español

P. ¿Cuándo estará disponible el primer modelo?

R. El objetivo es hacer algo este año y, en paralelo, desarrollar algunos casos de uso aproximadamente al mismo tiempo. En este mundo (de la inteligencia artificial), que es muy dinámico, a nadie le interesan plazos de años.

P. ¿Y qué gana IBM?

R. Daré el ejemplo de Red Hat (empresa multinacional de programación de código abierto cuya empresa matriz es IBM). Factura miles de millones de dólares anualmente y es la empresa más grande del mundo. software abierto. El modelo es facilitar el programa a empresas y gobiernos que luego querrán un mantenimiento o seguridad compatible con los equipos. Estamos acostumbrados a ese modelo de negocio. No lo hacemos porque seamos altruistas, sino porque creemos en ese modelo. Queremos socios estratégicos y hemos encontrado muchas resonancias en el Gobierno de España. En la alianza de inteligencia artificial que tenemos, hay más de 80 instituciones que hacen parte de este compromiso.

P. ¿Existe una burbuja de inteligencia artificial?

r. La tecnología en sí está evolucionando a una velocidad como nunca he visto hacerlo en nada más. Y ya no planificamos para uno o dos años, sino para dentro de un mes, semanas o días. No veo una burbuja. Si lo hay, es catastrófico, pero la base tecnológica es potente y sólida.

puedes seguir EL PAÍS Tecnología en Facebook y X o regístrate aquí para recibir nuestra boletín semanal.

Suscríbete para seguir leyendo

Leer sin límites

Más información

Darío Gil, IBM Research: “Este año habrá el primer modelo de inteligencia artificial en español con casos de uso” | Tecnología

Suscríbete para seguir leyendo

Rodrigo Benítez

Entrada siguiente

Pronóstico de condiciones secas para este martes en Honduras

Destacados

Entretenimiento

Top Esta semana

¿Qué diseñadores de moda dejaron huella en la historia?

¿Qué tendencias dominarán este año?

Guía completa de estampados en moda

El creador de One Piece ocultó en el mar el secreto clave de su historia. Así reaccionaron los fans

Mapa del Sitio

Chief Editor

Johny Watshon

Quick Links

Suscríbete para seguir leyendo

Rodrigo Benítez

Puede que te guste

Destacados

Entretenimiento

Top Esta semana

Mapa del Sitio

Chief Editor

Johny Watshon

Quick Links