Los días de Bard están contados. Fue presentado hace sólo un año de forma apresurada como respuesta a la aparición de ChatGPT, de OpenAI, para ofrecer una alternativa de respuesta conversacional automática. Pero era sólo un modelo que acababa de salir de los laboratorios de Google, donde se ha seguido desarrollando el sistema que aspira a ser definitivo: Gemini. Este jueves, la multinacional anunció que Bard se convierte en Gemini y que está disponible en la web y en aplicaciones móviles con sistema Android y también con iOS (Apple). En una primera etapa sólo tiene versión en inglés y se ampliará a idiomas asiáticos (primero en japonés y coreano) y, posteriormente, al español. Las versiones de pago permitirán su uso en herramientas de trabajo habituales como documentos o correos electrónicos.
Durante años, Google ha liderado el mercado de búsquedas en Internet. Pero OpenAI dio un giro al sistema desarrollando un modelo de inteligencia artificial, ChatGPT, que ya no solo proporcionaba sitios web que, más o menos correctamente, incluían información relacionada con la búsqueda. El nuevo bot (un programa automatizado con respuestas a instrucciones específicas que imita el cerebro humano) era capaz de resumir y expresar sus propias soluciones, capacidad que se introdujo rápidamente en todos los ámbitos, desde las tareas escolares hasta la programación, pasando por las consultas cotidianas. a los procesos industriales.
La amenaza del mercado hegemónico de Google provocó una respuesta apresurada y hace un año Bard se encontró con una marca de nacimiento de provisionalidad. Este jueves se confirmó y la modelo ahora pasa a ser Géminis. El nuevo sistema pretende ser no sólo un sustituto del buscador, sino también, según Sissie Hsiao, vicepresidenta de Google, “un auténtico asistente de inteligencia artificial, conversacional, multimodal y más útil que nunca”.
La directiva de la empresa resume que la nueva aplicación proporciona respuestas a preguntas escritas u orales y también interactúa con imágenes. Pasará a ser el asistente principal del teléfono, al que se podrá acceder mediante un nuevo atajo o mediante el conocido comando de voz (Hola Google) o mediante los atajos del terminal. Las conversaciones se pueden mantener y retomar desde el mismo teléfono móvil o desde el ordenador de sobremesa.
Asistente
“Puedes generar un título basado en la foto que has tomado o estás leyendo un artículo y la aplicación te permite no sólo comprender el artículo más profundamente sino también hacer preguntas al respecto. Muchas funciones de Google Voice estarán disponibles a través de la aplicación Gemini, incluida la configuración de temporizadores, la realización de llamadas y el control de dispositivos domésticos inteligentes”, explica Hsiao.
Estas aplicaciones estarán disponibles para los usuarios de Google, pero el momento de la Todo gratis ha llegado a su fin y la empresa pretende monetizar los sistemas más completos desde el principio. De esta forma, según Sundar Pichai, director ejecutivo de la compañía, la versión Gemini Advanced, que estará disponible mediante suscripción, «es más capaz de razonar, seguir instrucciones, codificar y colaborar creativamente». “Por ejemplo”, añade, “puede ser tu tutor personal y adaptarse a tu estilo de aprendizaje. O pueden ser un socio creativo y ayudarlo a planificar una estrategia de contenido o crear un plan de negocios”.
Esta versión avanzada, tal y como anunció durante su presentación y recuerda ahora Pichai, “utiliza una combinación de 57 materias, entre ellas matemáticas, física, historia, derecho, medicina y ética, que ponen a prueba tanto los conocimientos como la capacidad de resolución de problemas”.
Gemini Advanced estará disponible a través del nuevo plan Google One AI Premium y, con la suscripción, compatible con hasta cinco usuarios, se podrá utilizar con Gmail, Docs, Sheets, Slides y Meet. Incluye soporte técnico, edición de imágenes profesional, recomendaciones y acceso temprano a funciones de prueba. La oferta inicial en Estados Unidos supone, para los suscriptores Premium existentes, una cuota de 10 dólares (9,28 euros) más al mes.
La versión Duet AI, más orientada a empresas y desarrolladores, se convertirá en Gemini para Google Workspace y Google Cloud. Este último modelo cuenta con capacidades específicas para la gestión de procesos, desarrollo de programas y protección contra ciberataques, según la compañía.
ChatGPT 5
La maniobra empresarial de Google se produce en respuesta a la intención de OpenAI de lanzar la quinta versión de ChatGPT este año, según afirma el director ejecutivo de la compañía, Sam Altman, que ha adelantado algunas de sus funciones en el podcast de Bill Gates.
El bot pretende avanzar en precisión, personalización y capacidades multimodales, por lo que la interacción será con todo tipo de archivos de texto, numéricos y audiovisuales, por separado o juntos.
De esta forma, ChatGPT5 pretende ofrecer una conversación más fluida y natural, con capacidades para comprender el contexto del usuario, aportar capacidades más creativas y ganar seguridad ante posibles usos maliciosos.
Para conseguirlo, los modelos de lenguaje se han ampliado para la formación y se han programado para aprender de la interacción con los usuarios. Entre sus usos más habituales, la compañía adelanta que permitirá ofrecer servicios de atención personalizada, incorporarse como herramienta educativa o de entretenimiento e incorporarse a tareas de gestión empresarial.
puedes seguir EL PAÍS Tecnología en Facebook y X o regístrate aquí para recibir nuestra boletín semanal.



