La IA generativa ‘rescata’ a los asistentes de voz

21 de junio de 2024 Gustavo Genez

La Inteligencia Artificial generativa llegó para revolucionar el panorama de la tecnología y una de las consecuencias que no se preveían en el panorama especializado era el rescate de los asistentes virtuales.

Apple retoma la tendencia La semana pasada, Apple anunció todas las funciones de Apple Intelligence y entre las herramientas que destacó fue su integración de Siri, el cual tendrá una renovación completa, que va desde su logo hasta sus funcionalidades, que estarán atravesadas por la naturalidad, relevancia y personalización, pues tendrá conversaciones en tiempo real e incluso contará con la capacidad de mantener el contexto de la plática. Si el usuario menciona un detalle que quedó atrás en la conversación, la herramienta lo “recordará”. También será capaz de hacer cosas como mostrar fotografías de una persona en especial, editar imágenes o enviar artículos por correo electrónico.

La herramienta también tendrá la facultad de identificar detalles en documentos que el usuario tenga en su dispositivo. Por ejemplo, tomar el número de identificación de la licencia para conducir.

Google continúa con su Asistente En febrero, Google lanzó su app Gemini para teléfonos inteligentes Android y desde entonces es posible utilizar el asistente de voz con todas las capacidades de su IA, incluso desde comandos como “Hey, Google”. Con este agregado, el Asistente es capaz de entender diferentes peticiones para simplificar ciertas tareas, como encontrar un restaurante, hacer una reservación y, después a partir de una nueva petición, solicitarle que sugiera lugares a visitar cercanos a ese mismo restaurante. Con la herramienta también es posible programar temporizadores, hacer llamadas y controlar tus dispositivos domésticos inteligentes. En el futuro se espera una incorporación del Project Astra, que es un modelo multimodal que podrá reconocer objetos en imágenes, videos y audios para dar una respuesta contextualizada en tiempo real.

OpenAI, la innovación en IA El mes pasado, la startup sensación de la IA generativa, OpenAI, anunció el lanzamiento de su modelo GPT-4o, el cual es capaz de aceptar cualquier combinación de texto, audio e imagen, y generar cualquier combinación de salidas de texto, audio e imagen. Una de las características más importantes es que este modelo se ofrecerá de forma gratuita, en contraste con los modelos anteriores de la empresa, además de ser «mucho más rápido». En este caso, las exploraciones de capacidades son diversas e incluyen desde narrativas visuales hasta juegos como «piedra, papel o tijera». Además, también tiene alto rendimiento y velocidad en inteligencia de texto, razonamiento y codificación, estableciendo nuevos estándares en capacidades multilingües, de audio y visión.
Samsung quiere que Bixby renazca En febrero, tras el lanzamiento de los dispositivos Galaxy S24, Samsung anunció la incorporación de la IA a su asistente Bixby,el cual tiene diferentes aplicaciones, como traducir en tiempo real, además de crear de resúmenes de páginas web, corregir la ortografía y organizar archivos con portadas de notas automatizadas. En este caso, un aspecto importante es que desde que se lanzó el dispositivo las funciones de IA se aplicaron a todos los idiomas con los que funciona el asistente: chino, inglés (Estados Unidos, Reino Unido e India), francés, alemán, italiano, coreano, portugués (Brasil), español (España) y español (América Latina).
Alexa pendiente y Cortana descontinuada A mediados de 2023, Amazon anunció que se subía a la era de la IA generativa, pero hasta ahora todas las funciones que se mostraron en aquel entonces aún no están disponibles a nivel mundial. Por ejemplo, la empresa reveló una función llamada Character.ai, con la cual se podrá chatear con muchas personas famosas a través de un chatbot, esto incluye a personas vivas, que sean parte de la historia o bien personajes de ficción. La compañía resaltó otras herramientas para personas que viven con una discapacidad a partir de dispositivos basados en IA como Eye Gaze, cuyo objetivo es manejar la pantalla de las tabletas de la marca únicamente con los ojos sin la necesidad de utilizar la voz o las manos en ningún momento. No obstante, estas funciones han tardado para estar disponibles. Por otra parte, Windows anunció el retiro de su asistente de voz a partir de la primavera de 2023, una decisión que no gustó entre los usuarios de la empresa, pues fue parte relevante de la identidad del sistema operativo. En sustitución, Microsoft ha motivado el uso de otra herramienta, Copilot, la cual está basada en ChatGPT.

]]>

Comparte esto:

Gustavo Genez

También te puede gustar

ChatGPT y Grok desplazan a TikTok e Instagram, al menos en EU

Los nuevos operadores se estancan en los smartphones de gama media

Las aplicaciones móviles ocultas son la mayor amenaza de malware