Control de voz mejorado con asistentes específicos

Control de voz mejorado con asistentes específicos

La computación en la nube proporciona recursos casi ilimitados para tareas de reconocimiento de voz. Es por eso que Alexa, Siri y los asistentes de Google hacen un trabajo tan bueno entendiendo el habla humana.

Sin embargo, se espera que estos asistentes de voz entiendan una amplia variedad de solicitudes, como “¿Qué tiempo hace?”, “Poner música”, “¿Quién ganó las elecciones?”, “¿Cuándo es mi próxima cita?”, “Apagar las luces, “Establecer un temporizador “,”¿A qué hora es el partido?”, y así sucesivamente.

AI Generalistas y Especializadas

Dado que los asistentes basados ​​en la nube deben atender una amplia gama de solicitudes, son “generalistas” por diseño y no pueden igualar las soluciones de voz de precisión adaptadas para dominios específicos, “especializados”.

Un reciente informe de evaluación de producto de Vocalize.ai muestra que una solución integrada específica de dominio puede proporcionar un reconocimiento de voz más preciso y una comprensión del lenguaje natural que un asistente general basado en la nube.

  Un mundo sin contacto: nuevas oportunidades para la voz

El informe de evaluación del producto comparó la tasa de finalización de tareas de dos hornos de microondas habilitados para voz, uno de ellos es un horno de microondas de Amazon Basics con control de voz basado en la nube (generalizado) suministrado por AVS y el otro un horno de microondas de Midea con dominio específico ( especializado) de control de voz sensorial.

Cada dispositivo se presentó con 40 expresiones de voz, todas relacionadas con las funciones de cocción en horno de microondas. Los hornos de microondas se puntuaron según lo bien que completaron las tareas solicitadas.

La solución sensorial completó el 93% de las tareas solicitadas y la solución de Amazon completó sólo el 55% de las tareas.

Entrenado, afinado y ponderado

En la comparación anterior, está claro que el horno de microondas sensorial es un “especialista” que puede comprender y ejecutar comandos de cocción con mayor precisión que la solución “generalista” de Amazon.

Al igual que esto se hizo para el horno de microondas, Sensory también ha creado modelos específicos de dominio que admiten transmisión de medios, pedidos de alimentos, controles de cámara, ejercicio / ejercicio e incluso un barista virtual.

  Inteligencia Artificial de Alibaba lee mejor que un humano

Para demostrar los beneficios de un asistente de dominio específico, puede ser útil compartir algunos ejemplos específicos de la comparación del horno de microondas.

En este ejemplo, es más probable que se encuentre “chocolate derretido” dentro del dominio del horno microondas, y el modelo de lenguaje entrenado por Sensory lo reconoció correctamente y comenzó la función de preparación. El modelo general de Amazon decidió “chocolate con leche” y esto no implica que el microondas de Amazon tome medidas.

Prueba de expresión: Derretir chocolate, 8 onzas por favor.

  • Resultado sensorial: Derretir chocolate, 8 onzas por favor.
  • Resultado de Amazon: Leche chocolate, 8 onzas por favor.

Una experiencia similar ocurrió con la palabra “deshielo”. El modelo de lenguaje entrenado y ajustado por Sensory reconoce correctamente la palabra “descongelar” e inicia la función de descongelamiento. El modelo general de Amazon reconoció incorrectamente el comando como “pausa”.

  Alexa hace más inteligentes los Lamborghini

Prueba de expresión: Descongele el salmón durante 5 minutos.

  • Resultado sensorial: Descongele el salmón durante 5 minutos.
  • Resultado de Amazon: Pausa salmón por 5 minutos.

En el ejemplo final y más notorio, el horno de microondas Amazon ignoró la orden de “dejar de cocinar”. Reconoció “comenzar a cocinar” y ejecutó el comando, pero no retiene el contexto para ejecutar un comando “detener la cocción”.

Prueba de expresión: Deje de cocinar.

  • Resultado sensorial: Acción tomada = deja de cocinar.
  • Resultado de Amazon: Acción tomada = continúa cocinando.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

diez + 13 =