Si usas el reconocimiento de voz en tu teléfono inteligente, seguro sabrás que no funciona si no estás conectado a internet. Esto es así porque el procesamiento de las señales de voz no ocurre en el teléfono, sino en servidores remotos: hacerlo localmente gastaría mucha energía, memoria y recursos de procesamiento en un smartphone.
Sin embargo, un equipo de ingenieros de Google dio a conocer este martes un artículo académico en el que explican cómo lograron correr un programa de reconocimiento de voz que se ejecuta localmente en un Nexus 5, como informó ZDNet.
Según el documento, el software logra procesar comandos de voz siete veces más rápido que en tiempo real en humanos, con una tasa de errores del 13,5% y una ‘huella’ en la RAM del dispositivo de solo 20,3 MB, una medida muy inferior a la que consumen muchas de las apps más populares.
La mayoría de aplicaciones consumen más RAM
Esto fue posible gracias a que se implementaron algoritmos de inteligencia artificial en el código de la aplicación de reconocimiento de voz, que le permitieron aprender a predecir lo que decía el usuario y así no procesar la totalidad de los sonidos. También usaron algoritmos de compresión para reducir el ‘peso’ de los archivos de audio, y añadieron al modelo la información local del teléfono, como la agenda de contactos o el calendario, para hacer posible que se le pudiera dar órdenes al dispositivo por medio de comandos de voz.
Para entrenar el algoritmo, Google usó 2.000 horas de tráfico de voz anónimo de Google hecho por usuarios reales, y tomó patrones de ruido tomados de videos de YouTube. El software tiene un vocabulario de 64.000 palabras.
Esto último es crucial. Servicios como Google Now dependen del procesamiento de voz, y tecnologías como esta hacen posible y viable utilizarlo sin conexión. En lugares donde las redes de datos son muy costosas o no muy confiables, un software como este puede ayudar a mejorar la experiencia con teléfonos inteligentes, especialmente a personas con discapacidad.
Este es solo uno más entre los avances en inteligencia artificial logrados por Google recientemente. En campos que van desde el reconocimiento de imágenes hasta el juego de Go, la empresa californiana está invirtiendo bastante y consiguiendo resultados notables en algoritmos. Algunos de ellos tienen un destino claro en productos de la compañía, como Google Photos, y otros solo nos dan pistas de lo que la empresa está pensando para el futuro.
Imagen: Howard Dickins (vía Flickr)