Hay varias formas de controlar la tecnología que nos rodea. Lo más destacado en este momento es el toque o un control remoto. Sin embargo, los comandos de voz también están ganando terreno poco a poco, ya que es una forma fácil e intuitiva de obtener respuestas a su consulta, solicitar a los dispositivos inteligentes que realicen una tarea y más. Sin embargo, la tecnología aún se está perfeccionando y, para avanzar un poco más, Google ha creado una nuevo sistema ligero llamado VoiceFilter Lite.
VoiceFilter-Lite: tamaño pequeño, grandes mejoras
Google utiliza el reconocimiento de voz en numerosas aplicaciones como Google Maps, Assistant, Translate y otras. Estas aplicaciones usan el sistema VoiceFilter, que se lanzó en 2018. Este sistema se destaca por lograr una mejor relación fuente a distorsión (SDR), que ayuda a reconocer la voz de manera eficiente, en comparación con los enfoques convencionales. Si bien el modelo funciona, funciona en la nube, ya que está restringido por las limitaciones de hardware de un dispositivo.
Google pensó que sería más rápido y eficiente si este sistema pudiera funcionar en un dispositivo, incluso sin conexión. Por lo tanto, se creó VoiceFilter Lite. El sistema más ligero está destinado al uso en el dispositivo para mejorar significativamente el reconocimiento de voz en el habla superpuesta. Lo hace al reconocer la voz registrada de un hablante seleccionado, que es básicamente una coincidencia de voz de un usuario registrado. El nuevo sistema debería ser capaz de identificar y trabajar con la voz de un usuario incluso en condiciones de ruido 'extremadamente', incluso cuando la conexión a Internet no está disponible.
Un modelo VoiceFilter-Lite de 2.2 MB fue probado por Google, que afirma que pudo ofrecer una mejora del 25.1 % en la tasa de error de palabras (WER) en el habla superpuesta. WER es una proporción para medir la cantidad de palabras que un modelo es capaz de reconocer a partir de una declaración de referencia.
Próximamente se admitirán más idiomas
Con el nuevo modelo VoiceFilter-Lite, las aplicaciones podrían mejorar considerablemente en la captura de sus comandos de voz. Además, también debería ayudar con un procesamiento de consultas más rápido, ya que funciona sin conexión.
Si bien el nuevo VoiceFilter-Lite parece estar brindando resultados prometedores, actualmente solo funciona con el idioma inglés. Google trabajará para adoptar el modelo para trabajar también con otros idiomas. Además, Google intentará optimizar directamente la pérdida de reconocimiento de voz que ocurre durante el entrenamiento de VoiceFilter-Lite. Esto podría ayudar potencialmente a mejorar aún más el reconocimiento de voz más allá del habla superpuesta.
Créditos de la imagen: Google