Con solo 2,2 MB, la nueva tecnología de filtrado de voz de Google es perfecta para aplicaciones móviles


Google tiene muchas aplicaciones en su teléfono que usan la detección de voz desde el Asistente de Google hasta Google Translate y la ingeniosa aplicación de grabación de Pixel. Sin embargo, uno de los desafíos que enfrentan estas aplicaciones es separar su voz de otras personas o del ruido de fondo.

Para superar estos desafíos, el equipo de inteligencia artificial de Google ha creado un nuevo modelo ligero llamado VoiceFilter-lite. En 2018, el equipo dio a conocer el primer VoiceFilter modelo que utilizó la tecnología Voice Match de la empresa. Se usa en el Asistente de Google para analizar su voz y sonido cuando se inscribe en un servicio.

Muchas veces, para reconocer las voces de manera eficiente, técnicamente, lograr una mejor relación fuente / distorsión (SDR), se necesita un modelo con un tamaño grande, una potencia de CPU prominente y un consumo de batería.

Es por eso que el equipo de Google ideó el modelo VoiceFilter-lite que tiene un tamaño de solo 2,2 MB, lo que lo hace adecuado para toneladas de aplicaciones móviles livianas.

Utiliza la voz ya registrada de un usuario y mejora el reconocimiento incluso cuando hay voz superpuesta. Google afirma que el modelo mejora el reconocimiento en un 25% tasa de error de palabra (WER) – una razón utilizada para medir cuántas palabras reconoce un modelo de la oración de referencia

Una ventaja de este modelo es que no necesita incluirlo en su modelo de reconocimiento de voz. Por lo tanto, si la voz de un orador no se registró previamente, su aplicación puede omitir VoiceFilter-Lite y continuar con los comandos de reconocimiento. Esto también ayuda si un usuario registrado desea enviar algunos comandos a un asistente digital en modo incógnito.

Para los próximos pasos, los investigadores intentarán aplicar este modelo para otros idiomas además del inglés. Además, quieren mejorar el reconocimiento de voz directo para que el modelo se pueda usar para algo más que reconocer voces de discursos superpuestos.

Puede leer más sobre VoiceFilter-Lite aquí


Source: The Next Web by feedproxy.google.com.

*The article has been translated based on the content of The Next Web by feedproxy.google.com. If there is any problem regarding the content, copyright, please leave a report below the article. We will try to process as quickly as possible to protect the rights of the author. Thank you very much!

*We just want readers to access information more quickly and easily with other multilingual content, instead of information only available in a certain language.

*We always respect the copyright of the content of the author and always include the original link of the source article.If the author disagrees, just leave the report below the article, the article will be edited or deleted at the request of the author. Thanks very much! Best regards!