Alexa siempre está escuchando pero no graba nuestra voz continuamente. Usamos Alexa para recetas, juegos y todas las habilidades conectadas al hogar inteligente, pero esto significa que Punto ecológico no envía ningún dato a los servidores de la nube hasta que te escucha decir la palabra de activación. Sepa, sin embargo, que escuchar palabras para despertar a Alexa es mucho más difícil de lo que piensas.
El hardware de los distintos modelos de Amazon Echo no es tan inteligente: cualquier pregunta o petición que quieras realizar sin conexión a Internet quedará sin respuesta. Esto sucede porque los comandos que le das a Alexa se envían a la nube para que sean interpretados. Amazon no quiere que se graben todas las conversaciones entre usted y el altavoz inteligente, sino solo las órdenes que le da al asistente de voz. Por eso se utiliza la palabra de activación para llamar la atención de Alexa. Para ello, Amazon utiliza una combinación de micrófonos optimizados, un búfer de memoria corto y entrenamiento de redes neuronales. Sin embargo, nuestro consejo es seguir algunos consejos para mejorar la seguridad de Alexa.
Los micrófonos optimizados detectan tu voz
Normalmente, los altavoces asistentes de voz (como Echo y Echo Dot) vienen con varios micrófonos integrados. El Echo Dot, por ejemplo, tiene siete micrófonos múltiples. Y gracias a esta última característica en particular, el altavoz inteligente es capaz de detectar de forma útil la palabra de despertador.
Además, con sus múltiples micrófonos, Echo puede identificar su ubicación en la habitación y escuchar en esa dirección particular mientras ignora los sonidos del resto de la habitación. Puedes «experimentar» esta increíble característica haciendo un experimento: párate al lado de tu dispositivo y di la palabra de activación. Notarás que el Echo Dot se vuelve azul oscuro, luego azul claro mientras intenta determinar tu ubicación, luego la pequeña luz se enciende donde estás. Ahora ve a un lado y di la palabra de activación una vez más. ¡Observa cómo se encienden las luces azules donde estás! Saber dónde estás ayuda al dispositivo a enfocarse mejor y eliminar el ruido de otras áreas de la habitación.
La memoria corta evita que el hablante almacene demasiada información
I Dispositivos de eco están equipados con mucho almacenamiento pero no lo usan por completo. Según Rohit Prasad, vicepresidente de Amazon y científico jefe de inteligencia artificial de Alexa, un Echo sólo puede almacenar físicamente unos pocos segundos de audio.
Al reducir la capacidad de almacenamiento, Amazon no está solo ofrece mayor privacidad a los usuarios, pero también evita que Echo escuche conversaciones completas y limita su atención a buscar solo la palabra desencadenante. En concreto, Alexa graba continuamente pero, al mismo tiempo, borra todo lo que acaba de grabar. Por lo tanto, tiene una “capacidad de atención corta”, lo que significa que todo lo que realmente puede oír es la palabra desencadenante y no mucho más. Sin embargo, tres segundos son suficientes para que esa palabra sea registrada, examinada y manejada adecuadamente.
El entrenamiento de redes neuronales ayuda con la coincidencia de patrones
Amazon le enseñó a Echo a responder constantemente a sus solicitudes a través del entrenamiento de redes neuronales. Al igual que con otras formas de aprendizaje automático, Amazon «entrena» y mejora sus algoritmos alimentándolos solicitud tras solicitud y, por lo tanto, cada vez que se pronuncia la palabra desencadenante. De esta manera, Amazon quiere abarcar (y comprender) no sólo cada inflexión y acento sino también el contexto en el que se pronuncia la frase de activación. Al final, Amazon quiere que tu asistente de voz reconozca el momento en que hablas «con él» desde el momento en que hablas «sobre él»¡incluso si estás hablando con una persona llamada Alexa! Los micrófonos direccionales ayudan a los oradores a lograr este extraordinario y ulterior objetivo.
Los algoritmos que componen Alexa también están diseñados para excluir falsos positivos y buscar sonidos similares a la palabra desencadenante. Cuando el dispositivo decide que efectivamente ha escuchado la palabra de activación, comienza a grabar y transmitir el audio a los servidores en la nube de Amazon. En concreto, Amazon utiliza cuatro algoritmos: uno para cada palabra de activación (Alexa, Computer, Echo) y otro para Alexa Guard que, te recordamos, se activa con sonidos específicos, como el sonido de un cristal rompiéndose.
Por último, el dispositivo también es capaz de realizar controles mucho más complicados. ¿Has notado que cuando alguien dice la palabra Alexa en la televisión, el dispositivo generalmente no responde? Esto se debe a que Amazon también realiza una auditoría en la nube.
Las comprobaciones en la nube excluyen algunos falsos positivos
Cuando las empresas producen comerciales sobre Alexa, pueden enviar el audio comercial a Amazon. La empresa gestiona el audio basándose en algoritmos con un patrón similar al que utiliza el dispositivo para identificar la palabra de activación. La solicitud de la empresa es catalogada y agregada a la base de datos.
Echo comprueba esta base de datos cada vez que escucha la palabra de activación. Cuando coincide con el audio en la base de datos, Los algoritmos de Amazon le indican a Echo que ignore la palabra de activación y descartar cualquier audio grabado.
Al mismo tiempo, Amazon también comprueba si hay solicitudes simultáneas de palabras habladas. No todas las agencias de publicidad envían contenidos de audio a Amazon, por lo que se buscó otra solución. Después de buscar una coincidencia en la base de datos, Amazon compara la «huella digital» de la palabra desencadenante con todas las demás instancias que llegan al mismo tiempo. Es muy poco probable que dos personas que digan «Alexa» al mismo tiempo tengan exactamente la misma voz y tono. Entonces, si hay una coincidencia, Amazon sabe que probablemente sea un anuncio o un programa de televisión y le dice a Alexa que ignore la solicitud.
En cualquier caso, a pesar de todos los controles realizados por Amazon, siguen siendo resultados falsos positivos. Puedes escuchar lo que tu Echo ha grabado yendo a la sección Privacidad de Alexa de la aplicación o accediendo a la página Privacidad de Alexa.
¡Seguro que encontrarás al menos un falso positivo en el conjunto de audio grabado! Pero recuerda, la tecnología mejora constantemente y en un futuro no muy lejano es posible que podamos utilizar Alexa sin tener que decir la palabra inteligente. ¿Sabías que puedes usar las habilidades de Alexa para dormir mejor?