Muy probablemente, alguna vez hayamos intercambiado líneas con un chat automático, sobre todo en las primeras etapas de la interacción con servicios de ventas o bancos, que luego le pasa la posta a un empleado de la empresa. Algunas compañías más grandes, como encuestadoras, han implementado desde hace un tiempo, el mecanismo de llamadas telefónicas automatizadas, en las que una inteligencia artificial conduce el cuestionario y es capaz de interpretar las respuestas para redirigir el procedimiento. La semana pasada, Google anunció que pondrá esa posibilidad en manos de los usuarios de su sistema operativo para teléfonos, Android.
La idea, según anunció Sundar Pichai, director ejecutivo de Google, en el encuentro anual Google I/O 2018, que tuvo lugar del 8 al 10 de mayo en el Shoreline Amphitheatre (en la zona de San Francisco, Estados Unidos), es que los usuarios puedan usar este servicio de voz para agendar citas o reservar mesas de restaurantes y, en general, coordinar actividades que hoy día no ofrecen la posibilidad de hacerlo online.
El servicio todavía no se lanzó, pero ya tiene nombre: Google Duplex. El clip que la compañía hizo circular en la conferencia, en el que la voz que llama hace pausas, cambia de tono e intercala onomatopeyas –tipo “ahá” o “mhh”–, tal como haría una persona real, ha movido a los más entusiastas a afirmar que Duplex podría pasar el test de Turing (que, en resumidas cuentas, determina si es posible distinguir a una máquina de un humano). Parte de quienes lo dan por hecho, además consideran que si no se advierte que se está conversando con una máquina se incurrirá en un engaño.
En la base de este servicio conversacional, que Google viene preparando hace años, están los sistemas de reconocimiento de voces (ASR, automatic speech recognition) y de dictado (text to speech) que son organizados por una red neuronal recurrente, que analiza y aprende de conversaciones anónimas.