Peritaje IA

Inteligencia Artificial y asistentes virtuales

Inteligencia Artificial y asistentes virtuales

Gracias al empuje de la nueva Inteligencia Artificial (IA), la experiencia con el cliente ha dado un vuelco gigantesco. Si bien todos los expertos en usabilidad, ingenieros del software e interfaz de usuario buscaban la forma de optimizar la navegación, permitiendo un fácil acceso a la información en un mínimo número de clics. Minimizando, de este modo, la memoria a corto plazo del cliente en base a un histórico de selecciones y navegación anteriores. Hoy en día, lo que se busca es que el sistema sea capaz de identificar sus intenciones, reconocer sus sentimientos, recordar sus gustos y generar recomendaciones ante cualquier necesidad de éste. Guiándolo tanto en la realización de sus tareas diarias, como en la selección y compra de un producto y/o servicio. Estos nuevos sistemas llevan consigo un módulo de IA capaz de dar respuesta a aquellas necesidades del cliente bajo un nuevo interfaz en donde la voz, la síntesis, el reconocimiento y procesamiento de lenguaje natural (PNL) es la parte fundamental de dicho interfaz de usuario.

Los constantes avances en los sistemas de reconocimiento de lenguaje natural (PNL) y generación de lenguaje natural (GNL) junto a la evolución y penetración de los teléfonos inteligentes en la sociedad, ha recabado en la proliferación de los denominados Asistentes Virtuales (VA por su siglas en ingles). Estos VA permiten interactuar con el usuario de forma como lo harían dos humanos, mediante no tan solo comandos de voz como los anteriores sistemas de preguntas y respuestas en un tema definido (FAQ´s). O la marcación por voz que aparecía en los antecesores al smartphone. Sino entablando una conversación que cuanto menos, puede ser inteligible para aquellos. Por tanto, en estos nuevos sistemas, la voz pasa a ser el activador con el cual controlar y gestionar un conjunto de tareas cada vez más complejas.

Pero la rápida aceptación y penetración de estos VA en la sociedad y los negocios está provocando la aparición de ciertos problemas éticos que ya vienen siendo una tónica en el uso de la IA tanto en el ámbito social como empresarial.  Una de las principales controversias que se están debatiendo es si los VA simplemente se deben emplear como una ayuda o soporte a las tareas y procesos internos. O permitir que actúen sin intervención humana, remplazando a estos cuando sea posible. En este último caso, los VA se complican ya que deben de mantener un conocimiento extra sobre las costumbres, cultura y valores de las diferentes sociedades. Y de este modo saber cómo actuar ante cualquier dilema ético con el que pude encontrarse ya sea mediante reglas éticas de comportamiento o mediante un módulo de inferencia que sepa mediante algoritmos identificar estos dilemas éticos y actuar en consecuencia acorde a las costumbres y valores del lugar en el cual se utiliza el VA. Inteligencia Artificial y asistentes virtuales

Inteligencia Artificial y asistentes virtuales

Podemos definir un Asistente Virtual (VA – Virtual Assistant-) como un componente de software capaz de interactuar con el usuario a través de conversaciones en lenguaje natural. Capaz de reconocer la voz del usuario, procesarla e interpretarla tal como lo haría un humano. Por lo general, los VA son una evolución de los chats y más recientemente los chatbots orientados hacia la construcción de FAQ (Frequently Asked Questions) interactivas, que mencionamos en artículos anteriores. Siendo utilizados por las empresas como soporte  post-venta y atención al cliente, mejorando sustancialmente su experiencia y estableciendo nuevos canales de comunicación más personalizados por los cuales puede acceder a los servicios de la empresa. Estos VA de primera generación están diseñados para implantarse tanto en altavoces inteligentes como en teléfonos de última generación o aparatos electrónicos que permitan la intercomunicación a través de la voz como es el caso de los automóviles.

Como hemos indicado, la principal característica de los VA es el reconocimiento y comprensión del lenguaje natural en múltiples idiomas, lo que permite ser utilizados por cualquier usuario, incluso sin conocimientos tecnológicos, y ser accesible a personas discapacitadas. Estos VA pueden construir sus respuestas a partir de información contextual que obtienen en tiempo real o almacenada con anterioridad. Es decir, pueden almacenar conversaciones o etiquetar elementos de dichas conversaciones para ser utilizados en intervenciones futuras. Además, estos VA puede procesar otro tipo de información para enriquecer las respuestas, como la ubicación de un usuario, la orientación de un dispositivo, la información faltante, etc.

Por lo general, estos VA suelen estar destinados a optimizar el tiempo que los usuarios dedican a tareas rutinarias, mejorando la eficiencia de su gestión en tiempo real. Además, permite reducir los costos operativos mejorando la calidad empresarial al mantener un sistema de soporte disponible 24/7 y con capacidad de mejora gracias a su modulo cognitivo que aprende a medida que es utilizado.  Con la llegada de una nueva generación de VA donde su interfaz no sólo permita interactuar exclusivamente a través de voz y texto sino también a través de videos, imágenes, sentimientos y gestos del usuario. Facilitará un mayor grado de personalización al poder reconocer las emociones y el contexto del dialogo en el cual se establece la conversación. Estos VA más sofisticados aportarán una mejora en la respuesta de éste pudiéndose integrar en un mayor número de dispositivos y ejecutar un mayor número de tareas.

Pero la personalización o la calidad de las respuestas y actuaciones de estos módulos de software están íntimamente ligados a la cantidad y calidad de los datos e información. Al igual que establecíamos en las necesidades de desarrollo de un chatbot para su uso en una cierta compañía. Y tal como mencionamos en el artículo publicado en CastellónPlaza (“Inteligencia artificial y evidencias en sala judicial“) La organización que desee integrar el uso de VA para optimizar y mejorar tanto sus procesos como la experiencia al cliente deberá almacenar y tener acceso a un volumen elevado de datos e información heterogénea. Es por ello por lo que aquellos arquitectos de datos se deben reconvertir en ingenieros de ciencia de datos. Es decir, ya no solo vale el cómo ordenar y simplificar los datos a mostrar al usuario basándose en la usabilidad y experiencia de aplicaciones y sistemas anteriores o similares. Sino que estos nuevos arquitectos o científicos de datos deben dominar las técnicas matemáticas y estadísticas, así como la tecnología necesaria para obtener información y conocimiento útil en base a los datos que la compañía tiene almacenados y es capaz de generar o recopilar de diferentes fuentes. Deben identificar que datos e información es relevante para la empresa. Proceder a la limpieza, formateo de dichos datos, añadir los faltantes y así mismo ordenarlos, combinarlos y armonizar una base de conocimiento tal que se extraiga inteligencia de estos.

Además, estos nuevos profesionales deben comprender muy bien la lógica de negocio de la empresa donde se van a implementar dichos AV. Conocer sus procesos internos, estrategia y las necesidades de los clientes, así como el contexto sobre el cual el sistema actúa. De este modo, el VA se podrá alinear a la consecución de las metas y estrategia de la organización. DEl mismo modo, conocer cuáles son las limitaciones actuales de esta tecnología podrá ayudar a no embarcarse en proyectos inservibles que a la larga se abandonan porque no son eficaces, construyendo una base de conocimiento optimizada para el entrenamiento del AV.

Otro aspecto importante que se debe tener en cuenta a la hora de abordar el desarrollo e implantación de estos VA es que son sumamente especializados en un tema de conocimiento concreto. Pudiendo realizar tareas simples y precisas, no alejadas de su cometido. Delimitando su actividad a aquellas actuaciones que están relacionadas con su tema de conocimiento. Esto se debe a que el núcleo de los VA lleva consigo un módulo cognitivo que se parametriza según vaya aprendiendo para ajústalo a las necesidades intrínsecas del tema de conocimiento que trata. Fuera del mismo, este VA tiene dificultades de aprendizaje y no tan sólo no daría respuesta a nuevas cuestiones sobre otra base de conocimiento, sino que desaprendería del que ya poseía anteriormente.

Hacer mención que Peritaje.ai ha desarrollado su propio Asistente Virtual (“Activity”) el cual posibilita a nuestros clientes hacerse una idea de la funcionalidad y potencia de este tipo de aplicaciones. Nuestro VA “Activity” permite construir un prototipo a modo de app móvil que facilitará al directivo realizar operaciones de BI y extraer información del estado actual de todos los procesos de la compañía.  El VA “Activity” puede recibir información en tiempo real de cualquier evento programado como el descuadre de una tienda que ha cerrado caja o la necesidad de cubrir stock faltante en otra. Se ha desarrollado bajo Android pero pudiendo ser tambien compatible bajo el sistema operativo IOS,

¿Componentes de un Asistente Virtual?

El éxito y aceptación de los VA subyace en la arquitectura del mismo.  Su construcción se basa en la integración de diferentes módulos que han sido ya utilizados por los usuarios como aplicaciones independientes y que son integrados en una única aplicación bajo un interface sencillo de utilizar, aportando las fortalezas de cada uno de ellos. En un VA básico se integra:

  • Un módulo de conversación o chat que permite la comunicación con el usuario bien sea texto a texto, voz a Texto, Texto a voz o Voz a Voz. Este módulo puede implementarse ad-hoc para el VA o incorporar una aplicación de terceros como puedan ser Facebook Messenger, Skype u otro similar.
  • Un módulo de procesamiento de lenguaje natural PNL Y síntesis y generación de lenguaje natural GNL que permite su comprensión, identificación de la intención del usuario y la intercomunicación por parte del VA hacia el usuario en su mismo idioma.

En los VA de primera generación el PNL se centra en buscar patrones predefinidos y unas expresiones sintácticas específicas en las frases que el usuario verbaliza. En estos VA se crea un sistema carente de contexto en donde estos patrones son posteriormente asociados a un porcentaje de intención. Por lo general, este tipo de PNL utilizan además un análisis sintáctico para evitar la sinonimia mediante expresiones regulares que establece reglas de acoplamiento de términos, haciendo que aquellos semejantes se identifiquen bajo una única formulación e intención. Estas intenciones, posteriormente se traducen en una determinada respuesta o una tarea específica que el VA debe efectuar. Por lo general, el VA antes de ejecutar la tarea da conformidad al usuario para evitar posibles errores de interpretación del módulo PNL.

En los VA más sofisticados esta interpretación va más allá de buscar patrones y expresiones sintácticas inquiriendo una interpretación real del sentido de la pregunta, frase o conversación. En este caso se introduce relaciones semánticas, mediante homonimias o arboles de diálogo, dando a la expresión un significado completo y acomodándola a una ontología que modela el dominio de conocimiento en el cual se ejecuta.

  • Un módulo de inteligencia o cognitivo que suele aparecer en las aplicaciones denominadas RPA (Robotic Process Automatic). Se encarga de efectuar las tareas, proveer sugerencias o resolver las dudas del cliente con relación a los productos/servicios que oferta la empresa. Está constituido bajo un dominio específico de conocimiento tal que el VA sólo actúa sobre éste.  Estas aplicaciones permiten desde devolver un simple mensaje al usuario hasta controlar las acciones de algún aparato electrónico con el cual se integra, como ocurre tanto en el IoT o en la industria.

En general este módulo posee un motor de razonamiento capaz de procesar e interpretar los comandos que el PNL le transfiere. Este motor de razonamiento se basa en los sistemas de multi-agente. Todas las funcionalidades del VA son implementadas como componentes independientes (agentes) capaces de intercomunicarse entre ellos. Cada agente constituye una funcionalidad o servicio, y así el conocimiento pueda ser recuperado desde diferentes plataformas (web, móviles o redes sociales). Los servicios que puede desarrollar un VA pasan desde acceder a una BD para obtener la información que necesita para dar una respuesta coherente a la pregunta del usuario, crear su propio contexto de dialogo o realizar minería web en busca de información y posibles alternativas Dada esta arquitectura escalable, los VA pueden conectar con un aparato electrónico para que ejecute una acción como por ejemplo encender las luces de la casa. O programar los pasos que debe efectuar el VA para realizar una determinada tarea.

Este motor de razonamiento se encarga de gestionar las comunicación entre los diferentes componentes a partir de una serie de eventos que se disparan ante cualquier petición del usuario. Esta comunicación se suele realizar bajo un API estándar denominado API REST que identifican el punto de conexión del servicio. Y el uso de tokens de seguridad que permite mantener la sesión del VA sobre el servicio a consumir. Este acceso a dicho punto de conexión se realiza bajo diferentes métodos identificados en el protocolo HTTP (método GET o Método POST). La comunicación entre el VA y los servicios se realiza por una serie de mensajes conformados mediante la serialización de ficheros JSON en el cuerpo del método GET o POST que mantienen la lógica de actuación para cada uno de los servicios o componentes.  De esta manera el VA puede ser accesible a través de otra aplicación o VA.

Otra opción para el desarrollo del motor de razonamiento y el acceso a los servicios es la utilización de un API de terceros. Este API permite desarrollar la funcionalidad de los servicios del proveedor de servicios. Por ejemplo, la utilización del API propia de Azure y Luis de Microsoft (Microsoft.WindowsAzure. *). Otra opción a Azure y Luis es utilizar DialogFlow de Google que proporciona, como en el caso de Microsoft, las APIS para Android, IOS e incluso tiene librerías para varios lenguajes como JavaScript, Java y Python.

Por otro lado, el interfaz de estos VA consta de una simple imagen corporativa, un icono, video o una animación que conforma el avatar del VA y que le da una personalidad especifica. Mejorando la experiencia con el cliente y facilitando una interacción hombre-máquina lo más cercana posible a las expectativas del cliente. En los VA de última generación podemos encontrarnos a un personaje capaz de interactuar y empatizar con el cliente. Este personaje es capaz de manifestar emociones mediante gestos o expresiones, así como de proveer una personalidad propia con el objetivo de construir un asistente más humano. Para ello, estos VA utilizan una cámara para captar los gestos del usuario con el cual está interactuando. Y junto a un PNL más sofisticado pueden esclarecer el estado de ánimo del usuario y actuar en consecuencia. Además, el interfaz de usuario de un VA suele incorporar una entrada por la cual el usuario puede interactuar con él mediante texto y una ventana donde el VA puede mostrar las respuestas, sugerencias, informes o el seguimiento y/o estado en el cual se encuentra la tarea que está realizando.

¿Como se encuentra el mercado de los Asistentes Virtuales?

Inteligencia Artificial y asistentes virtuales

Los VA de primera generación han tenido una rápida aceptación del mercado dentro de la nueva IA y el IoT convirtiéndose en uno de los más prolíferos en cuanto a cuota de mercado y coste económico. Y así lo confirman diferentes estudio donde por ejemplo Data Statista establece que este mercado alcanzará un valor cercano a los 21.818 millones de dólares en 2025. O el desarrollado por MarketWath donde se afirma que para 2026 el segmento de los VA mantendrán una cuota  del 21,523.6 millones de dólares. En la misma línea, Gartner  establece un crecimiento anual de entre el 25% y el 45%, habiendo alcanzado en 2018 una cuota de $ 1 mil millones en 2018. Del mismo modo, Global Market Insights, Inc., afirma que el tamaño del  mercado global de asistentes virtuales inteligentes crecerá a una tasa de crecimiento anual de 34.9% en los próximos siete años. Por otro lado, en el estudio que presenta Forbes, sobre los AV, destaca su gran aceptación por parte de todos los sectores sociales. Manteniendo cuotas de mercado del 72% en el ámbito empresarial, con aplicaciones de VA destinada a directivos y CEO`s. Y de un 42% y 53% tanto en el ámbito de consumo como doméstico.

Un informe realizado en EEUU sobre los AV identifica los mercados de retail, automoción, educación, telecomunicaciones y de la salud (atención médica) como aquellos en los cuales los VA penetrarán con más fuerza, revalorizándose el mercado de VA inteligentes hasta los 11millones de dólares en 2024 con una tasa de incremento de cerca del 37%. En el mismo informe se establece un mismo crecimiento (sobre el 40%) de este mercado de VA en Asia debido entre otros al rápido avance de las innovaciones y uso de esta tecnología, así como el impulso sobre la IA en China y la India.

Los VA más conocidos son los desarrollados por las grandes empresas tecnológicas las cuales sacaron al mercado tanto altavoces inteligentes como móviles de última generación donde su VA está embebido en el Sistema Operativo de éste. Hoy en día estos asistentes se están integrando en otros dispositivos como Home Assistants, Smart speakers y plataformas conversacionales. Entre los más destacados se en

cuentran Alexa (Amazon, 2014), Cortana (Microsoft, 2014), Google Assistant (Google, 2016) o Siri (Apple):

  • Siri de Apple. Es el primer VA que salió al mercado sobre 2003. Este proyecto fue financiado y apoyado por la Agencia de Proyectos de Investigación Avanzada de Defensa (DARPA). Siri, Inc. en 2007 y finalmente se lanzó como una aplicación de asistente personal virtual para el iPhone en febrero de 2010 (Markoff, 2008). Convirtiéndose en el VA de los iphone, ipad e ipod que Apple sacaba al mercado.

“Daniel Nations (2015) describe a Siri como una inteligencia artificial de reconocimiento de voz motor de decisiones que puede recordar un evento en una fecha u hora específica, programar / cambiar un cita, participa en las redes sociales (tuitea o actualiza el estado de Facebook) en referencia al usuario comandos Lo que hace que Siri sea interesante es su diseño compatible con IA estructurado en voz natural para llevar a cabo las tareas dadas con un “sentido del humor”. Con un intento de hacer que Siri parezca más humano como el personaje, las voces femeninas u masculinas opcionales se involucran en la vida del usuario para responder preguntas.”

  • Google Now (OK Google). Se trata de un software de reconocimiento de voz el cual procesa las preguntas indicadas por el usuario y le da respuesta. Se trata tanto de un buscador como un asistente personal que gestiona la agenda y alarmas del usuario. Se activa por voz y es capaz de encontrar aquello que el usuario, mediante comandos de voz, formula. Esta integrado en la mayoría de móviles Samsung de última generación, embebido en el sistema operativo Android. Utiliza diferentes módulos de IA para captar los gustos, sentimientos y necesidades del usuario. Recopila datos de las cuentas del usuario, de los enlaces que visita y las venta que realiza para posteriormente mostrar sugerencias y aconsejar al usuario.
  • Cortana de Microsoft. Este módulo inteligente fue creado por Microsoft para sus móviles y su motor de búsqueda. se dio a conocer oficialmente en el Microsoft BUILD Developer Conference celebrada entre el 2 y el 4 de abril de 2014 (Chris, 2014). Su comportamiento es idéntico a los dos anteriores. Desarrollado sobre la misma base y operativa con una IA idéntica que permite gestionar la agenda del usuario y ofrecer
  • Alexa de Amazon. Convertido en el primer asistente virtual con formato físico, Amazon, ha desarrollado su tecnología en convertirnos su asistente en un ‘mayordomo’ para el hogar. En el campo de los Smartphone tiene previsto implantarse en los dispositivos de la compañía china Huawei.
  • OTROS VA especializados en un mercado concreto son:
  • Asistente Virtual Lola creado por el BBVA en 2015 que permite controlar las cuentas de un cliente y configurara cualquier operativa bancaria como crear transferencias periódicas. En 2017 el BBVA amplio la funcionalidad de su asistente siendo capaz de operar a través de Telegram y Facebook.
  • Asistente Virtual EME de la Mutua Madrileña construido a partir de la IA de Google y alojado en Google Cloud. Su funcionalidad pasa por dar soporte de atención al cliente sobre los productos de la compañía además de solucionar y gestionar posibles problemas que puedan surgir con los productos contratados por el cliente.
  • El Asistente Virtual Irene desarrollado en 2010 para Renfe el cual fue sustituido por Alexa en 2018 el cual ofrece información sobre horarios y trenes al mismo tiempo que gestiona los viajes contratados por el cliente.
  • Asistente Virtual Aura de Telefónica el cual da soporte e información sobre los servicios de la compañía y las dudas que le puedan surgir. Opera a través de los canales habituales de la compañía y a través de Facebook.
  • Asistente Virtual Djingo creado por Orange para dar soporte al cliente tanto desde el móvil como desde cualquier ordenador.

Post a Comment

You don't have permission to register