Vamos hacia un mundo en el que la inteligencia estará
presente en cada proceso, en cada dispositivo
La computación
cognitiva es el conjunto de tecnologías que se inspiran en la inteligencia
de los sistemas biológicos. Comprende también a las tecnologías que
proporcionan una interacción más natural con los seres humanos. El lenguaje
humano es la comunicación nativa entre humanos. Las empresas que incorporen
sistemas cognitivos basados en lenguaje humano tendrán una gran ventaja
competitiva sobre el resto.
La escritura
comenzó en Mesopotamia como contabilidad hace cinco mil años. Las primeras
tabletas de arcilla contenían cuentas sobre adquisición y mantenimiento de
productos como rebaños o cosechas. Solo después de un tiempo, la escritura pasó
a ser una herramienta al servicio del lenguaje. La historia parece repetirse
siglos después con los ordenadores. Durante cinco décadas han estado usándose
para cálculo numérico y especialmente para contabilidad. Pero las cosas están
cambiando y desde hace un lustro los ordenadores han comenzado a adentrarse en
el mundo del lenguaje humano.
El lenguaje es la ventana de la mente y pese a ser la parte más accesible de nuestra vida
intelectual seguimos sin comprenderlo muy bien. A este desconocimiento se unen
problemas que hacen de él un reto formidable para los ordenadores: es ambiguo,
impreciso, contextual, erróneo y plagado de dobles significados e ironías. A
pesar de ello, nuestros esfuerzos por manejarlo con máquinas están empezando a
dar resultados.
El reconocimiento
del habla (speech to text) puede parecer sencillo si lo observamos de
pasada. Al fin y al cabo, los niños lo aprenden antes de los dos años. Pero eso
es precisamente un problema: aprender por completo la fonética de un idioma de
adulto es casi imposible como puede comprobar cualquiera que haya estudiado una
segunda lengua. De hecho nos pasamos parte de nuestras conversaciones
preguntando ¿qué? ¿puedes repetirlo? Pese a su gigantesca dificultad, el
reconocimiento de habla por los ordenadores ha progresado hasta el punto que ya
es útil y pronto igualará el rendimiento de los seres humanos. Las ventajas de dictar a un ordenador sobre
escribir en un teclado son evidentes y la incorporación total de esta
tecnología a los sistemas cognitivos
es solo cuestión de tiempo. Lo contrario, la lectura de un texto (text to
speech) está razonablemente resuelto hace tiempo.
La traducción
presenta problemas aún más complejos de índole sintáctico y semántico. Los
traductores no funcionan muy bien hoy, pero lo hace mejor que en el pasado y en
poco tiempo tendrán un nivel que permita su uso totalmente productivo. Muchas
empresas tienen su sistema de traducción como Google, Microsoft, IBM o
Facebook.
Uniendo las tres partes, fonética, sintaxis y semántica, Skype
(propiedad de Microsoft) ha anunciado un sistema que permite a un usuario
hablar en un idioma y que al otro lado sea escuchado en un idioma distinto. El
mensaje oral es pasado a texto en el idioma origen, traducido al idioma destino
y leído. De momento solo funciona entre inglés y español. Google ha anunciado
la misma funcionalidad.
El hito más sorprendente del uso del lenguaje por los
ordenadores fue la victoria de IBM Watson sobre
sus oponentes humanos en el concurso de TV Jeopardy donde demostró un elevado
dominio de las sutilezas del lenguaje. Watson incorpora más de un centenar de componentes lingüísticos algunos de los
cuales son dependientes del idioma y otros son neutrales. Es esta dependencia
lo que hace a Watson “intraducible”. Muchos módulos deben de ser reescritos
para cada lengua. Pese a las dificultades, IBM anunció que Watson iba a estar
disponible en portugués y español (en este caso gracias al acuerdo firmado con CaixaBank).
Ahora acaba de anunciar que estará disponible en japonés
mediante un acuerdo con el gigante de las comunicaciones Softbank.
Pero el avance no está en que los sistemas de las grandes
corporaciones usen el lenguaje humano. El verdadero avance es que cualquier
empresa o el desarrollador de
cualquier modesta app puedan incorporar esta potencialidad. En la plataforma Bluemix
hay más de una docena de servicios de Watson algunos de los cuales manejan el
lenguaje y pueden embeberse en las aplicaciones de las empresas.
Las tecnologías que subyacen al manejo del lenguaje son
potentes y sofisticadas. En un primer momento se usaron sistemas puramente
estadísticos, por ejemplo el análisis comparativo de todos los documentos
traducidos a varios idiomas de la ONU o la Unión Europea. Pero ahora se
están incorporando las poderosas redes
neurales, complejos algoritmos que responden a una vieja idea, la
simulación de la inteligencia biológica, pero con una gigantesca capacidad de
cálculo a su servicio.
¿Hablas a tu móvil?
¿El sitio de internet de tu empresa usa el lenguaje natural para comunicarse
con los usuarios? Si la respuesta es positiva, enhorabuena, aún no sois muchos.
Si es negativa, quizá deberías ir pensando en ello.
Este artículo ha sido publicado previamente en Computerworld
Este artículo ha sido publicado previamente en Computerworld
Es una gran noticia enterarnos de los avances que se han podido hacer al respecto. Y pensamos en las grandes ventajas y aplicaciones que esto podría tener para la psicología y la psicoterapia en el que para determinados problemas de interacción haya algoritmos que guién a las personas en tiempo real.
ResponderEliminar