viernes, 18 de junio de 2010

¿Quién es Watson? El superordenador de IBM que competirá en Jeopardy


IBM lleva tres años preparando a Watson, un superordenador BlueGene para competir en Jeopardy, el concurso de televisión más famoso de USA. Ahora se han desvelado parte de sus secretos en un reportaje de The New York Times (que incluye un juego interactivo contra Watson).
IBM ha preparado un auditorio similar al plató de Jeopardy y ha contratado a antiguos concursantes que están entrenando al ordenador. Los resultados son muy buenos y esperan competir en directo en el programa de televisión en otoño.
En estos tres años, han construido la máquina más avanzada de preguntas y respuestas, capaz de manejar el lenguaje humano habitual, llamado lenguaje natural. Es más de lo que pueden hacer los buscadores tipo Google y en el futuro permitirá hacer preguntas a los ordenadores en lugar de teclear palabras clave de búsqueda.
Nadie hasta la fecha se había atrevido a desafiar a los humanos en Jeopardy porque es demasiado difícil, demasiado ambiguo, demasiados juegos de palabras y dobles significados y con un ámbito de conocimiento, todo el conocimiento humano, demasiado vasto.
Watson, al igual que los otros concursantes no estará conectado a Internet. Durante estos tres años se han volcado en su interior  decenas de millones de documentos incluyendo libros, material de referencia, cualquier tipo de diccionario, tesauros, taxonomías, enciclopedias, novelas, biblias, obras de teatro...
En 2006 Watson era lento y malo, pero las cosas han cambiado. Deep Blue ganó a Kasparov porque el ajedrez es un juego lógico adecuado para los ordenadores, es fácil traducirlo a matemáticas. El lenguaje natural está lleno de trucos y dobles sentidos. Un humano sabe que existe el doble sentido y sabe separar lo que se dice de lo que se quiere decir. Para un ordenador esto es mucho más complejo.

Los algoritmos usados relacionaban estadísticamente la aparición de una palabra con otras. Esto era muy costoso y poco práctico. Varias cosas han cambiado. Los ordenadores son mucho más potentes. El contenido en internet es mucho mayor: las organizaciones y las personas han llenado la web de contenidos accesibles online. Y hay nuevas herramientas lingüísticas como diccionarios de palabras, de rimas, de sinónimos y clasificadores de palabras. Pero no hay un único algoritmo que pueda simular el lenguaje natural. Por ello el equipo de Watson ha puesto en marcha varios algoritmos que se ejecutan en paralelo. Cuando varios de ellos dan la misma respuesta, la confianza de Watson en ella aumenta (hay que recordar que Jeopardy penaliza las respuestas erróneas). Watson examina muchas posibles respuestas y las ordena por su plausibilidad. De entre ellas, muestra las cinco que obtienen mejor nota de modo que la audiencia sabe lo que está haciendo.
Watson recibe la pista en forma de texto escrito a la vez que el resto de los participantes. Responde con una voz sintetizada. Hay situaciones en las que tiene ventaja y otras en las que está en desventaja. Watson conoce con exactitud todos los compositores alemanes de todos los tiempos. No se equivoca. El mencionado doble sentido es su desventaja. Tiene también la ventaja de las emociones. No se pone nervioso y le da igual que la apuesta sea de 2 euros que de 200 euros.
Watson es bueno pero aún no es de los mejores. Una concursante que lo entrena se pregunta ¿seré yo quien está ayudando a la inteligencia artificial a ser consciente de sí misma? En todo caso tienen un acuerdo de confidencialidad; IBM no quiere enseñar a los concursantes sus puntos débiles que podrían aprovechar en el juego. Quizá uno de ellos sea el mismísimo Ken Jennings, el mejor jugador de la historia. Es curioso observar como al final del vídeo promocional los jugadores se abrazaban gritando "humanos" en una clara muestra de su pertenencia al equipo humano.

El sentido comercial está claro. Watson será útil en la ayuda a la toma de decisiones donde haya que indagar en enormes cantidades de documentos. Se pretende crear una versión médica de él. E incluirlo como primera línea de soporte en los centros de atención telefónica. Hoy puede costar varios millones de dólares, pero en el futuro podría caber en un sencillo servidor y más adelante en un portátil.
Apasionante desafío en el que Watson puede superar el test de Turing.

1 comentario:

  1. IM PRE SIO NAN TE
    ME parece que tus entradas del tipo divulgativo son mas interesantes que las excesivamente tecnicas.
    Firmado; Vulgo

    ResponderEliminar