domingo, 8 de abril de 2012

Este artículo no ha sido escrito por una máquina


La aclaración del título parece pertinente porque los ordenadores ya están escribiendo artículos periodísticos. La comprensión del lenguaje está avanzando mucho. Lo novedoso es la generación de lenguaje. Dos empresas, Narrative Science y Automated Insights han empezado a escribir noticias cortas por ordenador. De momento son resúmenes deportivos de uno o dos párrafos. Pero quién sabe si en el futuro esta entrada podría ser escrita por una máquina.
WISCONSIN parece estar en el asiento del conductor camino de la victoria, ya que gana 51 a 10 después del tercer tiempo. Wisconsin aumentó su ventaja cuando Russell Wilson encontró a Jacob Pedersen y logró un touchdown de ocho yardas poniendo el marcador 44-3 …
Lo anterior es parte de una breve noticia que se escribió 60 segundos después de terminar el tercer tiempo de un partido de fútbol americano. El autor: un ordenador de Narrative Science.
El software recoge datos como por ejemplo estadísticas deportivas, informes financieros de empresas y construcción y venta de viviendas, y los convierte en artículos.
Los dueños de Narrative Science hacen hincapié en que su tecnología es ante todo una herramienta de bajo costo para ampliar y enriquecer la cobertura editorial allí donde el presupuesto es exiguo. Tienen hasta ahora 20 clientes. Uno de ellos comenta:
Estamos haciendo cosas que de otra manera no haríamos
En principio se está usando para resúmenes de partidos locales o empresas locales. Se publican 1 minuto después de que acabe el partido a un precio por el que nadie escribiría: menos de 10$ por un artículo de 500 palabras. Y el precio está disminuyendo.
Por un lado el software puede usar la minería de datos para establecer correlaciones que un humano no haría y en ese sentido dar mayor valor al artículo. El programa utiliza expresiones como “esfuerzo individual”, “trabajo en equipo”, “venir desde atrás”, “de ida y vuelta”, “temporada alta”, “jugador en racha”. Según el dato más relevante el programa elige el titular de la noticia, y con un marcador muy desequilibrado decide que un equipo “machacó” a otro en lugar de “ganó”.
Robbie Allen, fundador de Automated Insights, es un desarrollador de software que ha escrito una decena de libros. StatSheet contiene artículos publicados por ellos como el de la imagen.
Las preguntas del tipo ¿cómo puede un ordenador, hacer X? son las que yo he pasado mi carrera tratando de responder. Así es que me puse a crear un software que pudiera escribir. Me tomó más esfuerzo que escribir 10 libros juntos, pero después de crear un equipo de 12 personas, hemos sido capaces de utilizar nuestro software para generar más de 100.000 historias relacionadas con el deporte en un período de nueve meses.
Hemos automatizado el contenido dando significado a los números, a los datos. Los deportes son la primera categoría hemos abordado. Los deportes, por su naturaleza usan muchos datos. Por nuestras estimaciones internas, el 70% de todos los artículos relacionados con el deporte están analizando números de una forma u otra.
Aclara que su software es bueno manejando datos cuantitativos pero no cualitativos.
Ahora, (sus clientes) pueden concentrarse en comentarios más cualitativos, de valor añadido, en los que los seres humanos son inherentemente buenos. Las historias cuantitativas pueden -y probablemente deben- ser mayoritariamente automatizadas ya que los ordenadores lo hacen mejor.
Ahora nuestro software puede crear ocho párrafos, pero ¿es posible crear ocho capítulos llenos de contenidos? La respuesta es “sí”.
Nuestro software es bueno en el análisis cuantitativo utilizando datos estructurados.
La principal ventaja del software que escribe es para automatizar tipos repetitivos de contenido. Esto no se aplica a los libros.
Tenemos un robot periodista de bajo coste para ampliar la cobertura de las noticias y escribir artículos sin importancia. Eso hoy, mañana veremos.

Artículo publicado en ALT1040

No hay comentarios:

Publicar un comentario en la entrada