viernes, 12 de abril de 2019

MOVILIDAD SOSTENIBLE. UN CAMBIO CULTURAL

Nuevos actores y modelos en la ciudad

La movilidad está cambiando. Nuevos actores y modelos de negocio emergen. La tecnología proporciona soluciones inéditas. La industria no será lo que es. Los desafíos son colosales. Todo lleva a una nueva cultura de la movilidad.



En Madrid, la ciudad en que vivo, hay tres operadores de coche compartido. Los coches que operan son eléctricos. Hay además un servicio público de bicicletas eléctricas compartidas. También existen tres operadores de motos eléctricas compartidas.
Los episodios de contaminación se suceden todos los meses. A veces varios días en el mismo mes. Las restricciones de tráfico son cada día más severas. Aparcar en el centro es tarea arduo compleja. La ciudad pugna por recuperar el espacio arrebatado por los coches. Aun así, los atascos continúan.
En paralelo, nuevos vehículos se anuncian: compartidos, eléctricos, conectados y autónomos.
Como resultado, una nueva cultura se está imponiendo. La movilidad como servicio ha llegado para quedarse.

La movilidad como servicio

En ocasiones la movilidad es deseada voluntariamente. Es el caso cuando nos damos un paseo. Además de las ventajas que el movimiento físico tiene para una vida saludable, lo que deseamos al pasear es ver distintos escenarios que surgen con nuestro deambular. También hay ocasiones en que ese paseo lo realizamos en un vehículo. Conducimos nuestro coche o moto porque nos apetece. Sin embargo, en este caso, nuestro paseo tiene implicaciones económicas, medioambientales, de seguridad y de ocupación de la vía.
No obstante, la movilidad es considerada en la mayoría de los casos una actividad intermedia. Queremos estar en otro lado y por lo tanto nos movemos. Queremos hacerlo rápido, sin costes y sin preocuparnos por ello.

La movilidad debe ser eficiente, cuidadosa, saludable, colectiva, ordenada, planificada y debe hacer ciudad. La movilidad no se refiere solo a los coches

No se debe confundir la movilidad con los vehículos y por lo tanto el debate no puede ser una excusa para vender más coches u otro tipo de coches. La movilidad tampoco es el tráfico. La movilidad debe ser eficiente, cuidadosa, saludable, colectiva, ordenada, planificada y debe hacer ciudad.
Hemos crecido en ciudades que han ido achicando el espacio al ciudadano para cederlo al todopoderoso coche. Esto supuso un cambio cultural que se está invirtiendo. Cada vez somos más conscientes de la imposibilidad de mantener el vehículo privado rodando como amo de las calles.
La movilidad como servicio (mobility as a service) es un cambio cultural imparable. Poseer un vehículo no tiene sentido para muchos ciudadanos. El objetivo es usar los servicios de movilidad para estar en otro sitio.

La ciudad

En la ciudad de Madrid el Metro mueve dos millones de usuarios; la red de autobuses de la EMT mueve 1,6 millones y otro millón usa el transporte privado. Pero más de la mitad de los trayectos se hacen andando.
El transporte público es el gran contribuyente a la movilidad y su uso no parará de crecer. En contraposición, el uso del vehículo privado decrecerá. Hay muchos motivos para preferir el transporte público, pero el principal es simplemente que los coches no caben. Además hay que considerar la eficiencia, el coste y el impacto medioambiental. Todos los nuevos actores en la movilidad urbana empujan a la reducción del vehículo privado.

El 80 por ciento del espacio público de las ciudades está destinado a la movilidad. Compartir, convivir, se hace difícil cuando el coche ha tomado la ciudad

Las ciudades ocupan aproximadamente entre el 1 por ciento y el 3 por ciento de toda la superficie del planeta. La mitad de la población del mundo vive en ciudades. El 80 por ciento de las emisiones de CO2 a la atmósfera se producen en las ciudades; el 70 por ciento de la energía que se consume en el mundo se produce en las ciudades.
Sin embargo, el 80 por ciento del espacio público de las ciudades está destinado a la movilidad. Compartir, convivir, se hace difícil cuando el coche ha tomado la ciudad.
En las ciudades españolas se mezclan los usos para hacer ciudades complejas que tiene muchas ventajas. Las distancias son cortas y muchos trayectos se pueden cubrir andando y además el transporte público funciona bien. Pero la suburbanización ha crecido y, al sacar habitantes y servicios del centro, la movilidad se complica. Es mucho más sostenible el ascensor que el coche.

Cambios legales

Los nuevos tiempos están trayendo una gran cantidad de cambios legales y regulatorios. La complejidad de las nuevas normativas será grande, no solo unas pocas leyes. El coche compartido, el coche autónomo o los seguros requerirán abundante legislación. Y ni siquiera toda la legislación será nueva; mucha de la legislación ya existente tendrá que adaptarse al nuevo mundo.
La legislación vendrá a través de periodos de transición donde lo nuevo coexistirá con lo viejo. Y todo ello ocurrirá con un aumento de la conflictividad. El caso de los vehículos VTC (Vehículos de Transporte Concertado), que ha llegado al Tribunal Supremo, es un buen ejemplo.
Además existe un claro riesgo legal para los nuevos modelos de negocio. Unas empresas se lanzarán en un territorio desconocido probando cosas y otras esperaran a la legislación y los tribunales. En medio de todo está el sector de los seguros. El coche compartido o el coche autónomo son dos muestras de necesidad actualización del mundo de los seguros.
Las regulaciones serán esenciales para que las empresas avancen en un sentido u otro. Si se prohíbe la entrada de vehículos contaminantes en una población, se estimula el uso de otras alternativas. Los estímulos para la compra o el estacionamiento de determinado tipo de vehículos orientarán el mercado. Y además, existen nuevas éticas de la nueva movilidad. Un coche autónomo tomará decisiones por sí mismo que tienen implicaciones éticas. No es un asunto menor en una actividad con un elevado número de muertes anuales.
Luis Casals  – Marco regulatorio y legal – Foro del Futuro Próximo 2017 Movilidad

Vehículo compartido

Los ciudadanos son cada vez más conscientes del problema que supone el uso del vehículo privado. No cabe en las ciudades, es caro de adquirir y mantener y es poco sostenible medioambientalmente. El transporte público ha sido siempre el exponente más claro de la movilidad como servicio, pero en los últimos tiempos están surgiendo nuevas opciones.
Un creciente número de nuevos operadores, junto a plataformas formadas por los fabricantes tradicionales de coches, están ofreciendo la compartición de coches (car sharing, en la jerga anglosajona)
Hay que considerar que el sharing triunfa porque tiene incentivos. Por ejemplo, la posibilidad de aparcar gratuitamente en la mayor parte de la ciudad facilita la adopción de estos nuevos modelos de negocio. Sin embargo, es probable que no siempre sea así y los ayuntamientos pueden cambiar estas políticas en el futuro.
También hay que estar atentos a la rentabilidad de estos nuevos modelos de negocio. A día de hoy estos operadores están lejos de obtener beneficios.

El usuario que comparte coche es el primero que entiende la movilidad como servicio, no como propiedad. Usa el vehículo en la ciudad cuando lo necesita

El cambio de mentalidad nos lleva a un cambio modal. Ahora el transporte ya no se realiza en un único vehículo. Es posible acceder al centro en tren y desplazarse andando una vez allí, en metro, en autobús o taxi. Como siempre y, además, usar coches, motos o bicicletas compartidos. La nueva movilidad es multimodal.
En el sharing concurren una serie de circunstancias. Es un éxito cuando el servicio de transporte público es bueno y cuando se acompaña de otras medidas. Su usuario es el primero que entiende la movilidad como servicio, no como propiedad. Usa el coche cuando lo necesita.
Dentro de la ciudad un vehículo compartido reemplaza a 20 vehículos privados. Los datos son elocuentes. En ciudades como Múnich o Milán los usuarios de vehículo compartido han dejado un vehículo del hogar en el 20 por ciento de los casos, han dejado dos vehículos en el 10 por ciento y han evitado comprar un coche nuevo en el 30 por ciento de los casos.
El car sharing eléctrico en algunas ciudades como Madrid ha permitido también demostrar el uso de energías renovables en el transporte. Los ciudadanos han probado el vehículo eléctrico y han comprobado sus ventajas.

Vehículo eléctrico

A corto plazo, uno de los factores que más incidencia va a tener en la movilidad en las ciudades es la introducción del vehículo eléctrico.
El vehículo eléctrico tiene un gran atractivo y muchas ventajas. Sin embargo, tiene dos importantes inconvenientes. El primero es su esencia: sigue siendo un vehículo y como tal ocupa espacio en las vías y ciudades. No va a solucionar problemas de congestión ni de eficiencia en la movilidad ni en el tiempo. El segundo problema es el de la contaminación. Las emisiones son cero cuando se usan y esto es una enorme ventaja en las ciudades que sufre crecientes episodios de contaminación. Pero no podemos olvidar las emisiones en origen. Mientras la electricidad que usan provenga de la quema de combustibles fósiles, el problema del cambio climático persistirá.
El vehículo eléctrico no es algo nuevo y de hecho el motor eléctrico nunca se abandonó en algunos medios de transporte y en el ferrocarril ha sido la norma durante su historia.
En el sector del automóvil, todos los fabricantes están lanzando modelos eléctricos. La transición no será sencilla y el cambio de modelo de negocio tendrá consecuencias. Sigue siendo caro, entre otras razones, porque los fabricantes tienen que rentabilizar las enormes inversiones realizadas en los vehículos de combustión. El mercado sigue siendo exiguo y en 2017 los vehículos eléctricos tan solo ha supuesto un 0,3 por ciento del total de vehículos vendidos.
Los cambios que impulsan la adopción de vehículos eléctricos son de distinto tipo: 1) Medioambientales, debidos a las emisiones de CO2 y al cambio climático; 2) Políticos, como las estrictas normas anticontaminación, la etiqueta ecológica, la implantación de zonas de bajas emisiones en las ciudades, las ayudas a la compra y los beneficios y subvenciones; 3) Estructurales, como el aumento de las infraestructuras de recarga o proyectos como los corredores CIRVE; 4) Económicos, debidos a las reservas de petróleo limitadas, la inestabilidad en el precio de los combustibles fósiles y los beneficios de las energías renovables que son inagotables, no contaminantes y un recurso local (no importado); 5) Sociales dado su impacto en la salud; y, finalmente, 6) tecnológicos.
Las ventajas del motor eléctrico sobre el de combustión son notables. No hace ruido ni vibra. No emite partículas contaminantes. El rendimiento es muy superior. Es muy sencillo y por lo tanto el mantenimiento es muy barato. Además, no requiere cambio de marchas, arranca por sí mismo y recupera energía en las frenadas.
Ricardo Fraguas Poole – El renacimiento del coche eléctrico
Foro del Futuro Próximo 2017 Movilidad

Tiene sin embargo dos grandes inconvenientes: su limitada autonomía y una escasa red de puntos de recarga. Los últimos modelos tienen autonomías de hasta 300 kilómetros. Pero un dato importante es que toda la energía que se puede almacenar en una batería de unos 400 kg se puede almacenar en 4 litros de gasolina. En cuanto a la recarga, es una asignatura pendiente aunque es probable que las regulaciones de las administraciones y los operadores acaben solucionándolo.
Noruega, importante productor de petróleo es, paradójicamente, el gran laboratorio mundial. Con un parque total de 2,6 millones turismos, la cuota de mercado de vehículos eléctricos hasta junio de 2017 es del 34 por ciento. En el momento actual, pueden recargar simultáneamente 950 coches en cargadores rápidos y el 30 por ciento de los propietarios de vehículos eléctricos los tienen como único vehículo.
Respecto de la red eléctrica, los cálculos estiman que sí todos los coches mañana fueran eléctricos la demanda electricidad en Europa aumentaría un 24 por ciento y que tenemos capacidad suficiente en España para todos los coches eléctricos que puedan venir.

Vehículo conectado

La creciente digitalización, el Internet de las Cosas y las comunicaciones omnipresentes permiten que el vehículo esté permanentemente conectado.
El vehículo es una fuente de datos: su posición, si está utilizando las luces, si llueve porque utiliza limpiaparabrisas, la temperatura que lleva… Todos los datos que genera un vehículo son de gran utilidad para la planificación del tráfico. El vehículo es también un receptor de datos para una mejor experiencia del conductor y en su caso del vehículo autónomo.
Las comunicaciones serán entre vehículos, de vehículo a infraestructura y de vehículo a la nube. En este sentido, la Dirección General de Tráfico (DGT) ha lanzado en España una iniciativa llamada DGT 3.0 para que todos los nuevos vehículos dispongan de conectividad que mejore la seguridad vial y el tráfico, preservando el anonimato y no estando orientada a la sanción.

Vehículo autónomo

Tras los avances en la digitalización y conexión, el siguiente paso es el vehículo autónomo. Existen cinco niveles de conducción autónoma: asistente a la conducción; semiautomática; autonomía controlada; alto nivel de autonomía; y/o autonomía total.
El nivel de conducción autónoma en la que estamos es el nivel 3 llamado piloto automático. Las dificultades para pasar a los niveles superiores son muy grandes y no se esperan vehículos de nivel 5 hasta dentro de una década como mínimo. La percepción del entorno es un problema fundamental y la toma de decisiones dista mucho de estar resuelta.
Recientemente la Unión Europea ha establecido dos corredores para pruebas que pasan por España: Lisboa-Mérida y Oporto-Vigo. Esos corredores que se van a abrir son corredores para un nivel 3 de conducción, lo que se llama el piloto automático, para poder navegar de forma autónoma por un entorno muy controlado.

El futuro de la industria

Como resultado de los grandes cambios en la movilidad en el planeta y los desafíos del cambio climático, la industria del automóvil se enfrenta a formidables retos. No está claro que todas las marcas puedan sobrevivir.
Los jóvenes están dejando de sacarse el carnet de conducir. La mayoría de las personas de todas las edades considera que no tendrá un coche propio en 2025. Cada coche compartido sustituye a 20 coches en propiedad lo que incidirá en su venta. Las políticas públicas desincentivan el uso del vehículo propio en las ciudades, donde reside la mayoría de la población. Los nuevos operadores no salen del sector de automoción sino que en muchas ocasiones son ajenos. Una marca ya no solo compite con las otras sino que ahora lo hace contra nuevos operadores.
La multimodalidad se impone. Cada vez hay más servicios disponibles para los ciudadanos que cambian de medio de transporte. El vehículo privado va reduciendo su ámbito de uso.

La industria del automóvil ha creado una cultura de adquisición. Durante décadas poseer un vehículo ha estado asociado con placer, libertad y estatus. Ahora, está llegando a su fin

Además, el coche eléctrico es una amenaza para los fabricantes tradicionales. El motor de combustión es sumamente complejo y su fabricación está limitada a unos pocos consorcios mundiales. Muchos pueden fabricar un coche pero pocos pueden hacer un motor. La simplicidad de un motor eléctrico abre el abanico de fabricantes. Existen multitud de motores eléctricos, desde batidoras o lavavajillas a trenes.
En el futuro existirán muchos constructores de motores eléctricos y los fabricantes de los sofisticados y complejos motores de combustión, algunos importantes europeos, afrontarán una creciente competencia.

Conclusiones

Hasta la fecha la cultura de la movilidad estaba influenciada por dos importantes sectores: los fabricantes de automóviles y la industria petrolera. La segunda ha condicionado multitud de decisiones mundiales, desde inversiones hasta guerras aunque ha permanecido en la sombra: no hemos recibido el mensaje explícito “quema petróleo”. Pero la industria del automóvil sí ha creado una cultura de adquisición. Durante décadas poseer un vehículo ha estado asociado con placer, libertad y estatus. Cuanto más grande el coche y más coches tengamos más felices somos.
La cultura de posesión de automóviles, sin embargo, puede estar llegando a su fin. Hay pocas dudas de que el impacto medioambiental a escala planetaria y de contaminación de las ciudades es insostenible.
Además, en multitud de casos el transporte individual es ineficiente. Si añadimos a esto el cambio cultural que experimenta la humanidad, especialmente de la mano de las jóvenes generaciones, parece evidente que la movilidad va a cambiar.
El transporte es crecientemente multimodal. Muchos desplazamientos incluyen varios medios de transporte: metro y autobús a los que se unen bicicletas, coches compartidos y trayectos a pie. La gestión de un único billete o tarjeta o app que permita al ciudadano la movilidad multimodal sin complicaciones es una asignatura pendiente.
El coche conectado será una realidad muy pronto y proporcionará enormes ventajas de seguridad y eficiencia siendo un elemento esencial en un mundo de Internet de las Cosas. Después llegará el vehículo autónomo con el que la movilidad cambiará decisivamente. Sin embargo, quedan aún muchos años hasta su implantación más avanzada. De los cinco niveles de autonomía posibles, estamos entre los niveles tres y cuatro.

El transporte es crecientemente multimodal. Muchos desplazamientos incluyen varios medios de transporte: metro y autobús a los que se unen bicicletas, coches compartidos y trayectos a pie

El vehículo eléctrico sí es una realidad ya y pronto tendrá un uso masivo. Los motores eléctricos tienen más de un siglo y es una tecnología madura. La infraestructura de recarga y la autonomía son aún grandes inconvenientes aunque es presumible que mejorarán rápido.
La emisión cero de gases y partículas contaminantes es vital para las grandes ciudades. Los episodios de contaminación, debidos en gran medida al tráfico rodado, son una constante en los núcleos urbanos. Los vehículos eléctricos son una solución a la contaminación en las ciudades.
Pero los vehículos eléctricos tienen otro problema inherente a su condición: son vehículos y por lo tanto ocupan espacio. La solución al problema de la congestión del tráfico no vendrá por la adopción de uno u otro vehículo sino por la disminución de los mismos.
Nos movemos cada vez más y eso trae problemas de eficiencia y medioambientales. Las tecnologías ayudarán a mejorar muchos aspectos. Pero una movilidad eficiente y sostenible solo será posible con un cambio de mentalidad.

[ Para profundizar sobre el tema, puedes ver los vídeos del Foro del Futuro Próximo 2017 sobnre Movilidad ]


Bibliografía

Orbe, A. (2017): Movilidad sostenibleForo del Futuro Próximo. Disponible en https://futuroproximo.org/documentos/documentos-del-ffp
Fraguas, R. (2017): Amor y SostenibilidadCreatespace Independent Pub. ISBN: 1976451272.

Artículo publicado originalmente en Telos

viernes, 29 de marzo de 2019

Alphazero vapulea a Stockfish. Cuando el conocimiento humano es una desventaja

El algoritmo AlphaZero basado en una red neuronal que aprende por reforzamiento ha destrozado a la mejor máquina de ajedrez existente. En tan solo cuatro horas AlphaZero ha recorrido la historia de la humanidad en el ajedrez.



La noticia
AlphaZero vapulea a Stockfish, el mejor programa de ajedrez hasta la fecha.

El 5 de diciembre de 2017 el equipo de DeepMind, empresa especializada en inteligencia artificial propiedad de Google, publicó la noticia de que su programa AlphaZero había derrotado al programa Stockfish por 28 partidas ganadas, 72 tablas y ninguna derrota.

El logro podría considerarse una simple victoria de una máquina sobre otra o una repetición de las, cada vez más frecuentes, victorias de la máquina sobre el humano. Sin embargo, varias de las características del encuentro llevan a una seria reflexión sobre el ajedrez, la inteligencia artificial (IA) y el papel del ser humano en el mundo que viene.

Lo más notable es que AlphaZero aprendió desde la nada, tabula rasa, y en tan solo 4 horas logró un conocimiento del ajedrez superior al que toda la historia de la humanidad había conseguido durante 1.500 años máquinas incluidas.

Más aún, todo parece indicar que el esfuerzo humano por dotar a las máquinas de habilidades en el ajedrez había sido inútil. El conocimiento humano parece ser erróneo y contraproducente. Un prejuicio.

El juego
El ajedrez es un juego milenario. Durante el siglo XX alcanzó una enorme popularidad en Occidente y después en todo el mundo. Está lleno de brillantes figuras e históricos encuentros. Desde el cubano Raúl Casablanca a toda una pléyade de jugadores rusos. El duelo del estadounidense Boby Fisher frente al ruso Boris Spasky puso de moda el deporte del tablero. Los enfrentamientos entre Karpov y Kasparov, la pérdida del cetro humano por Kasparov frente a la máquina Deep Blue y los logros de la rutilante estrella noruega, Magnus Carlsen son pocos de los miles de apasionantes hitos que llenan las páginas de la historia del ajedrez.

El ajedrez es un juego finito pero en la práctica puede considerarse infinito y no resuelto. Es decir, las posibilidades son tantas que ningún superordenador está cerca de resolverlo aunque teóricamente ese momento llegará.

En el primer movimiento, las blancas tienen 20 jugadas legales (cada peón una o dos casillas -8×2=16- y cada caballo dos casillas -2×2=4-). A su vez, las negras pueden jugar otras 20 jugadas. Al final de la primera jugada hay 400 posibles posiciones en el tablero. El venerable Deep Blue (hoy casi un juguete) calcularía los tres primeros movimientos (tres jugadas por bando, es decir, seis jugadas) en menos de un segundo. En cambio, los cuatro primeros movimientos los calcularía en ¡dos horas! y los cinco primeros, en ¡853 horas! Más adelante el juego se complica y las jugadas posibles son alrededor de 35 por bando. El mejor ordenador actual tardaría millones de años en resolverlo.

AlphaZero aprendió en solo cuatro horas y logró un conocimiento del ajedrez superior al que la humanidad había conseguido en 1.500 años
Sin embargo, hay una parte resuelta: los finales de siete piezas o menos. El logro no fue empresa menor. Los finales de seis piezas estaban resueltos en 2005 (mediante las tablas de Nalimov). En 2012 el superordenador Lomonosov de la Universidad de Moscú logró resolver los finales de siete piezas. Estos se hallan en unas tablas. Es decir, ya no hay que calcular y basta con buscar la posición para obtener todas las variantes posibles con una certeza del 100%. La base de datos ocupa la friolera de 140 terabytes (TB). La posición más complicada requiere 545 jugadas para dar mate. Se calcula que por cada pieza adicional el esfuerzo de computación se multiplica por 100. Resumiendo: queda mucho tiempo hasta que el ajedrez sea un juego resuelto.

La otra parte del juego donde la teoría ha avanzado más es la apertura. Millones de horas y miles de jugadores, partidas y programas se han dedicado a establecer cuáles son las mejores líneas de juego en su inicio. Una de las más populares y antiguas es la apertura Ruy López que toma el nombre del clérigo que la popularizó y que describió en su libro publicado en Alcalá de Henares (Madrid) en 1561. Después, un largo rosario de aperturas, defensas y sus variantes se han ido sumando a la teoría de aperturas. Todos los grandes jugadores estudian aperturas ayudados de los programas informáticos y ocasionalmente desarrollan nuevas variantes.

El medio juego es la parte donde menos teoría hay. Las variantes son virtualmente infinitas, las posiciones se repiten poco y priman ideas generales como la estrategia y los recursos tácticos.

El rival
Stockfish es uno de los motores de ajedrez más potentes del mundo, mucho más fuerte que cualquier Gran Maestro1 humano. Los otros rivales son Houdini y Komodo, entre otros. Una buena parte de su fuerza reside en que es open source, de código abierto. Esto significa que cualquiera puede mejorar el código y de hecho hay cientos de desarrolladores que trabajan en él. Una vez que un software es de código abierto y se hace popular, las marcas comerciales tienen pocas posibilidades de competir. Es el caso de Wikipedia que ha barrido a todas las enciclopedias privadas. Pero también el de otro mucho código, desde las bases de datos a los servidores web.

En 1997 Deep Blue ganó a Kasparov y desde entonces las máquinas ganan a los humanos. Stockfish es heredero de la línea que abrió Deep Blue y en realidad los programas no han cambiado tanto. Se basan en un potente hardware (mucho más en el caso de Stockfish que en el de Deep Blue ya que 20 años no han pasado en vano) y en dos conjuntos de algoritmos.

El algoritmo Minimax evalúa las posiciones. Es algo natural en los ajedrecistas. Por ejemplo, se evalúa el material. Una dama vale más que un peón y una torre más que un caballo. El material es muy importante, pero no es el único criterio: un peón a punto de coronar y hacerse dama vale mucho; un caballo en el centro, también; y una dama en una esquina tiene menos valor.

Los programas de ajedrez tienen todos los criterios humanos escritos en su código y el trabajo del programador es facilitarle los patrones de evaluación
Los programas de ajedrez tienen todos estos criterios humanos escritos en su código y una parte esencial del programador es darle los mejores patrones de evaluación. El programa no evalúa jugadas sino posiciones. Si una jugada lleva a una posición mejor, entonces la jugada es buena.

Como hemos visto, no es posible calcular todas las jugadas, de modo que hace falta un algoritmo que pode todo el árbol de movimientos. Este algoritmo se llama poda alpha beta y en realidad es un conjunto de algoritmos. Se basan en detectar la línea más prometedora y evaluarla a fondo descartando otras líneas mediante heurística. Es evidente que el programa puede descartar la mejor jugada por mal diseño y por ello la calidad de la poda alpha beta es esencial. Todas estas heurísticas son mecanismos que siguen criterios humanos y que los programadores se han esforzado por mejorar e implementar en la máquina.

La clasificación de ajedrez se mide por un sistema de puntuación llamado ELO2 . El mejor jugador actual, Magnus Carlsen, tiene un ELO de 2.837 mientras que Stockfish tiene un ELO de 3.228 puntos. Un abismo. Los Grandes Maestros ya no juegan contra máquinas, pero las usan para entrenarse y aprender.

El alienígena
En estas estaba el mundo del ajedrez cuando llegó un ser que parecía venido de otro mundo: AlphaZero.

El origen de AlphaZero está en el juego del Go. Después de ganar al ajedrez, la inteligencia artificial se planteó otros juegos. El que más se resistió fue Go, otro juego milenario. Recientemente DeepMind creó un programa llamado AlphaGo que derrotó al vigente campeón mundial humano. AlphaGo tenía mucho conocimiento de Go imbuido. Google decidió a probar un software que no supiera nada de Go. De modo que creó AlphaGo Zero y lo enfrentó a la anterior versión, AlphaGo. La nueva versión Zero, que no sabía nada de Go machacó a la primera que sí tenía conocimientos del juego.

Después, DeepMind generalizó el algoritmo de AlphaGo Zero para llegar a AlphaZero que se ha usado para ganar a Go, ajedrez y shogi (ajedrez japonés).

AlphaZero usa una red neuronal que aprende. Las redes neuronales son una idea tan antigua como la informática, que data de los años 50 del siglo pasado. Se basa en una red de neuronas artificiales conectadas y organizadas en capas. Cada neurona recibe estimulación (input) de algunas neuronas de las capas iniciales y ella misma estimula a algunas neuronas de las capas posteriores (output). La red aprende cambiando la fuerza de estas conexiones.

Las redes neuronales eran un invento interesante pero no solucionaban ningún problema real. Hasta que hace unos cinco años todo ha cambiado. Hay tres elementos fundamentales que han impulsado las redes neuronales. Uno es la potencia del hardware que permite velocidades enormes. Otro son los algoritmos (como el que nos ocupa AlphaZero) que son mucho más complejos. Por último, la ingente cantidad de datos disponibles con las que se pueden entrenar (aunque en AlphaZero no se aplica).

El caso es que las redes neuronales que aprenden están empezando a ser ubicuas. Por ejemplo el reconocimiento de voz o la traducción se basan en redes neuronales. No es de extrañar que Google comprara DeepMind y que realice experimentos como AlphaZero. Es su negocio. AlphaZero es una red neuronal que no tiene ningún conocimiento de Go, ajedrez ni shogi. No sabe nada de aperturas ni finales, de algoritmos Minimax ni poda alpha beta. Para cada desafío se le dan las reglas del juego y el resultado (gana, empata o pierde). Técnicamente es un algoritmo general de aprendizaje por reforzamiento.

Ya en 2015, DeepMind había preparado el camino. Entonces anunció que un software había sido capaz de aprender sin ayuda a jugar a los míticos juegos de la videoconsola de Atari. El programa solo recibía como input los píxeles de la pantalla y el resultado del juego. Este aprendizaje por reforzamiento no supervisado es un gigantesco avance. Las máquinas aprenden cosas para las que no habían sido entrenadas solo con darles el resultado final.

AlphaZero ha utilizado para aprender un hardware muy poderoso. Más de 5.000 TPUs3. Jugando contra sí mismo, empezó sin saber nada de ajedrez y en 4 horas logró el nivel ELO de Stockfish. Después siguió jugando hasta completar 24 horas.

El enfrentamiento
Una vez entrenado, AlphaZero se enfrentó a Stockfish en un match de 100 partidas. La paliza fue sensacional. Jugando con blancas ganó la mitad, 25 partidas y las otras 25 fueron tablas. Con negras ganó tres y empató 47. En términos ajedrecísticos, donde las tablas entre Grandes Maestros son muy habituales, el resultado es abultadísimo.

El hardware usado para jugar es casi ridículo comparado con el usado en el entrenamiento. Tan solo cuatro TPUs en el juego frente a las 5.000 del entrenamiento. Comparando la potencia de cálculo de los dos rivales, las cifras son también escandalosas. Stockfish realizaba 70 millones de evaluaciones por segundo mientras AlphaZero solo 80.000, un 99,89% menos.

La conclusión relativa a la potencia de cálculo es clara: una red neuronal requiere muchos recursos para aprender pero una vez entrenada apenas los consume.

Además de ganar al ajedrez, AlphaZero también ganó a los mejores programas de Go y shogi aunque fueron instancias separadas para cada juego con sus reglas y su aprendizaje específico distinto para cada una.

DeepMind publicó un artículo con varias explicaciones del experimento en el que se incluye una somera descripción del algoritmo, las condiciones experimentales y un conjunto de 10 partidas ganadas por AlphaZero.

Las reacciones en el mundo del ajedrez han sido de completo asombro. A estas alturas hay que considerar a Stockfish del lado humano ya que tiene mucho conocimiento de ajedrez inculcado por los programadores y además es muy usado por los jugadores para aprender y mejorar.

El conocimiento humano es un prejuicio. Es inútil, erróneo y un lastre. Las máquinas aprenden por sí solas y todas nuestras ayudas y conocimientos solo sirven para confundirlas
Si el apabullante resultado causó estupor en los expertos, las partidas publicadas lo hicieron aún más. En estos momentos hay miles de ajedrecistas repasando las partidas y esperando a que se publiquen más. Simplemente AlphaZero hacía cosas que nadie podía esperar incluyendo los mejores equipos hombre máquina.

Entregar una pieza en un sacrificio es común. El contrario no suele aceptarla porque suele ser un ofrecimiento envenenado. Sin embargo, AlphaZero además de sacrificarla, no tiene ninguna prisa en recuperarla lo que provoca el desconcierto de programas y humanos. En varias ocasiones la jugada realizada por AlphaZero ni siquiera era considerada por las máquinas. Más aún, la mayoría de los programas de ajedrez dan erróneamente por perdido a AlphaZero hasta que la partida está muy avanzada y la victoria es inminente.

Maxime Vachier-Lagrave es el sexto jugador del mundo. Sus palabras son elocuentes: “Por supuesto, el resultado es realmente impresionante; yo no podría ni soñar con ganarle una partida a Stockfish. El resultado, especialmente con las blancas, es realmente impresionante. Si la gente tuviera acceso a AlphaZero en lugar de Stockfish o Houdini, la teoría cambiaría. En la mayoría de las partidas, AlphaZero estaba ganando y Stockfish estaba como: todo está bien, todo está bien, todo está bien durante unas 20 jugadas, eso es bastante antelación en cuanto a módulos, pero luego ya no estaba bien y poco después las cosas se iban de las manos. He visto cosas muy impresionantes”.

Algunas de las pegas que se han puesto al experimento son importantes, pero apenas modifican las conclusiones finales. Se ha dicho que la versión de Stockfish no es la mejor, que no incluye aperturas o finales y que el sistema de gestión de tiempo es arbitrario (un minuto por jugada, lo que es muy extraño). También que el hardware sobre el que corría no es el mejor.

El experimento es un gran logro científico, pero el documento no sigue los estándares científicos. No es reproducible. Solo se muestran diez de las 100 partidas y ninguna de las partidas de entrenamiento en que AlphaZero jugó contra sí mismo. Pero, naturalmente, el orden de prioridades de Google, en sentido inverso, es: ajedrez, ciencia y cuenta de resultados. Google trabaja para los accionistas y publicará lo que le interese.

El conocimiento humano es prejuicio
AlphaZero empezó desde cero, se insiste. Haciendo movimientos aleatorios se entiende que los iniciales fueron muy malos. Poco a poco fue mejorando. En tan solo cuatro horas había alcanzado el nivel del mejor programa de ajedrez existente. Esto lleva a algunas conclusiones escalofriantes.

AlphaZero recorrió los 1.500 años de historia del ajedrez en cuatro horas. Toda la experiencia y saber humanos acumulados durante millones de horas se resumieron en solo 240 minutos. Lo que aprendimos desde que Ruy López publicó su libro hasta la última versión de Stockfish se vio superado en un instante.

Como es lógico, AlphaZero fue jugando algunas de las aperturas más conocidas. En el documento se analizan las aperturas que fue descubriendo. Hay miles de libros de aperturas. AlphaZero comienza jugando todas ellas pero las va descartando. ¿Significa eso que las aperturas consideradas buenas por los expertos no lo son? Así parece. AlphaZero descarta las populares siciliana, inglesa, española, Caro-Kann…

Al alienígena AlphaZero no le gustan esas cosas que hacen los humanos y sus máquinas. Más aún, en todas menos una de las partidas publicadas en las que juega con blancas empieza con el mismo movimiento d4.

Parece entonces que el principal problema del rival, Stockfish es que es demasiado humano. Los programadores han puesto en la máquina mucho conocimiento humano y esto es contraproducente. El conocimiento humano es un prejuicio. Es inútil, erróneo y un lastre. Las máquinas aprenden por sí solas y todas nuestras ayudas y conocimientos solo sirven para confundirlas.

Generalización
La ciencia ficción acostumbra a plantearnos escenarios en los que una inteligencia artificial toma el control de los humanos. Una característica de esa IA es que es general, una inteligencia artificial general (IAG) que resuelve cualquier tipo de problemas. La realidad es muy distinta. Hoy todo el software es de propósito específico: solo sirve para lo que se ha diseñado. Estamos muy lejos de una IAG. Sin embargo, el mismo algoritmo de AlphaZero es capaz de aprender a jugar a tres juegos distintos (como su predecesor, el de los videojuegos de Atari lo fue). Esto es una generalización muy importante ya que abaratará el desarrollo de software y acelerará el progreso. Pero el temor a una IAG que controle el mundo sigue siendo infundado.

Máquinas que aprenden solas y generalizan su comportamiento. Grandes noticias. El progreso se acelera.


Notas
 1Título otorgado por la Federación Internacional de Ajedrez (FIDE) a jugadores de ajedrez que alcanzan determinado nivel de excelencia.

 2Debe su nombre a su inventor, el profesor Árpád Élő (1903-1992), un físico estadounidense de origen húngaro.

 3Las TPUs son procesadores diseñados específicamente para redes neuronales, en concreto para Tensor Flow, la arquitectura de redes neuronales de Google.

Bibliografía
Hassabis, D. y otros autores. “Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm” en SAO/NASA Astrophysics Data System (ADS). Disponible en https://arxiv.org/pdf/1712.01815.pdf

Doggers, P. “AlphaZero: Reacciones de GMs y de un autor de Stockfish” en chess.com. Disponible en https://www.chess.com/es/news/view/alphazero-reacciones-de-gms-y-de-un-autor-de-stockfish-4300

“Lomonosov Endgame Tablebases” en chessOK. Disponible en http://chessok.com/?page_id=27966

Orbe, A. (2016): Una mirada al futuro. Inteligencia artificial, abundancia, empleo y sociedad. Madrid, Ediciones Altaria.

Artículo publicado originalmente en la revista Telos