domingo, 29 de mayo de 2011

La lectura. El área visual de formación de palabras (VWFA), el sistema ventral, el dorsal y el Braille

La lectura es una actividad fascinante para cuyo eficiente desempeño se recluta la llamada área visual de formación de palabras (VWFA del inglés Visual Word Form Area). Este área está al final del sistema ventral que realiza un sofisticado procesamiento de la imagen visual. Sin embargo, los últimos estudios indican que la VWFA es también el área utilizada por los ciegos al leer Braille.

La lectura (y la escritura), el mayor invento de todos los tiempos, ha permitido avanzar de forma decisiva a la humanidad. Tiene una antigüedad de 5000 años, no es universal (hay millones de analfabetos en el mundo) y no tiene una base genética sino que es aprendida (por contraposición al habla que sí es universalmente humana y con una base genética aunque también requiera aprendizaje). A pesar de no estar precableada en el cerebro y ser aprendida, la lectura tiene un nivel de eficiencia extraordinario. Reconocemos letras, palabras y frases a una enorme velocidad independientemente del font, del tamaño, de la posición o de si son MAYÚSCULAS/minúsculas. A la vez es muy exigente con las pequeñas diferencias (e y c) y el orden (los y sol).
El presente artículo se refiere exclusivamente al reconocimiento visual de palabras por VWFA (también llamada letterbox por el investigador Stanislas Dehaene). El VWFA informa a otras áreas temporales, parietales y frontales para el acceso semántico y fonológico cuyo procesamiento no se considera aquí.
Bigramas abiertos
Las unidades básicas de procesamiento que se han propuesto son los llamados bigramas abiertos.
  • Son grupos de dos letras próximos aunque no necesariamente juntos. De CALDO:  CA, CL, CD, CO, AL, AD ...
  • Otras letras pueden estar en medio.
  • El orden ha de preservarse.
  • Toleran la imprecisión. Hcn q st frs pd lrs.
Vías de procesamiento visual: dorsal y ventral
Melvyn Goodale propuso dos vías de procesamiento de la información visual, una responsable del dónde y la otra responsable del qué: la dorsal  y la ventral.
La vía dorsal o parietal se origina en las células grandes de la retina (células M que forman la vía magnocelular hasta el tálamo y el córtex visual)
  • Se origina en las células grandes M de la retina y es magnocelular
  • Es responsable del dónde están los objetos.
  • Es parietal
La vía ventral se origina en las células pequeñas de la retina (células P que forman la vía parvocelular hasta el tálamo y el córtex visual)
  • Se origina en las células pequeñas P de la retina y es parvocelular
  • Es responsable del qué objetos.
  • Es temporal
  • Tiene una organización jerárquica según progresa la vía.
  • Cada nivel de la jerarquía responde a un campo visual mayor que el anterior duplicándose el campo receptivo.
  • En cada nivel de la jerarquía hay mayor selectividad a la forma
  • La forma se reconoce con independencia de la posición que ocupe en el campo visual.
  • Es responsable del reconocimiento de objetos, caras y palabras.
En la vía ventral, la del qué, las neuronas de las primeras etapas responden a formas simples (una neurona responde a una línea), mientras que las etapas finales responden a formas complejas (una neurona solo responde a una cara). La vía ventral es responsable de que podamos identificar palabras a una velocidad de 150ms por palabra. En ocasiones la vía ventral no es capaz de identificar las palabras. En ese caso, para palabras extrañas, hay que recurrir a la vía dorsal, se requiere pronunciarlas y el proceso tarda 1 o 2 segundos.
Aprendizaje
Al final de la vía ventral se encuentra la VWFA para reconocer palabras. Pero esta vía no es innata. Es un área de reconocimiento de formas que se ha reconvertido debido al aprendizaje y a la plasticidad del cerebro. Durante nuestra larga infancia, el VWFA se modifica mínimamente para reconocer letras. El aprendizaje de palabras ha usurpado estas zonas visuales del que podría ser el reconocimiento de otros objetos naturales mediante el reciclaje neuronal. Para ello ha sido necesario que la escritura utilice rasgos sencillos, rasgos que biológicamente son fáciles de reconocer. En este sentido, la escritura está biológicamente determinada.

No todo se aprende de igual forma. Solo los bigramas útiles se aprenden: CA vs QQ. La VWFA no responde a secuencias aleatorias de consonantes y sí a palabras o bigramas comunes. Los lenguajes de ortografía transparente (como el castellano) necesitan el reclutamiento de menos áreas que los opacos (como el inglés) que tienen menos regularidad grafema-fonema y necesitan usar mayores áreas para el reconocimiento de palabras. Un punto importante es que también hay que desaprender. En concreto, las áreas de reconocimiento de formas responden a la simetría: si damos la vuelta a un objeto, sigue siendo el mismo como demuestran ls estudios con niños y monos. Sin embargo, la lectura requiere desaprender la simetría ya que b y d son distintas. Este proceso de desapredizaje es complejo y es la causa de la dislexia.
Braille
La lectura tiene 5000 años pero el Braille solo 200. Un reciente estudio usando fMRI ha mostrado como el VWFA es utilizada por los ciegos al leer Braille. En 8 sujetos ciegos se realizaron tareas de lectura Braille mientras eran sometidos a fMRI. Sus datos se compararon con personas que ven.
  • La activación en la VWFA se producía ante palabras con significado, pero no ante secuencias Braille sin sentido.
  • Medido el cerebro entero, el pico de activación se producía en la VWFA, en las mismas coordenadas cerebrales que en las personas que ven
Queda pendiente establecer cuales son las vías por las que la información táctil llega a la VWFA. El área VWFA está próxima a las áreas del lenguaje, pero nuevos estudios anatómicos son requeridos.
La VWFA es el área más selectiva a la lectura independientemente de la modalidad sensorial (vista o tacto). Por ello el VWFM además de llamarse el área visual de reconocimiento de palabras podría llamarse el área táctil de reconocimiento de palabras o el área metamodal de reconocimiento de palabras. Aunque ya sabemos que es un área de reconocimiento de formas modificada por el aprendizaje.

domingo, 22 de mayo de 2011

Jardín de Blogs. Watson, prejubilación J. R. Millán, Top500, cableado, BCI, fumar, pinzón, Boby McFerrin, Paulov y comer

Parte de la serie sobre Watson, Brain Computer Interface (BCI) y diversos temas entre las entradas del blog tecnologíayciencia en el Jardín de Blogs.
IBM Watson. Su próximo médico puede ser un robot
La prejubilación implica declive mental
La silla de ruedas controlada con el cerebro de José del R. Millán
Lista de superordenadores Top500. Noviembre 2010
El cableado del cerebro: ¿una red o una pirámide?
El Pentágono quiere controlar remotamente la mente de los soldados
El casco BCI de Intel distingue entre 1000 palabras 
¿Qué beneficios tiene dejar de fumar?
Retratos de la mente. Reportaje fotográfico de Wired
Tus dedos saben cuando cometes un error en el teclado
Ray Kurzweil: ¿Por qué la victoria de Watson de IBM en Jeopardy importa?
Modelo predictivo del canto del pinzón.
Watson empata el primer encuentro con humanos en Jeopardy. Vídeos disponibles
Watson destroza a los humanos en el 2º día de Jeopardy. Vídeos disponibles
Watson gana el desafío final de Jeopardy. Vídeos disponibles
Watson en Jeopardy. Todas las preguntas y respuestas.
Retina artificial
Expectativas de Bobby McFerrin en TED
Filete con autógrafo de Pavlov
Comer mentalmente reduce el consumo real

domingo, 15 de mayo de 2011

El cerebro tiene una capacidad de memoria de 500 petabytes y de procesamiento de 1 exaflops

¿Cómo se puede llegar a las sorprendentes cifras de que la memoria del cerebro es de 500 petabytes y la capacidad de proceso de 1 exaflops? Especulando y realizando múltiples supuestos. El resultado es una estimación que puede estar errada en varios órdenes de magnitud. Expongo el razonamiento para que cada cual saque sus conclusiones.
Grandes números.
La primera estimación es la del número de neuronas en el cerebro. El dato más repetido en la red es 100.000.000.000 (10^11). Considero equivalente cerebro y encéfalo (brain en inglés) y que incluye todas las estructuras dentro del cráneo como el cerebelo y el córtex (que solo representa 1/5 parte del cerebro)
El número de sinapsis es también una estimación. Una neurona puede tener hasta 100.000 sinapsis. La cifra media está entre 5.000 y 10.000. Considero para el cálculo 5.000 sinapsis por neurona.
El número total de sinapsis, por tanto, es de 500.000.000.000.000 (10^14*5).
100.000.000.000 neuronas
500.000.000.000.000 sinapsis
Neuronas Integrate&Fire y neuronas biológicamente realistas.
Las simulaciones utilizan dos tipos de neuronas. La mayoría de ellas usan un modelo Integrate&Fire. Se trata de una neurona sin representación espacial que integra la entrada que proviene de otras neuronas y decide dispararse o no. Es un modelo válido para múltiples casos y el más utilizado. De otro lado están las neuronas biológicamente realistas. Estas usan una representación tridemensional y computan lo que ocurre en cada segmento de la neurona: dendritas, cuerpo y axón. Sus necesidades computacionales son 10.000 veces superiores que las Integrate&Fire.
Estimaciones
El proyecto Blue Brain usa neuronas realistas. Henry Markham estima que la memoria necesaria para simular el cerebro es 500 petabytes y la capacidad de cómputo es de 1 exaflops. Como se verá, esta es la estimación que considero más realista.
Dharmendra S. Modha ha realizado una simulación con neuronas Integrate&Fire de la que se pueden extrapolar datos. Uno de ellos es que necesita 16 bytes por sinapsis para que la simulación sea operativa. Modha habla solo del córtex y de 10.000 sinapsis por neurona. Su predicción es que se necesitan 4 petabytes (4.000.000.000.000.000) de memoria y 1 exaflops (1.000.000.000.000.000.000) de capacidad de proceso. Corregido el dato de memoria, mi primera aproximación es de 8 petabytes:
Se trata de neuronas Integrate&Fire, es decir, de neuronas simplificadas. ¿Podemos simular la expresión de los genes o la proximidad a otras neuronas? No podemos. Dado que las necesidades computacionales son 10.000 mayores en las biológicamente realistas, el cálculo arroja la cifra de: Memoria = 80 exabytes (80.000.000.000.000.000.000). Muy lejos de la estimación de Modha y también de la de Markham (aunque solo 160 veces más). Dado que este último ya usa neuronas realistas, considero válida su cifra de:

Memoria = 500 petabytes (500.000.000.000.000.000)

Es de resaltar que Watson solo usa 500 gigabytes para responder en Jeopardy. 500 gigabytes son 200 millones de páginas de texto (40x60=2.400 caracteres por página). Es decir, la información textual representa una parte mínima del almacenamiento total del cerebro. En la página de información de Watson se sugiere que la capacidad del cerebro está entre 1 y 1000 terabytes, una enorme variabilidad pero aún a mucha distancia de la cifra a la que yo llego.
Siguiendo con la especulación, toca el turno a la capacidad de proceso. El proyecto Blue Brain usa neuronas realistas. En concreto, usa 22 Teraflops (22.000.000.000.000 flops) para computar 10.000 neuronas. Consiguientemente, la capacidad de computación necesaria para el total del cerebro es de: Procesamiento = 220 exaflops (220.000.000.000.000.000.000 flops). Esta cifra de nuevo es mayor que las de Modha y Markham (solo 220 veces) que esta vez coinciden (aunque de forma sorprendente ya que usan dos modelos distintos de neuronas; la explicación mejor es que sus datos, como todo lo que llevas leído es pura especulación). Doy por buena la cifra de ambos:

Procesamiento = 1 exaflops (1.000.000.000.000.000.000 flops)

Las cifras que ofrecen los seguidores de la singularidad de Ray Kurzweil, 10 petaflops, están de nuevo muy lejos de las mías, lo que viene a confirmar que esto es solo un ejercicio y que ante tanta variabilidad, cada cual puede escoger su cifra.



Prefijos del sistema internacional de unidades

Singularidad
Modha

domingo, 8 de mayo de 2011

Cómo engañar a un detector de mentiras basado en fMRI

¿Es posible engañar a un detector de mentiras basado en un escáner fMRI? Sí, con facilidad.
La resonancia funcional magnética fMRI es una herramienta de gran utilidad en el estudio del cerebro. Recientemente se ha postulado como detector de mentiras. Varias compañías comerciales ofrecen el servicio y ha habido debates en juicios sobre su uso, aunque siempre ha sido rechazado.
Los estudios sobre su eficacia han sido contundentes hasta la fecha. Su fiabilidad es del 100%. Sin embargo, en un nuevo estudio en el que se enseña a los sujetos a engañar al detector de mentiras, la fiabilidad cae hasta el 33%.
En el estudio se ha usado un paradigma clásico de detección de mentiras.
Veintiséis participantes fueron sometidos a un escáner fMRI mientras se les mostraban seis fechas una a una. Para cada fecha debían de pulsar un botón si se trataba de la fecha de su nacimiento. En el primer caso se les pidió que dijeran la verdad, se les presentaron seis fechas que no eran las de su nacimiento y dijeron la verdad: no. En el segundo caso se les presentaba entre las fechas la de su nacimiento y debían mentir: decir que no a todas. Esta prueba se parece a los casos reales de los juicios en los que a un sospechoso se le presentan varios cuchillos y debe de decir si alguno es suyo (si el detector de mentiras nota que el sospechoso se pone nervioso a la vista del cuchillo del crimen, cabe inferir que es su cuchillo).
Cuando los participantes mentían y decían no a la vista de la fecha de su nacimiento, la mentira se reflejaba en su actividad neural. Ambos lados de la parte más frontal del cerebro se activaban. Centrándose en la actividad de estas áreas, un algoritmo podía adivinar con una exactitud del 100% que el participante mentía. 


Hasta aquí lo ya conocido. En el nuevo experimento se les enseñó a mentir de una sencilla forma. Debían de mover ligeramente el dedo de una mano o de un pié en 3 de las 6 fechas irrelevantes. Esto producía actividad neural similar a la producida al mentir de modo que el algoritmo ya solo detectaba un 33% de las mentiras en lugar del 100%. El escáner no distinguía entre mentir delante de la fecha de nacimiento o mover el dedo delante de una fecha irrelevante.
La resonancia funcional magnética fMRI es una poderosa herramienta de investigación y es probable que acabe utilizándose en los juicios para detectar la huella neural del crimen, pero antes de que esto ocurra ha de superar muchas pruebas y refinar sus resultados.

martes, 3 de mayo de 2011

Los jóvenes, expertos digitales, educados para la distracción.

The New York Times publica un artículo con el que muchos padres se pueden sentir identificados. "Creciendo digitalmente, cableados para la distracción". 

En dos meses, Luis apenas ha leído 40 páginas del libro que constituye la única tarea del verano. El prefiere Facebook. En Youtube tienes la historia entera en 5 minutos. Un libro es demasiado largo. Prefiere la satisfacción inmediata. Los estudiantes siempre han tenido distracciones y pérdidas de tiempo. Pero el flujo constante de estímulos que ofrecen los ordenadores y smartphones es irresistible. Para los adultos, pero sobre todo para los jóvenes.
El cerebro se acostumbra a cambiar de tareas y no a la atención sostenida. La recompensa no está en una tarea, sino en saltar a la siguiente. Los cerebros de los jóvenes se van a cablear de forma distinta, dice Michael Rich, profesor de Harvard Medical School.
A pesar de ello, padres y educadores promueven la tecnología en un esfuerzo por conectar con los jóvenes. Luis envía cientos de mensajes diarios, pasa horas con vídeojuegos y como todos sus compañeros, está en Facebook. Con frecuencia se acuesta tarde y arrastra sueño por el día. Vive en un mundo más virtual que real. Convertido en un experto en ordenadores y tecnología, sube y manipula fotos con destreza. Y sus calificaciones escolares caen en proporción inversa a su destreza digital. La tendencia a posponer las tareas se exacerba. Luis está cambiando.
Los estudios muestran con claridad que los jóvenes usan los ordenadores como entretenimiento, no para aprender. Y sin supervisión, su rendimiento escolar se desploma. Además mezclan el estudio y el entretenimiento y una gran mayoría ven vídeos y chatean a la vez que estudian.
Hay un pasatiempo para cada tipo de joven: los "sociales" chatean y usan Facebook, los tímidos usan videojuegos y los perezosos surfean en la web o ven vídeos. Algunos tímidos se convierten en introvertidos.
Empiezo a hacer los deberes y al poco tiempo me llega un mensaje de texto, hago una pausa, tomo el teléfono para responder al mensaje y 20 minutos más tarde me doy cuenta: 'Vaya, me he olvidado de los deberes'
Los nuevos teléfonos exacerban el problema. Controlar el uso del ordenador es complicado, pero el teléfono mucho más. Muchos padres quieren poder llamar por teléfono a sus hijos a cualquier hora, así es que quitárselo no siempre es posible. Otros padres dan la bienvenida acrítica a la tecnología aunque sus beneficios educacionales sean dudosos. No faltan jóvenes que incluso desean que sus padres les limiten el uso de la tecnología ya que ellos se ven incapaces de hacerlo.

Algunos estudios neurocientíficos están empezando a trabajar sobre el asunto.
Alternando la TV y los vídeojuegos después de las tareas y midiendo los patrones cerebrales durante el sueño, llegaron a la conclusión de que la calidad del sueño disminuía con los videojuegos y también la capacidad para recordar vocabulario. No está claro si el peor rendimiento en el vocabulario se debe a un sueño deficiente o a el hecho de que el juego compite con el vocabulario. "Si practicas el vocabulario y tienes un fuerte estímulo después, el cerebro debe decidir qué información es relevante para almacenar, y el estímulo más excitante predomina."
Los estudios con ratas muestran que los nuevos aprendizajes se consolidan al descansar. Los estudios de neuroimagen lo certifican: en el descanso se sintetiza la información, se conectan las nuevas ideas y se forman recuerdos persistentes. El descanso es al cerebro lo que dormir es al cuerpo. Pero los jóvenes no descansan. Están en modo de estimulación constante.
Los cerebros jóvenes están habituándose a la distracción y al cambio de tareas a la vez que se alejan de la concentración en la tarea. La diferencia entre los ordenadores y el estudio es clara: la interacción. Aprietas un botón y algo ocurre.

Las conclusiones del tipo de estudios que menciona el artículo siempre han de tomarse con una cierta distancia. La inquietud, sin embargo, está fundada. No se puede prescindir de los nuevos dispositivos electrónicos ni se debe, pero es necesaria una distribución equilibrada del tiempo. Esperemos que la tecnología se pueda combinar con el estudio y el pensamiento analítico profundo.