Ya es hora de abandonar la idea de que somos el estándar dorado de la inteligencia y hacer un test usando una escala más fundamental de la inteligencia.
¿Cuán inteligente es usted? Me gustaría pensar que sé lo inteligente que soy, pero la prueba que tengo delante de mí me lo está haciendo reconsiderar. En mi pantalla de ordenador, aparecen una fila desconcertante de cajas: algunos contienen símbolos de aspecto extraño, mientras que otros están vacíos. Hago clic en una de las cajas. Una señal roja indica que cometí un error ¡Caray! Me concentro, y vuelva a intentarlo. ¡Sí, la recompensa es dulce! A pesar de este pequeño éxito, me resulta difícil entender lo que está sucediendo: esto no se parece a ningún examen que haya hecho.
Esto no es de extrañar, quizá porque se siente poco familiar, no es la típica prueba de IC. Estoy tomando parte de las primeras etapas de un esfuerzo por desarrollar la primera prueba «universal» de inteligencia. Mientras que el IC y las pruebas psicométricas tradicionales están diseñados para marcar las diferencias entre personas, el test universal se amplía a humanos, robots, chimpancés, hasta extraterrestres, en una única escala, con una definición matemática derivada de la inteligencia, en lugar de una contaminada por el sesgo humano.
Infografía: ¿Cómo podría funcionar una prueba de la inteligencia universal?
La idea de una prueba universal surgió de un estudio de la inteligencia artificial y el deseo de encontrar formas mejores de medirla. El próximo año, la prueba más famosa para medir la inteligencia de las máquinas será ampliamente celebrada en el 100 aniversario del nacimiento de Alan Turing, su creador. El test de Turing es, sin embargo, erróneo. Para pasarlo, una máquina tiene que engañar a un humano y hacerle creer que está conversando con otra persona. Pero, exactamente, ¿cuánto más inteligentes somos que un robot? El test no podía decirlo. Tampoco se puede medir una inteligencia mayor que la de un humano. Las máquinas son cada vez más inteligentes, y pronto, posiblemente más inteligentes que nosotros, por lo que necesitamos una forma más óptima de medir la inteligencia.
Sin embargo, una prueba de inteligencia universal no haría más que proporcionar una herramienta para la investigación en IA. Caso de encontramos con una avanzada civilización de otro planeta, una prueba basada en principios matemáticos podría ayudarnos a entenderlo. Y aquí en la Tierra, nos podría ayudar a identificar formas de vida que muestran tipos desconocidos de inteligencia, ¿quién ha dicho que la nuestra es la única clase que hay? De hecho, la elaboración de un test libre de los prejuicios humanos puede ser el camino a seguir para descubrir la verdadera naturaleza de la inteligencia en sí misma. «Si usamos sólo los parámetros de una especie, es muy difícil determinar con precisión qué es la inteligencia», declara José Hernández-Orallo, de la Universidad Politécnica de Valencia, España, y uno de los proponentes de la idea. Nosotros siempre nos hemos considerado el súmmum de la inteligencia, pero ya es hora de renunciar a la idea de que nuestros cerebros son el punto de referencia.
Testear nuestra inteligencia es bastante fácil con los tests de cociente intelectual (CI), pese a que hay algunos defectos reconocidos. Pero cuando se trata de medir con precisión la inteligencia no-humana, estas pruebas no sirven de nada. No están basadas en las matemáticas, ni siquiera en una definición formal de la inteligencia, y a menudo, asumen conocimientos y habilidades que son únicos para nosotros.
En Inteligencia Artificial (IA), el test de rendimiento más conocido es el de Turing. Sin embargo, encontrar un programa que pueda imitar las capacidades de la mente humana ha demostrado ser un gran desafío. Desde 1990, la competición por el premio Loebner, basado en el test de Turing, ha provocado la creación de una multitud de «charla-bot» con las habilidades sociales bastante impresionantes, aunque para la mayoría de investigadores de la IA no piensen que sean realmente inteligentes. «El test de Turing da lugar a interesantes discusiones filosóficas acerca de la inteligencia en general y de cómo puede medirse, pero nunca se ha tomado en serio como objetivo final de la IA», comenta Marcus Hutter, de la Universidad Nacional Australiana en Canberra.
En su lugar, se han hecho un sinnúmero de tests específicos de limitado alcance, por ejemplo, en la capacidad de jugar al ajedrez. Deep Blue, de IBM, venció a Garry Kasparov en 1997, y sin embargo, sería completamente inútil para completar un crucigrama, o incluso para averiguar la mejor manera de doblar la ropa.
Un intento por animar el desarrollo de la IA, en un espectro más amplio de inteligencia, es la General Game Playing competition, que se celebra anualmente en la reunión de la Asociación Americana de Inteligencia Artificial. Los robots se sirven de una combinación de juegos, desde las tres en raya (tic-tac-toe) a las damas. A continuación, diseñan su propio plan de juego usando nada más que una lista de reglas de aquellos juegos que jugaron de antemano.
Sin embargo, la competencia sigue siendo entre máquinas y humanos. ¿Podría haber otro punto de referencia, independiente, para su inteligencia? Si es así, podríamos comparar las máquinas entre sí con mucha más precisión, así como a nosotros mismos.
Hernández-Orallo decidió idear un test, junto con David Dowe, que se especializa en la teoría de la información y estadística, en la Universidad de Monash en Melbourne, Australia. Buscando inspiración, se dirigieron a una definición matemática de la inteligencia que tiene sus raíces en la década de 1960.
En aquel entonces, el pionero de la IA, Ray Solomonoff, relacionaba la inteligencia con la capacidad de resumir o «comprimir» la información detectando patrones. Esta habilidad permitió una mejor resolución de problemas que el mero uso de ensayo y error. Por ejemplo, frente a las secuencias 10101010101010 ó 1234567, una máquina o persona que se da cuenta que pueden resumirse con la «repetición» de siete veces ’10’ o «cuenta hasta 7» es considerado más inteligente que otro que no lo haya pensado. La compresión también conduce a la capacidad de predecir: una máquina que puede detectar un patrón puede usar esa información para nombrar los dígitos siguientes. Esto se relaciona con el aprendizaje predictivo, básicamente es la capacidad de aprender por observación, generalización y reutilización de patrones.
No es nada nuevo que los patrones de búsqueda están relacionados con la inteligencia. Pero la contribución de Solomonoff fue cuantificar matemáticamente el proceso de aprendizaje predictivo, utilizando un concepto que ahora se conoce como la complejidad de Kolmogorov. La información que puede ser fácilmente resumidas, como las secuencias anteriores, tienen una baja complejidad de Kolmogorov, mientras que una secuencia verdaderamente aleatoria, no se puede resumir en absoluto, entonces tiene una alta complejidad de Kolmogorov. A pesar de las implicaciones para la IA, las ideas de Solomonoff se han mantenido ignoradas hasta finales de la década de 1990, cuando Dowe, y más tarde Hernández-Orallo, empezaron a explorar la conexión entre la compresión y la inteligencia.
En este esfuerzo por estimular la investigación de la IA en esta dirección, en 2006 se creó el Human Knowledge Compression prize, comúnmente conocido como el premio Hutter, donde se recompensa en efectivo a los diseñadores de algoritmos que puedan comprimir un extracto de 100 megabytes de la Wikipedia en partes más pequeñas. Sin embargo, Hutter es el primero en admitir que la compresión por sí sola no puede explicar todos los aspectos de la inteligencia. Para demostrar plenamente sus capacidades, la IA también debe testear la capacidad para utilizar los conocimientos que ha comprimido: debe demostrar que puede tomar decisiones inteligentes y planificar el futuro en base a lo que sabe, aduce. Usted puede pensar que es algo trivial el ser capaz de decidir si tomar un paraguas cuando el cielo se ve amenazante, pero es este tipo de reconocimiento de patrones, lo que también nos permite predecir el movimiennto de un oponente en el ajedrez, por ejemplo, y en última instancia, es lo que nos ha ayudado a ser la especie dominante del planeta.
El diseño de un test práctico que mida estas habilidades matemáticas es tan difícil como suena, pero Hernández-Orallo y Dowe pensaron que sería posible utilizar la complejidad de Kolmogorov para testear la capacidad de toma de decisiones y planificación, así como la compresión.
Tengo una idea de cómo este test podría funcionar probando una versión inicial, a la que llaman «Anytime Intelligence» test. Ya han probado con humanos y máquinas para darle una oportunidad. A pesar de que este «prototipo» es una gran simplificación y todavía no puede considerarse una test universal, que sirve como clara demostración de sus principios (Inteligencia Artificial, DOI: 10.1016/j.artint.2010.09.006).
El test Anytime Intelligence consiste en una serie de tareas interactivas en una pantalla de ordenador. Cada tarea se compone de una hilera de cajas que contienen símbolos. Al principio, sólo hay tres cajas, pero el número se va incrementando en las tareas posteriores. El objetivo es ganar el mayor número posible de «premios» positivos y evitar los negativos. He leído las instrucciones antes, y una IA será programada con estas reglas.
Rutas invisibles
Una vez comenzado el test, podía utilizar mi ratón para mover un símbolo que me representaba a «mi» entre las cajas. Después de cada selección, los otros símbolos de los cajas también se moverían, y eso retroalimentaría que mi elección fue positiva, negativa o neutral. Esto se muestra con una señal en verde, rojo o gris, respectivamente (ver diagrama).
Después de un tiempo, empecé a notar patrones. La clave fue que moviendo ciertas casillas no estaba permitido. Resultó una red invisible de «caminos» que unían unas cajas a otras. Usando estas rutas de acceso se «persigue» a uno de los dos tipos de símbolos que conducen a recompensas positivas, y viceversa para el otro símbolo.
Vale, pero ¿cómo se pone todo esto de manera que mida la inteligencia? Los patrones de rutas y el comportamiento de los otros símbolos dentro de este entorno se pueden expresar como una cadena de bits, que con la complejidad de Kolmogorov se puede estimar. Asi que, tu capacidad para identificar patrones, medida por los premios que ganas, se puede utilizar para calcular una puntuación. En otras palabras, el test resulta matemáticamente capaz de evaluar tu capacidad para detectar, comprimir y reutilizar el conocimiento.
Es más, algunas de las habilidades más específicas pertenecen al software y no dan ventaja alguna a los humanos. Hernández-Orallo y Dowe se percataron que las criaturas usan para navegar entornos espaciales, como nosotros, detectan ciertos patrones con más facilidad que un ordenador: por ejemplo, podríamos estar más inclinados a percibir caminos entre las cajas físicamente adyacentes. Por eso, se aseguraban de que las rutas se generasen aleatoriamente. Por el contrario, un test es sin tiempo, lo que significa la capacidad de una máquina para hacer cálculos rápidos, tampoco se ve favorecida.
Hernández-Orallo, Dowe y su equipo, pidieron a 20 personas que tomaran 20 variantes del test prototipo. También testeamos un algoritmo de aprendizaje de máquina, llamada Q-learning, que fue elegido porque está programado para aprender sobre la base de las recompensas que se le da. Presentaron el experimento en agosto, en la conferencia sobre Inteligencia Artificial General en Mountain View, California.
Los resultados revelaron más acerca de los desafíos que implica la construcción de un test de inteligencia universal que sobre la inteligencia de los participantes. El algoritmo Q-learning tiene de promedio una puntuación ligeramente mejor que la gente. Sin embargo, nadie sugeriría que la inteligencia de Q-learning es superior a la de un humano, dice Hernández-Orallo. «Por lo demás, Q-learning es un sistema bastante estúpido.»
Entonces, ¿cómo hacer un test universal más eficaz? Uno de los primeros pasos sería hacer un test que respondiera al rendimiento individual. El prototipo no se adapta a la inteligencia de una manera fácil de conseguir. Tendría que ser más difícil si alguien sobresale en ello, y más fácil si no lo está haciendo bien. Esto aseguraría que los participantes más inteligentes, como los humanos, hicieran tests más duros, y, en consecuencia, con la oportunidad de brillar. Esto también supondría evitar el aburrimiento por si la prueba es demasiado fácil o difícil, un problema con el tuve que lidiar cuando lo hice.
Permitir que la prueba sea realizada por animales (no hablemos de extraterrestres), la interfaz tendría que ser rediseñada. Podríamos tener problemas para conseguir que un perro se siente ante una pantalla, y no digamos de un delfín operando con el ratón del ordenador. Los psicólogos de animales ya han luchado con este tipo de problemas en el pasado. «Podemos comparar diferentes especies en algunas tareas básicas y comparar el rendimiento», señala Douglas Detterman, de la Case Western Reserve University en Cleveland, Ohio. «El problema es qué tareas deben ser diseñadas para cada especie con el fin de mostrar un rendimiento óptimo. Por ejemplo, ya que no se pueden dar instrucciones por escrito, ¿cómo hacemos que cada animal se acerque a la prueba en igualdad de condiciones?
Hernández-Orallo cuenta con expertos en cognición animal para ayudar con estas cuestiones, pero un problema similar, podría ocurrir incluso con las máquinas: diferentes algoritmos pueden responder de manera distinta a las mismas instrucciones programadas, lo que no necesariamente valoraría su inteligencia.
«Espero que se lleve algún esfuerzo de investigación hasta que estas cosas se resuelvan», apunta Tom Schaul, investigador de IA en la Universidad de Lugano en Suiza, que está trabajando en un test general rival para las máquinas. Él cree que podría diseñar un algoritmo que mejorara el test en la realización de otras tareas. Sin embargo, también piensa que Hernández-Orallo y Dowe están en el camino correcto. «Lo que más me gustó es que se lograsen realizar un test que no prefiera a los agentes humanos por encima de los artificiales o viceversa», añadió. «Para el futuro de la IA es crucial» un test formal, testeable y completamente general de la inteligencia.
Si funciona, las implicaciones y beneficios de un test auténticamente universal sería de gran alcance. «Entender qué es la inteligencia, no se puede separar del problema de cómo la inteligencia se puede medir», indicó Hernández-Orallo, de igual manera que la energía, la distancia y la velocidad sólo se pueden entender a través de nuestra habilidad para medirlas cuantitativamente. Él dice que nuestra actual incapacidad de cuantificar la inteligencia en un sentido general, fuera de la especie humana, es un problema importante, relegándola a una idea filosófica, más que científica.
Inteligencias varias
Ciertamente hay un potencial para el descubrimiento si somos capaces de ver más allá de nuestro punto vista de la inteligencia centrado en lo humano. Los investigadores ya han descubierto la inteligencia en seres inesperados, como los mohos del cieno que viven en el estiércol, los cuales demuestran una sorprendente capacidad para navegar por laberintos. Cefalópodos, también calamares, pulpos, etc., tienen una destreza mental que sólo recientemente ha sido debidamente apreciada.
¿Quién sabe qué otras sorpresas podemos encontrar en la Tierra, por no mencionar el espacio, si pudiéramos diseñar un test capaz de evaluar sufientemente a otros seres? «Explorar la inteligencia a través del caso especial de la inteligencia humana es un serio error», opina Blay Whitby, filósofo de la Universidad de Sussex en Brighton, Reino Unido, especializado en la IA. «Si relajamos ese requisito de que ha de ser como la nuestra, podríamos ver mucho más tipos de inteligencia.»
Tal vez podríamos mostrar un poco más de aprecio por la IA que hemos creado aquí en la Tierra, desde los sofisticados algoritmos de búsqueda que nos permite navegar por la web hasta los programas que tienen tanta influencia sobre los mercados de valores. «Una vez que se cae el requisito antropocéntrico, la Inteligencia Artificial parece mucho más impresionante», declara Whitby.
Pensando en todo esto, recuerdo que mi primer intento con el test de Hernández-Orallo: La verdad es que he encontrado todas esas cajas coloreadas tan confusas y frustrantes que simplemente me rendí. Dudo que una máquina hiciera lo mismo. Lo deficiente que la inteligencia humana puede llegar a ser nunca ha sido tan evidente.
- Referencia: NewScientist.com, 13 de septiembre 2011 por Celeste Biever
- Infografía: New Scientist
- Image gorila: Gary Vestal/Photographer’s Choice/Getty
- Traducido por Pedro Donaire
- http://bitnavegante.blogspot.com/2011/09/el-test-de-inteligencia-universal-como.html?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+bitnavegante+%28BitNavegantes%29&utm_content=Google+Reader&utm_term=Google+Reader