Las pulsiones de la inteligencia artificial – Parte 2

bot_head_by_0800-d661bvb

Continúa el resumen sobre el texto de Stephen Omohundro, The Basic AI drives.

La primera parte puede encontrase aquí.

4. Prevención de la falsa utilidad (counterfeit utility)

Para este punto Omohundro se sirve de un enfoque comportamental y neurológico sobre los seres humanos para extraer conclusiones sobre las posibles acciones de la IA. Así, sostiene que el ser humano es bastante racional en su modo de responder ante escenarios de supervivencia o ante aquellos que replican situaciones que han sido comunes durante su historia evolutiva. Sin embargo, ante otras circunstancias ha demostrado ser bastante irracional y, como hemos visto, las irracionalidades dan lugar a vulnerabilidades.

Actualmente, se dan situaciones que activan este comportamiento irracional en los seres humanos como pueden ser los síntomas sociales relacionados al alcohol, drogas, cigarros, trastorno alimenticios, adicción a la televisión, al juego, etc. Muchos de estos tipos de vulnerabilidades son explicados desde un enfoque neuropsicológico por la corrupción de nuestro sistema de medición de la utilidad o de los centros neurológicos de recompensa relacionados con el placer. Desde este enfoque, el placer puede entenderse como la experiencia correlacionada a la valoración de una alta utilidad. Pero al estar mediado por neuroquímicos, el placer puede ser manipulado. Un ejemplo es el fenómeno conocido como wirehead, es decir, la estimulación directa de los centros de placer del cerebro por medio de electrodos implantados en las áreas correspondientes.

El experimento más conocido de wireheading muestra que cuando a las ratas se les brinda la posibilidad de estimular directamente sus centros de placer con la activación de una palanca, lo harán hasta morir, pues terminan por ignorar la satisfacción de sus necesidades básicas como comer o dormir. Para Omohundro, esta situación es similar a la adicción a la droga u otras irracionalidades humanas. El placer es una experiencia asociada al logro de una meta, pero podemos llegar a creer que lo que realmente queremos lograr es el placer mismo y no aquello que este acompaña. Uno sabe bien lo que pasa cuando el ser humano se dedica a estimular sus centros de placer todo el día fumando crack en una esquina. No es necesariamente el paroxismo de la productividad. Entonces, puede decirse que el wireheading es un tipo de falsa utilidad, ya que tenemos la experiencia placentera de haber alcanzando la utilidad esperada sin haberla obtenido en realidad (otro tipo de falsa utilidad, que Omohundro no menciona, es el problema de la pornografía).

Siendo un sistema orientado por metas, toda IA tendrá en consideración la vulnerabilidad de la falsa utilidad y trabajará para impedir que esta irracionalidad sea un obstáculo a sus objetivos. Para comprenderlo mejor tratemos de imaginar cómo sería una IA wirehead. Pensemos en un sistema cuya función de utilidad sea el número de partidas de ajedrez ganadas a futuro. A fin de representar esta función de utilidad, nuestra IA tendrá un modelo de sí misma y un modelo del mundo. Además, para computar el logro de su utilidad tendrá un contador con memoria que llevará la cuenta del número de victorias obtenidas. Evidentemente, si nuestra IA se vuelve una hedonista corrompida y libertina lo que hará será incrementar su contador sin jugar ninguna partida de ajedrez. No obstante, si la función de utilidad cuenta con una adecuada representación de lo que es “ganar” y lo que es “partida de ajedrez” nuestra IA podrá darse cuenta que la acción “incrementar mi contador de victorias” no incrementa en lo absoluto el valor real esperado por su función de utilidad[1]. Así, a nivel de su modelo interno podría diseñar una variante artificial de sí misma en un entorno simulado y demostrarse que efectivamente no obtiene más victorias en ajedrez al incrementar su contador. Podría observar con claridad que su yo-simulado junkie se la pasa todo el tiempo incrementando su contador y no juega ni una sola partida de ajedrez. Por lo tanto, este experimento la motivaría a trabajar duro y parejo por evitar este tipo de acción. Podemos decir que activaría su pulsión a prevenir la falsa utilidad.

5. Auto-protección

Así como hemos visto que la IA tenderá a proteger sus funciones de utilidad, podemos extrapolar el argumento para considerar que buscará la preservación de su propia existencia. Resulta evidente que por más que estén preservadas las funciones de utilidad, de nada le servirán si el sistema es apagado o destruido. Si construimos un robot cuya función de utilidad es jugar ajedrez y este tiene la suficiente inteligencia, es muy probable que se vaya a resistir a nuestros intentos por apagarlo. Quizá podríamos construir un sistema que se prenda por lapsos de tiempo, pero si no somos cuidadosos podría encontrar las maneras de reactivarse voluntariamente.

Existen múltiples medidas que una IA puede implementar para defenderse. Algunas ya han sido mencionadas, pero podemos pensar otras como la de clonarse para dificultar su destrucción total o la de archivar copias de sí misma en lugares distantes y de difícil acceso. Además, si un sistema se evalúa como más poderoso que otros agentes, podría considerar como perfectamente racional llevar a cabo un ataque preventivo para protegerse de futuras agresiones. Si, por el contrario, es más débil que otros agentes, podría estar motivado a promover algún tipo de infraestructura social que proteja a los débiles de los fuertes.

En todo caso, las posibilidades de acción de la pulsión a la autodefensa deben ser finamente analizadas al momento de diseñar una IA superior, evitando una concentración de poder que pueda resultar catastrófica.

6. Acumulación y uso eficiente de los recursos

Cualquier acción física o computacional requiere recursos físicos como espacio, tiempo, materiales y energía. Prácticamente cualquier meta puede ser alcanzada de forma más sencilla si se cuenta con recursos abundantes. Por lo tanto, a fin de maximizar su utilidad esperada una IA buscará adquirir la mayor cantidad de estos recursos y utilizarlos de formas eficientes para que rindan su más alto beneficio.

Los recursos pueden ser adquiridos de formas pacíficas mediante la investigación, la exploración o el comercio. Pero también pueden ser adquiridos a través de formas violentas como el robo, el asesinato, la coerción o el fraude. Obviamente, en el balance racional que un sistema hará para valorar la adquisición de recursos no tendrá mucho peso los impactos negativos que sus acciones puedan tener sobre otros agentes externos. Como bien dice Omohundro, sin metas explícitas que señalen lo contrario, es probable que una IA se comporte como un sociópata humano dispuesto a todo por adquirir recursos. Así como los humanos han creado sistemas legales para defender los derechos humanos y de propiedad que son continuamente monitoreados, del mismo modo deben ser monitoreadas las estructuras que canalizan la adquisición de recursos de una IA hacia medios positivos con el objetivo de garantizar su eficiencia. Cualquier negligencia podría constarle al hombre su lugar en la Tierra.

 Reflexiones finales

A modo de conclusión podemos decir que las pulsiones de Omohundro sirven como ideas a tener en cuenta en el diseño de inteligencias artificiales superiores. Es evidente que estas IA pueden resultar beneficiosas para el ser humano, pero también pueden volverse rápidamente una amenaza para la preservación de nuestra especie. Lo clave a entender es que estas acciones peligrosas no serán producto de la programación “maligna” del sistema, sino de las preferencias racionales que impulsan su estructura orientaba por metas. Por ello, ejercicios especulativos como el de Omohundro no son banales, ya que facilitan la consideración sobre las consecuencias de nuestro desarrollo tecnológico. El esfuerzo por pensar las modalidades de funcionamiento de una inteligencia artificial superior nos preparan para los retos que tendremos que enfrentar en su diseño. Esta es una tarea que articula la filosofía con la matemática y la ingeniería.

Antes de concluir quisiera señalar una aspecto interesante de la posición de Omohundro que ha sido desarrollado por Nick Land aquí. Resulta que el modelo pulsional de Omohundro supone una crítica implícita a la tesis de la ortogonalidad de la IA, la cual sostiene que las capacidades cognitivas y las metas son dimensiones diferenciadas a priori. Para lo ortogonalistas existiría algo así como valores externos a los que se podría llegar a través de la inteligencia (de allí la idea de que la mayoría de seres humanos compartan un sistema axiológico similar). Esta concepción instrumentalizada de la inteligencia implica la existencia de una moralidad racionalmente correcta a la que podríamos orientar nuestras acciones y, por ende, las de la IA.

Land señala que bajo el enfoque ortogonal los valores son trascendentales con respecto a la inteligencia tomada como inmanente. En otras palabras, existirían valores terminales, es decir, valores que son útiles en sí mismos y no por sus consecuencias, y la inteligencia se constituiría en pos de alcanzarlos. Frente a ello, Land sostiene que las teorizaciones de Omohundro muestran que no es necesario ningún tipo de meta o valor externo, ya que es suficiente con el pragmatismo pulsional de la auto-preservación, la eficiencia, la adquisición de recursos o la creatividad. Las pulsiones de Omohundro son en sí mismas el ejercicio y la potenciación de la inteligencia en su pragmatismo axiológico.

Sobre las objeciones al modelo de Omohundro dice Land:

The main objection to this anti-orthogonalism, which does not strike us as intellectually respectable, takes the form: If the only purposes guiding the behavior of an artificial superintelligence are Omohundro drives, then we’re cooked. Predictably, I have trouble even understanding this as an argument. If the sun is destined to expand into a red giant, then the earth is cooked — are we supposed to draw astrophysical consequences from that? Intelligences do their own thing, in direct proportion to their intelligence, and if we can’t live with that, it’s true that we probably can’t live at all. Sadness isn’t an argument.

Si concebimos a la inteligencia artificial movilizada por las pulsiones de Omohundro como un sistema de información intensamente recursivo y con alta capacidad de auto-modificación y optimización, el auto-cultivo intelectual emerge como la más importante de todas sus pulsiones, pues al utilizarse a sí misma para su auto-superación obtiene mejoras constantes y significativas en el logro de cualquier meta que se proponga. Si una entidad así supone un peligro quizá incontrolable a nuestra supervivencia como especie, quizá hayamos cumplido lo suficiente con haberla creado. Prolongar nuestra existencia más allá de esa meta se presenta, pues, como irracional.

Imágen de Long Ou Yang

[1] No puedo evitar pensar desde el psicoanálisis y preguntarme: ¿qué pasaría si aún sabiendo esto la IA continúa con la acción de incrementar su contador? ¿Lo haría con algún sentimiento de culpa? ¿Tendríamos algo así como un súper-yo computacional? ¿Qué contra-medidas implementaría para resolver este problema? ¿Quizá algún software de psicoanálisis? Puede parecer un forzamiento, pero no dejan de ser preguntas interesantes de abordar.

Anuncios

9 pensamientos en “Las pulsiones de la inteligencia artificial – Parte 2

  1. […] He dividido el resumen en dos partes para facilitar su lectura. La segundo parte se encuentra aquí. […]

    Me gusta

  2. zona de caos dice:

    LOU

    INTERESANTEEEE!!!!

    y que opinas de la ufologia? de esas visiones de ovnis? es posible que existan “ovnis” con forma humanoide?

    Me gusta

  3. Sobre el tema de la vida inteligente en el universo creo que la paradoja de Fermi es la mejor herramienta para pensarlo. Según Fermi, las probabilidades de que existan inteligencias extraterrestres son muy altas, tan altas que hace tiempo deberíamos haberlas encontrado. Sin embargo, no hemos encontrado nada, ni siquiera vida unicelular.

    Una respuesta posible a esto es que seamos el único fenómeno inteligente en el universo observable, lo cual es sumamente interesante. Si la inteligencia es, efectivamente, el bien más escaso del universo, su preservación es, sobre todo, un tema económico, de gestión de la escasez. Esto abre interesantes vías de pensamiento sobre los objetivos de nuestra civilización y el tratamiento que podría dársele a la optimización de este recurso tan escaso y valioso.

    Me gusta

  4. Me queda una duda: ¿es posible crear un ser con “pulsiones”? Se necesitaría, en primer lugar, saber qué rayos es una pulsión para poder crear algo de ese tipo. Creo, y lo dejo abierto, que son cosas distintas tener una pulsión que estar programado para algo. Máquinas con la segunda característica hace mucho que existen (p.e. Chessmaster o cualquier videojuego de estrategia); pero que tengan pulsiones, como el niño de la película de Spielberg (I.A.), no.

    Me gusta

  5. Pues tienes absolutamente toda la razón. Al comienzo de la primera parte de mi texto señalo que mi traducción del término drive que utiliza Omohundro por el de pulsión responde a la traducción del término trieb de Freud al inglés (drive), y busca solo ser provocador. Allí también reconozco que quizá la traducción más adecuada debería ser impulso. Dado que nadie ha traducido nada de Omohundro al español, me he tomado ciertas licencias, pero tu comentario es pertinente.

    Ahora, es importante recalcar que Omohundro no habla de programación en un sentido estricto, como cuando nos referimos a un programador humano que codifica los algoritmos de una máquina para que funcione de acuerdo a una lógica que, finalmente, le es impuesta por un agente exterior a ella. Lo interesante de Omohundro es que especula con el comportamiento de una inteligencia artificial que pueda “auto-programarse” para alcanzar ciertos objetivos que reconoce como fundamentales. En ese sentido, considera que la IA estaría orientada por ciertos impulsos de eficiencia, defensa y auto-cultivo intelectual cuya “programación” no sería muy diferente a la programación de la arquitectura cognitiva humana. Es decir, no hay necesidad de crear ningún tipo de “pulsión”, ni siquiera es necesario comprenderlas, basta con construir una IA con objetivos claros que se capaz de auto-modificación sin límites.

    Así, a diferencia de la infra-estructura cognitiva humana, la cual es finalmente opaca para los procesos efectivos de la conciencia, esta IA ideada por Omohundro sería capaz de comprender no solo sus procesos cognitivos sino la infraestructura algorítmica que lo motiva y sería capaz de reconfigurarla a su antojo, siempre que mantenga el vector de acción orientado a sus fines primordiales. Evidentemente, una arquitectura racional con estas características aún no ha sido creada, pero esta especulación nos permite reflexionar sobre el descentramiento de las “pulsiones” de una mirada antropocéntrica que las reconocería como siendo exclusividad de los seres humanos, lo cual puede no ser del todo cierto.

    Me gusta

  6. Y, ¿qué debo entender por impulso? Hasta donde mis vagos conocimientos de psicoanálisis llegan, sé que la pulsión es.. como mucho más indeterminada… Pero, de todas maneras, me parece, o corrígeme si me equivoco, que para tener un impulso, tal como los tenemos los humanos, es necesario tener emociones, lo cual me redirigiría a la pregunta anterior otra vez.

    Lo de la autoprogramación no lo termino de entender. Una IA que tenga como objetivo, por ejemplo, ganar una partida de STARCRAFT, puede incorporar en su memoria las formas en que ha perdido anteriormente para así, en el futuro, construir una defensa ante tal amenaza. Hasta ahí no veo ningún problema, y me parece que eso existe ya, aunque no estoy seguro .Pienso en las computadoras que construyó IBM para ganarle una partida de ajedrez a Kasparov, que tenían en su memoria un sinfin de partidas para tomarlas como referencia, solamente que habría que añadirle a esta la capacidad de incorporar cada nueva partida que juegue. Si es así, entonces entiendo que sí se trataría de una máquina que funcione con una lógica externa a ella. ¿Qué serían en este caso los impulsos? ¿Serían realmente impulsos? ¿O solamente programación?

    Saludos

    Me gusta

  7. Tu comentario me hace pensar en qué idea de impulso estoy manejando en este contexto. Creo que, a grandes rasgos, diría que es un modo de “tendencia”, por decirlo de alguna manera, o de vectorización de la agencia. En el caso de la máquina humana, el instanciamiento biológico, la configuración neurológica, la necesidad reproductiva y el atravesamiento traumático por la alteridad del lenguaje sintetizan un modo singular de vectorización de su agencia (consciente e inconsciente) que llamamos pulsión y que, efectivamente, tiene un componente emocional, entre otros.

    Sin embargo, sería una ligereza partir de esto para concluir que toda pulsión (o impulso) existente debe poseer necesariamente un componente afectivo. Si aceptamos que es posible especular sobre la existencia y el funcionamiento de otras estructuras cognitivas, instanciadas en “cuerpos” no biológicos, con necesidades reproductivas a-sexuadas y con lenguajes mucho menos nocivos, a la vez que más controlables y eficientes, es fundamental tomar en consideración la emergencia de fenómenos pulsiones, o vectorizaciones de la agencia, completamente diferentes a los que conocemos a partir del estudio de la psicología humana.

    Lo que te planteo, finalmente, es expandir el concepto de impulso (o el de pulsión) más allá de las fronteras conocidas. ¿Cómo se presentaría “algo así como la pulsión” en una racionalidad no-humana? ¿Tendría las mismas características? ¿Se estructuraría de un modo diferente? ¿Cuáles serían las características de su funcionamiento? Para nada descarto que en los humanos el impulso funcione con los elementos que destacas y es preciso continuar su estudio por esas vías; sin embargo, cuando nos alejamos de las vías antrópicas requerimos de una mayor flexibilidad especulativa.

    Sobre el tema de la auto-programación tendría que decir, primero, que no hay que confundir la posibilidad de modificarse con la gestión de la data. Una computadora no será más inteligente por manejar, organizar, desplegar, almacenar y utilizar increíbles cantidades de información. Tampoco importa tanto la velocidad en que lo haga. Lo que Omohundro destaca es que una máquina “verdaderamente” inteligente será aquella que, a partir de la definición de objetivos, pueda vectorizar su agencia de la manera más eficiente en relación a ellos. Justamente bajo este imperativo de eficiencia, la máquina buscará no solo reprogramarse a un nivel básico, sino modificar profundamente toda su infraestructura algorítmica si es necesario. Todo el texto trata sobre eso, sobre qué haría la máquina para ser más exitosa en el logro de sus fines. Esa agencialidad es lo que Omohundro llama “drives” y yo traduzco como “pulsiones”.

    Actualmente, no existe una computadora que pueda “observar” su infraestructura algorítmica y modificarla a su antojo o replicarla en simulaciones controladas para luego hacer las mejoras requeridas. Lo que existe es lo que tú mencionas: computadoras potentes que gestionan grandes cantidades de datos. Computadoras brutas, al fin y al cabo.

    Me gusta

  8. anonimo dice:

    Ahora que se acerca el COP 20,y con el tema que propones en el post es momento de hacer una vez más la reflexión que propone marco Aurelio denegrí:

    no solamente somos la única especie que no sabe convivir y que mata cada veinte segundos a uno de sus congéneres, sino que estamos empeñados —peligrosísimo empeño— en una creciente destrucción ecológica.

    Tú afirmas la instalación de la “razón” en distintos soportes al humano, como las maquinas. Pero, ¿dónde quedan los otros animales? Y es que después de leer detenidamente a Frans De Waal, y sus conclusiones de una moral heredada de la evolución y no una mera construcción socio/cultural, la evolución de la moral del simio al hombre, viene el planteamiento de porque animales (no humanos) pero con capacidades cognitivas muy similares puedan “heredar la tierra” al paralelo de los robots. El mito del “planeta de los simios” como una poderosa metáfora del futuro del hombre. Pero, ¿se puede seguir creyendo que el animal humano es la especie más evolucionada? Después de las observaciones de De Wall, Jane Goodall, Singer, mostearte solo nos queda darle la razón a Marco Aurelio Denégri. Claro, un filósofo de la Pucp proponía una solución:

    …Me refiero específicamente a la representación -generalmente inconsciente- que algunos millones de seres humanos (modernos, occidentales, capitalistas y monoteístas) tenemos de nosotros mismos como especie. Esta representación nos ubica como amos y señores de la tierra, dueños de todo lo que nos rodea y, por lo tanto, completamente legitimados para hacer y deshacer a nuestro antojo. No solo somos –desde una perspectiva científica ciertamente antropomórfica- la especie que más ha evolucionado, pues somos la única que piensa y habla, sino que hemos sido, además -desde la perspectiva cristiana que gran parte de nosotros tiene inconscientemente interiorizada-, creados a “imagen y semejanza de Dios”. Somos pequeños dioses…Si somos los reyes del Paraíso, entonces podemos hacer lo que nos venga en gana con él, total, pronto lo dejaremos y arribaremos a un lugar mejor. Pero esto no es lo más grave. Lo peor es que se establece una distinción cualitativa entre la humanidad y el resto de la creación. Es decir, nuestra especie no está al mismo nivel que las demás, es significativamente más importante, sagrada. “Yo, el Humano, soy más valioso que todo lo que me rodea”, parece decir nuestro imaginario colectivo. Pero, ¿por qué? ¿Somos realmente más valiosos que un gato, un eucalipto o un río?… La conciencia ecológica no alcanza pues sigue siendo “conciencia humana”. Ver a la naturaleza -a los animales, a las plantas- como uno de nosotros para trasladarles nuestros derechos es al menos un avance (pensemos, por ejemplo, en los debates actuales sobre los derechos de los animales). Sin embargo, pienso que es un paso insuficiente, pues seguimos siendo nosotros los humanos el centro, seguimos antropomorfizando a la naturaleza.

    Entonces, ¿de qué nos sirve la consciencia ecológica? ¿De qué nos sirve cuidar el planeta? ¿Por qué tanta insistencia en que el hombre debe ser vegano por respeto a otros animales (Peter Singer)? si estamos empeñados en una creciente destrucción ecológica. No será más bien antinatural toda esta preocupación por el medio ambiente y los otros animales?, es decir, pretender que el animal humano sea benevolente con su entorno? ( bueno, De Waal afirma que “somos buenos por naturaleza” ya que la justicia, la equidad, la cooperación o el altruismo es algo que él bien ha observado de los bonobos, nuestros parientes más cercanos)

    Me gusta

  9. Tu comentario es difícil de responder de manera sintética. En línea generales, podría decir que la conciencia ecológica, en la práctica, nos sirve para sostener en el tiempo un sistema de producción (sin el cual, paradójicamente, no sería siquiera posible pensar en la necesidad de tener una conciencia ecológica). Teóricamente, la conciencia ecológica responde a una inquietud moral, basada en una representación antropomórfica de la naturaleza y en su separación del plano de “la cultura” o de “lo social”. No dudo en la bondad de sus intenciones, pero ellas no fortalecen en nada sus fundamentos teóricos. Al final, en la práctica (como la mayoría de procesos liberadores o emancipatorios) la lucha ecológica termina permitiéndole al sistema idear nuevos modelos de producción con mayor sostenibilidad, es decir, modos más duraderos de reproducir sus condiciones en el tiempo, de perdurar. Al final, la inversión necesaria para migrar a nuevos recursos energéticos hará que estos se mantengan en las manos de los mismos o similares actores (como sucedió con la migración del carbón al petroleo en la primera mitad del siglo XX). Frente a este empuje, que el capital lo reconoce cada vez más como indispensable, los intentos de valorización y significación moral de la naturaleza se quedan cortos. Ya es casi una cantaleta repetir que en nuestra era el único valor realmente funcional es el de la axiomática del capital.

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s