Capítulo 4

Un Sistema Lógico que combina reducción de metas, reglas de condición-acción y otros recursos lógicos

¿Qué tienen en común el pasajero del metro, la zorra, el piojo, el explorador marciano e, incluso, el termostato?. Seguramente no se trata de su manera de vestir, sus compañías o sus modales. Se trata de que todos ellos están constantemente ocupados en lidiar con el cambiante mundo – Una lidia que algunas veces amenaza su existencia y otras veces les provee con oportunidades para sobreponerse y prosperar.

Para que la lógica sea relevante en tal contexto, tiene que resolver primero un gran problema: la lógica tradicional, tal como se le entiende normalmente, está cerrada ante los cambios en el mundo. Para recuperar su relevancia, la lógica debe ser puesta primero en el lugar adecuado: en el componente pensante de ciclo del agente:

Para ciclar,

observa el mundo,

piensa,

decide cuáles acciones realizar,

actúa, cicla de nuevo.

A este nivel, el más alto, el ciclo del agente es igual que el ciclo de los sistemas de producción, pero no pierde generalidad y así, puede acomodar otros tipos de pensamiento, incluyendo el razonamiento lógico. Imbuída como el componente pensante del ciclo del agente, la lógica queda tanto para asimilar las entradas que el agente recibe de su mundo, como para producir las salidas que el agente usa para cambiar ese mundo.

La lógica de las metas y creencias

Otra limitación importante en la lógica tradicional es que no le presta atención a la distinción entre las metas de un agente y sus creencias. Esta distinción es fundamental para la supervivencia de los agentes y los inteligentes la aprovechan tanto como pueden.

Las metas de un agente representan la visión de cómo le gustaría que fuese el mundo a ella o él. Las metas incluyen acciones que el agente puede realizar. También incluyen metas por lograr, para alcanzar algun estado futuro deseado, metas de mantenimiento, para preservar alguna relación deseada entre el agente y el cambiante estado de mundo, y restricciones, para prevenir estados indeseable. Voy a proponer que las reglas de condición-acción sean entendidas como metas de mantenimiento y también voy a mostrar que, en general, las metas pueden ser descritas naturalmente en forma lógica.

Las creencias del agente, por otro lado, representan su visión del mundo tal como realmente es, gústele o nó. Incluyen oraciones atómicas que registran las observaciones del agente. También incluyen sus creencias acerca de las leyes de la naturaleza, además de las definiciones y taxonomías que el agente usa para clasificar y organizar sus experiencias. Voy a insistir en que muchas, quizás todas, las creencias pueden expresarse naturalmente en forma de programas lógicos.

El cuento de la zorra y el cuervo revisado

El cuento en el capítulo 2 comienza cuando la zorra adquiere la meta de tener el queso del cuervo. Pero, ¿de donde vino la meta de la zorra?

Quizás, como un muchachito malcriado, la zorra quiere tener todo lo que ella ve que otros tienen. O quizás, ella simplemente está buscando su siguiente comida. En cualquier caso, la meta de la zorra de tener el queso proviene de una meta de nivel superior – bien la meta de poseer cualqueir cosa que otro tenga o la meta de tener que comer cuando tenga hambre.

Así, la meta de la zorra de tener el queso puede verse como una meta por lograr cierto estado futuro en el mundo, que corresponde al observar un cambio en el mundo que dispara una meta de nivel superior de mantener cierta relación con el mundo que la rodea.

Démosle el beneficio de la duda a la zorra y asumamos que ella quiere el queso simplemente porque tiene hambre (y no debido a algún problema de conducta). Esto se puede representar así como una meta de nivel superior:

Si me da hambre entonces necesito tener comida y comer-la comida

Esta meta puede ser parafraseada de muchas maneras. Por ejemplo, en forma imperativa (y jugando un poco con la auto-disciplina en Español):

Si me da hambre, consigue comida y cóme-la comida.

Esta formulación imperativa se asemeja a una regla de condición-acción, salvo porque la conclusión contiene la meta “consigue comida” en lugar de una acción simple que puede ser realizada sin más.

Por otro lado, la meta puede ser planteada en modo declarativo, pero con una indicación de que se trata de una meta en lugar de una creencia.



Meta: si tengo hambre, entonces (ob)tengo comida y como la comida.

La ventaja de expresar la meta como una declaración es que, entonces, obtiene una forma lógica. La forma lógica puede ser usada para verificar si la proposición es verdadera o falsa y puede usarse en deducciones lógicas con razonamiento hacia adelante, hacia atrás y de otros tipos. El hecho de que es una meta, no una creencia, implica que el agente debe procurar que se haga cierta.

Para mostrar que una implicación

Si condiciones entonces conclusión

es cierta, es necesario mostrar que cuando quiera que las condiciones son ciertas, entonces la conclusión es también cierta. El que sea una meta o un creencia es irrelevante.

Sin embargo, para hacer cierta una implicación, siendo una meta, no es sólo que hace falta hacer que la conclusión sea cierta cuando quiera que las condiciones lo son, sino que es todo lo que hay que hacer. No sólo es una condición necesaria, sino que es suficiente también.

En teoría, es posible hacer que la implicación sea cierta haciendo ciertas tanto las condiciones como la conclusión. Sin embargo, hacer que las condiciones sean ciertas es un trabajo innecesario. En la práctica, el agente no intenta hacer que las condiciones de las metas en forma de implicación sean satisfechas expresamente. O bien es el mundo el que las hace ciertas, o bien el agente las hace ciertas por algún otro motivo[1].

En un mundo abierto y en constante cambio, puede no ser posible hacer que las implicaicones permanezcan ciertas para siempre. Puede que sea necesario mantener su verdad por un periodo indefinido, haciendo que las instancias individuales de cada condición sean ciertas en cada ocasión en que surgan. El proceso completo consiste de los siguientes tres pasos:

La nueva meta es una sub-meta de una meta de mantenimiento de nivel superior. Normalmente es una meta de alcance, para obtener cierto estado final.

Veamos como funciona la derivación de una meta de alcance a partir de una meta de mantenimiento, en esta versión de la Zorra y el Cuervo:

Meta: si me da hambre, consigue comida y come la comida.

Creencias:

El cuervo tiene el queso.

Un animal tiene un objeto

si el animal está cerca del objeto

y el animal toma el objeto.

Estoy cerca del queso

si el cuervo tiene el queso

y el cuervo canta.


El cuervo canta si alabo/halago/adulo al cuervo

El queso es un tipo de comida.

La comida es un tipo de objeto.

Para que este cuento funcione, la Zorra necesita el conocimiento taxonómico de que el queso es un tipo de comida y de que la comida es un tipo de objeto. Este conocimiento puede ser representado de varias maneras y hay, inclusive, lógicas especializadas para cada propósito. Sin embargo, para el simple propósito de recontar el cuento, esos detalles no tienen importancia. Es suficiente reconocer que este conocimiento es necesario simplemente para asistir el razonamiento, como veremos más adelante.

Para ver como es que funciona el derivar una meta de alcance a partir de una meta de mantenimiento en este ejemplo, suponga que la Zorra tiene la meta y la creencia que se indicó antes y, de pronto, su cuerpo le dice que tiene hambre.

Observe:         Me da hambre.

Puesto que su cuerpo es parte del mundo, la Zorra se hace-vuelve consciente de su hambre por medio de una observación. La observación dispara la meta de alto-nivel y el razonar hacia adelante deriva la sub-metas:

Sub-metas:      Tengo comida y Como la comida.

Así, la verdadera meta de mantenimiento no es tan específica como obtener el queso del cuervo, sino la más general de obtener cualquier clase de comida. Pero esta meta de mantenimiento es apenas la mitad de la historia. La otra mitad es que la Zorra también necesita comerse esa comida. Tener comida y no comerla es una tonteria.

Derivar sub-meta de mantenimiento a partir de metas de más alto nivel es una generalización del derivar acciones a partir una regla de condición-acción, porque las sub-metas pueden ser (pero no necesariamente son) acciones atómicas (ejecutables de inmediato). En el caso general, las sub-metas son, a su vez, metas que deben se reducidas a otras sub-metas de nivel inferior. Esta es también una generalización de las reglas de condición-acción porque las reglas de alcance así derivadas podrían ser para alcanzar en algún momento en el futuro y no sólo en el siguiente instante de tiempo.

El Factor Tiempo

Nuestra nueva versión del cuento de la Zorra y el Cuervo es todavía una gran simplificación debido, principalmente, a que ignora el tema del tiempo. No distingue entre distintas ocurrencias de tener hambre en momentos diferentes. Tampoco se indica cuanto tiempo ha transcurrido entre la observación del hambre y el momento de comer. De hecho, no se indica que la Zorra necesita tener la comida antes de que pueda comerla.

Ese ejercicio de ignorancia del tiempo fue hecho a propósito, porque resulta que el razonamiento de sentido común sobre el tiempo es mucho más complicado de lo que parece. Volveremos sobre ese problema más adelante. Entretanto, seguiremos usando esta versión supersimplificada del cuento, sin tiempo, tanto para simplificar el ejemplo como para concentrarnos en cómo la Zorra entrelaza su razonamiento con sus observaciones y acciones en el contexto del ciclo del agente.

Incorporando la historia en el ciclo de los agentes

Vamos a recontar el cuento, comenzando en esta ocasión en el instante en el que la Zorra comienza a tener hambre. Para que la historia sea más interesante, asumimos que la Zorra sólo tiene tiempo para realizar un paso de razonamiento en cada ciclo. También asumiremos que la Zorra observa si sus acciones tienen éxito o fallan.

El primer ciclo.

Observación:                                                 Me da hambre.

Razonando hacia adelanta, sub-metas:                    Tengo la comida y como la comida.

No hay acciónes por ejecutar.

Este es el caso clásico de una observación que dispara una meta de mantenimiento y produce una meta de alcance.

El segundo ciclo.

Ninguna observación.

Razonando hacia atrás, nuevas sub-metas:  Estoy cerca de la comida y Tomo la comida y Como la comida.

Ninguna acción por ejecutar.

El único pensar que la Zorra puede hacer en este ciclo es razonar hacia atrás, para reducir la sub-meta de obtener la comida a la sub-metas de estar cerca de la comida y tomarla. Este razonar incorpora el razonamiento taxonómico que aparea “comida” con “objeto”.

El tercer ciclo.

Observación:                                                 El cuervo tiene el queso

Razonando hacia adelante, nueva creencia:                   Estoy cerca del queso si el cuervo canta.

Ninguna acción por ejecutar.

En este ciclo, la Zorra tiene la alternativa de continuar el razonamiento hacia atrás a partir de sus sub-metas actuales o de razonar hacia adelante a partir d e esta nueva observación. Normalmente es una buena idea darle mayor prioridad al razonar con las nuevas observaciones, porque puede tratarse de una emergencia que requiere atención inmediata o una oportunidad que no debiera desperdiciarse.

La observación se aparea con una de las condiciones de su creencia:

Estoy cerca del queso si el cuervo tiene el queso y el cuervo canta.

Puesto que su creencia está expresada en forma lógica, puede ser usada para razonar tanto hacia adelante como hacia atrás. Si se usa para razonar hacia adelante, como en este caso, produce una nueva creencia:

El cuarto ciclo.

Ninguna observación.

Razonando hacia atrás, la nueva sub-metas:  El cuervo canta y Tomo el queso y Como el queso

Ninguna acción por ejecutar.

La Zorra usa sus nueva creencia hacia atrás, para reducir la meta de estar cerca de la comida a la sub-meta de hacer que el cuervo cante. Para hacerlo, aparea “comida” con “el queso”. Esto tiene el efecto colateral de precisar qué es lo que va a comer su la nueva sub-meta termina con éxito.

El quinto ciclo.

Ninguna observación.

Razonando hacia atrás, la nueva sub-metas:  Adulo al cuervo y Tomo el queso y Como el queso.

Acción:                                                           Adulo al cuervo.

La Zorra reduce la meta de hacer que el cuervo cante a la sub-meta de adular al cuervo. Luego intenta resolver esta nueva sub-meta realizando la acción. No hay otras acciones pendientes para ejecutar en este momento, así que no hay necesidad de resolver ningún conflicto entre acciones.

El sexto ciclo.

Observación:                                                         Adulo al cuervo.

Razonando hacia adelante, nuevas sub-metas:             Tomo el queso y Como el queso.

Acción:                                                           Tomo el queso.

La Zorra observa el resultado de la acción que acaba de intentar en el ciclo anterior. La observación, que confirma que ha tenido éxito, resuelve la primera de las tres sub-metas, dejando las otras dos para tratar luego. La siguiente sub-meta también es una acción y hay otras acciones candidatas a ser realizadas en este momento.

El séptimo ciclo.

Observación:                                                         No tomo el queso.

No piensa.

Acción:                                                           Tomo el queso.

La Zorra observa el resultado de su acción. Sin embargo, esta vez suponemos que falla, bien porque el Cuervo todavía no ha comenzado a cantar, bien porque el queso no ha llegado al suelo, bien debido a su ineptitud física[2] . Supondremos, además, que la Zorra intentará la misma acción otra vez[3].

El octavo ciclo.

Observación:                                                         Tomo el queso.

Razonamiento hacia adelante, nuevas sub-metas:            Como el queso.

Acción:                                                           Como el queso.

La Zorra observa que, esta vez, la acción ha sido exitosa. La observación resuelve la sub-meta acción asociada, dejando pendiente solamente la última acción, que la Zorra decide tratar en el siguiente ciclo:

El noveno ciclo.

Observación:                     Como el queso.

La observación resuelve la última de las sub-metas acción. Noten que la meta de mantenimiento todavía permanece allí, para ser disparada en otra ocasión futura.

Este patrón general de razonamiento de este ejemplo, que se despliega sobre varios otros ciclos y, posiblemente, se entrelaza con otras observaciones y acciones, es algo así:

Observación:                                      Un evento ocurre.

Razonamiento hacia adelante:                          El evento se aparea con las condiciones de una meta de mantenimiento o de una creencia

Meta de logro o alcance:                             En algún momento la conclusión una meta de mantenimiento es convertida en una meta de logro o alcance.

Razonamiento hacia atrás:                        Las creencias son usadas para reducir las metas de logro en acciones.

Acciones:                                              Una sub-meta acción es seleccionada para ser ejecutada.

Observación:                                      El agente verifica si la acción tiene éxito o falla.

Este patrón no es excepcional. Algo parecido ocurre en el ejemplo del metro de Londres con su Aviso de Emergencias.

De vuelta en el metro

Recuerde nuestra última versión del ejemplo::

                        Si hay una emergencia entonces consiga ayuda.

            Ud consigue ayuda si alerta al conductor.

            Ud alerta al conductor si presiona el botón de la señal de alarma.

La primera oración presenta una meta de mantenimiento. Podemos reescribirla como una oración declarativa, indicando al lado que se trata de una meta y no de una creencia. Entretanto, para capturar mejor el significado pretendido de la segunda y tercera oración, reemplazamos la segunda persona “Ud” por la tercera persona.

Meta:               Si hay una emergencia entonces Yo consigo ayuda.

Creencias:           Una persona consigue ayuda si la persona alerta al conductor.

            Una persona alerta al conducto si presiona el botón de la señal de alarma.

Para establecer hay una emergencia, necesitamos creencias adicionales. Por ejemplo:

Creencias:                       Hay una emergencia si hay fuego.

                                    Hay una emergencia si una persona ataca a otras.

                                    Hay una emergencia si alguién se enferma gravemente.

                                    Hay una emergencia si hay un accidente.

Podríamos continuar esta reducción de los conceptos abstractos de alto nivel hacia los mas concretos de bajo nivel hasta cualquier nivel de detalle deseado. Por ejemplo, tratándose de reconocer el fuego, podríamos agregar:

Creencia adicionales:     Hay fuego si hay llamas.

                                    Hay fuego si hay humo.

Con todo, pronto nos parecerá cada vez más difícil definir todo los conceptos de bajo nivel en términos lingüísticos. Al final, debe haber un punto en el que hay un nivel mínimo, que es irreductible y en el cual el sistema sensorial del agente transforma las sensaciones que recibe del ambiente en observaciones que pueden ser representadas en términos conceptuales.

Suponga, en este ejemplo, que el concepto de reconocer el fuego es ese nivel mínimo. Suponga, más aún, que Ud está viajando en el metro y observa humo:

Observación:                                                  Hay llamas.

Razonando hacia adelante, nueva creencia:                   Hay fuego.

Razonando hacia adelante, nueva creencia:                   Hay una emergencia.

Razonando hacia adelante, meta de logro:    Yo consigo ayuda!

Razonando hacia atrás, sub-meta:                Yo alerto al conductor!

Razonando hacia atrás, acción:                    Yo presiono el botón de la señal de alarma!

En tres pasos de razonamiento hacia adelante, Ud deriva la meta de alcance de obtener ayuda. En el primer paso, Ud reconoce que hay fuego. En el segundo, que hay una emergencia. En el tercero, Ud usa la meta de mantenimiento para derivar la meta de alcance de obtener ayuda. Luego, en dos paso de razonamiento hacia atrás, Ud reduce la meta de obtener ayuda a la sub-meta de acción de presionar el botón de alarma.

La acción de presionar el botón de alarma, en forma similar a como dijimos de la observación de la emergencia, puede ser reducida aún más a términos de nivel inferior. Por ejemplo, mover primero su dedo y luego empujar el botón con ese dedo. Mover su dedo hacia el botón puede, a su vez, ser reducida a todavía más bajas sub-metas, tales como primero mover su brazo cerca de botón y luego mover el dedo hacia el botón. Con todo, al final tiene que haber un punto donde su cuerpo releva a la mente y realiza las acciones por su propia cuenta.

Toda esta pensadera toma un tiempo durante el cual Ud puede que tenga que dar cuenta de otras observaciones y realizar otras acciones. Programar estas acciones, de manera que todo se realice en el momento apropiado, es una tarea para el componente que toma decisiones en el ciclo del agente. Hemos preservado los ejemplos del capítulos tan simples muy a propósito para evitar ese tipo de decisiones sobre el tiempo. Vamos a referirnos a esos temas en el siguiente capítulo.

Resumen

Los ejemplos en este capítulo muestran como la lógica puede ser usada en el contexto del ciclo de observación-pensamiento-decisión-acción de un agente. Puesta en este contexto, la lógica es usada por los niveles superiores del pensar tanto para razonar hacia adelante, a partir de las observaciones, disparando metas de mantenimiento y derivando metas de alcance, como para razonar hacia atrás, para reducir metas de alcance en acciones.

Bajo el nivel lógico, los procesos de percepción transforman las sensaciones crudas en observaciones y los procesos motores transforman las representaciones conceptuales en actividad física en el ambiente.

Todo esto se puede representar así:

 






Hemos visto que el razonamiento hacia adelante con metas en forma de implicación sirve como generalización de las reglas de condición-acción, mientras que el razonamiento hacia atrás con creencias en forma de implicación sirve para generalizar los procedimientos de reducción de metas. En el siguiente capítulo, veremos cómo es que el razonamiento hacia atrás puede ser usado para inferir las consecuencias de las soluciones que se deriven en ciertos momentos. También veremos como la combinación de búsqueda más inferencia provee información para la siguiente etapa del ciclo, de forma que las soluciones alternativas puedan ser comparadas y que se tome así, una decisión final con más información.




[1] También es posible hacer que la implicación sea cierta, haciendo que sus condiciones se vuelva falsas. En el caso de la Zorra, ella podría tratar de satisfacer su meta evitando sentir hambre.

[2] Esta complicación sirve para indicar una limitación de nuestra formulación del ciclo del agente: No hay chequeo explícito en el ciclo para determinar si las acciones de bajo nivel de hecho alcanzan las metas de nivel superior. El ciclo chequea si las acciones tienen éxito o no, pero no chequea si ese éxito conduce al éxito de las metas superiores que se propuso alcanzar. Si las creencias que fueron usadas para reducir esas metas a sub-metas se pudieran garantizar como ciertas, entonces estos chequeos serían innecesarios. Así que una manera de corregir esta limitación es agregar al ciclo un componente de aprendizaje general y de verificación de validez. Volveremos con esto más tarde.

[3] Esto supone que hay un tiempo asociado antes del cuál debe ser realizada la acción y que tal tiempo no ha sido alcanzado. Veremos como se hace esto, con todo detalle, más adelante cuando revisemos la representación del tiempo.