febrero 21, 2014

Historia de la Lógica Transcursiva (Capítulo 132)

Cuaderno VI (páginas 789 a 794)

(Continuamos con el análisis de los aportes de la lógica difusa al estudio de la realidad)

A pesar de la pertinencia de la lógica difusa para lidiar con sistemas reales, se debe aclarar que esto es solo aparente, pues no existe una teoría de conjuntos difusos que haga equivaler esos conjuntos con los 'objetos reales'. Los conjuntos difusos son siempre (y solamente) 'funciones', sobre un 'universo de objetos', dentro de un rango de pertenencia a ese universo entre 0 y 1. En otras palabras, las funciones que rastrean un determinado objeto dentro del intervalo unidad, pueden ser conjuntos difusos, pero llegan a serlo cuando, y solo cuando, coinciden con alguna descripción semántica, intuitivamente plausible, de alguna propiedad imprecisa de los objetos de ese intervalo.

Veamos lo anterior con un ejemplo: definir los números reales en el intervalo entre 20-60 es un problema que tiene implícitos, límites francos, y por lo tanto, puede ser tratado como un sistema mecanicista; o sea, no se necesitan conjuntos difusos para su tratamiento. En cambio, una situación más cercana a nuestra experiencia de todos los días es decidir, por ejemplo, si una persona es joven o no. La propiedad 'joven' es difusa per se. Si nos guiamos por la lógica aristotélica necesitamos definir precisamente los límites que separen las personas jóvenes de las que no lo son. Si alguien es más joven (aunque sea en una hora) que el límite, entonces es joven, sino no lo es. Obviamente esto está muy lejos de la forma en que habitualmente tratamos el problema de decidir si alguien es joven o no.

Nuestra percepción de características como la mencionada es mejor descrita a través de gradaciones, más que por límites francos. Es por esta razón que, generalmente, agregamos algún 'modificador' a la palabra 'joven' (por ejemplo: no, no muy, algo, muy, etc.), con el fin de expresar 'grados de juventud', más que respuestas absolutas verdaderas o falsas.


Analicemos la figura anterior: se considera un universo de personas entre 20 y 60 años de edad, y establecido un límite arbitrario (digamos: 40 años) para asegurar que alguien que esté por debajo de este límite pertenece al conjunto de las personas jóvenes en este universo. Esto es lo que hace la teoría de conjuntos clásica basada en la lógica bivalente.

Considerando el mismo universo, podemos establecer cuan joven es una persona (ºG de juventud) haciendo 'borroso' el límite de los 40 años. Ahora solo tomamos como límites los extremos del universo: A = 20 años que el prototipo de juventud (d = 1), o sea que es 100% joven; y B = 60 años (d = 0) que es 0% joven (es decir, viejo). De esta forma se puede establecer que, una persona de, por ejemplo, 38 años (0,55 calculado con la fórmula inferior en la figura), considerando los límites 20-60 años, tienen un 55% de joven y un 45% de viejo; vale decir, es ligeramente más joven que viejo.

Lo anterior es lo que hace la teoría de conjuntos difusos basada en una lógica multivalente, en donde, la lógica bivalente tiene validez solo en los extremos. Es preciso aclarar que los límites tienen mucha relación con el contexto, lo mismo que las categorías. Así, un presidente de la nación de 35 años es joven, en cambio, un futbolista no.

Otra forma de representar lo anterior, vale decir, la función de pertenencia (ºG de juventud) a un conjunto difuso (μA(x)) es mediante una función de pertenencia continua, ya que el universo (el de la gente joven es continuo).


En general, si una función de pertenencia se da especificando los valores correspondientes a un conjunto discreto de elementos de un universo, el valor asociado al resto de los elementos se obtiene por interpolación, utilizando la ecuación de la recta: y = b - m.x (figura) definida entre los dos puntos: 20 y 60 años, respectivamente.

Otro hecho que muestra la gráfica anterior, de gran trascendencia y que es una de las contradicciones entre la lógica bivalente y la difusa, es el aceptar como un valor de verdad, el punto medio. Los 40 años que en la lógica binaria era el límite nítido que habíamos tomado para definir a una persona como joven, aquí representa una persona que es tan joven como vieja. En pocas palabras, acepta como verdadero un valor que está compuesto por un 50% de cada polo opuesto. Tenemos de esta manera definida una lógica trivalente (0 - 0,5 - 1) (con tres valores de verdad: lo verdadero (1), lo posible (0,5), y lo falso (0)). Algo aquí puede ser a la vez 'medio verdadero' y 'medio falso'. {una concurrencia o simultaneidad de los opuestos}. Esto contradice a Aristóteles en cuya lógica estableció que algo podía ser o verdadero o falso, pero no las dos cosas a la vez (principio de no contradicción), y por otro lado, no puede ser 'medio verdadero' o 'medio falso' (principio del tercero excluido). [esto último no es totalmente correcto. A la lógica difusa no le alcanza con lo anterior, para desechar el principio del tercero excluido, porque ese 'tercer valor de verdad' (o infinitos, da igual), no se encuentra fuera del sistema, única forma en que el principio del tercero excluido quede totalmente anulado; esto es, en el sentido lato, se sigue respetando dicho principio. Ergo, la lógica difusa como cualesquiera de las otras propuestas polivalentes, solo son variantes de la lógica inventada por Aristóteles, pero no una alternativa excluyente. La LT es la única lógica multivaluada que es una verdadera alternativa a la propuesta aristotélica.]

Los límites del universo se pueden establecer de otra forma. Así, por ejemplo, un valor central alrededor del cual se agrupan los demás valores considerados, constituyendo un conjunto difuso con distintos grados de pertenencia.


Por ejemplo: en la figura anterior consideramos el conjunto de cerros cuya altura esté cercana a los 8.000 metros. 'Cercana a los 8000 metros' es una propiedad difusa, como lo era la juventud. Aquí no se puede establecer una sola función de membresía como en el caso anterior, sino que debemos incluir:
1) Función de normalidad: el valor central (1) ºGF(8000) = 1.
2) Función de monotonicidad: tan cerca de 8000 metros está la altura como el ºGF(altura) está de 1.
3) Función de simetría: alturas separadas por igual distancia a izquierda y a derecha del valor central, tienen igual ºG.

Estas consideraciones sobre los límites son importantes porque permiten tipificar, como veremos en otro apartado, las distintas categorías reales, como graduales, radiales, etc. (Lakoff).

Por último debemos establecer la diferencia que existe entre la incertidumbre estadística (probabilística), y la 'vaguedad' o 'borrosidad'. Esto es, entre la relaciones difusas y la probabilidad. Hagámoslo con un ejemplo. Supongamos que tenemos el deseo de cenar, junto a un grupo de amigos, una buena carne al horno acompañada con una exquisita salsa de hongos. Como queremos ser partícipes, nos ofrecemos para ir a buscar los hongos al bosque. Puestos a la tarea, y al pie de un frondoso ciprés, se nos presentan dos enormes hongos (figura), tales que, cada uno de ellos por sí solo alcanzaría para nuestra tan apetecida salsa.


En ese preciso instante se nos ocurre pensar en el universo de todos los hongos que existen y de ellos, en el subconjunto de aquellos que son comestibles. Y cosa curiosa, sobre el sombrero de cada hongo aparece, en el más grande, una A y la cifra 0,9 que nos dice su ºG de pertenencia al subconjunto de los hongos comestibles; mientras que en el hongo más pequeño, aparece una B y la cifra 0,9 que nos dice de la probabilidad de que ese hongo sea comestible. Nosotros, no muy conocedores en esto de distinguir hongos venenosos de los que no lo son, nos enfrentamos a una disyuntiva: ¿cuál elegimos?
Sin lugar a dudas el A, porque su 0,9 significa que es muy posible que sea un hongo comestible, es decir, está muy cerca de no ser un hongo venenoso {es 90% comestible y 10% venenoso} . Por otro lado, el 0,9 de B nos dice que es muy probable que sea un hongo comestible, pero que puede ser venenoso, en promedio, 1 de cada 10 veces.

Si quisiéramos intentar disminuir nuestro error y decidiéramos cosechar ambos hongos, y disponer para que se haga, por separado, salsa con cada uno de ellos; aquellos de nuestros invitados, incluidos nosotros mismos, seguramente pasaríamos una hermosa velada, pues el ºG de pertenencia del hongo A a los hongos comestibles no cambió; mientras que la probabilidad del hongo B cambió y se hace 1 (verdadera) o 0 (falsa) dependiendo del hecho que dicho hongo sea venenoso o comestible; por tanto, es posible que tengamos algunas bajas entre nuestros amigos.

La diferencia entre la lógica bivalente {categorías rígidas} y la difusa {prototipos o categorías graduales} es que la primera se maneja con probabilidades (distribución estadística basada en observaciones [visión objetiva]), mientras que la segunda se base en la posibilidad (la función de ºG de pertenencia basada en una distribución [experiencia] personal [visión subjetiva]). [si bien tenemos esta última ventaja con la lógica difusa, para definir la realidad subjetiva, no alcanza; tendrá que venir la LT para lograrlo.]

La moraleja de nuestra historia: "Un hecho probable puede que no sea posible, en cambio, un hecho posible puede que también sea probable."

- Conjuntos difusos: sin pretender ser exhaustivos, ni mucho menos, vamos a ver solamente algunas operaciones básicas con estos conjuntos que serán útiles a la hora de bocetar la realidad. En primer lugar especificaremos qué se entiende, desde el punto de vista matemático, claro, por conjunto: es una colección de objetos los cuales pueden ser tratados como un todo.

Gregor Cantor describe formalmente los conjuntos por sus miembros, tal que, un ítem de un universo dado puede ser miembro o no de un conjunto dado. Se debe aclarar que los términos: conjunto, colección y clase son tomados como sinónimos, e inclusive, podría hacerse una extensión a categoría; y por otro lado, ítem, elemento y miembro, también son sinónimos.

Casi siempre lo que llamamos conjunto, en el lenguaje corriente, es aceptable matemáticamente. Veamos:
1) Los cerros de la cordillera de Los Andes, de entre 5.000 y 7.500 metros. Esto es un conjunto finito que contiene varios miembros.
2) Las mariposas vivas, de una muestra en una vidriera. Esto es un conjunto vacío, pues no tiene ningún miembro.
3) Los números reales mayores de 0. Esto es un conjunto infinito, porque puede determinarse que todo número real mayor de 0 es miembro.

Entonces, un conjunto puede ser especificado por sus miembros; ellos caracterizan al conjunto completamente. Nadie puede listar todos los elementos de un conjunto infinito, pero sí se puede establecer alguna propiedad que caracterice a los elementos del conjunto. Por ejemplo: x mayor 0. Vemos entonces que un conjunto está definido por los elementos del universo del discurso que hacen verdadero un predicado. [esto está basado estrictamente en la lógica binaria] Por tanto, hay dos maneras de describir un conjunto: explícitamente a través de un listado de sus miembros, o implícitamente a través de un predicado.

Esto que hemos dicho está bien para los conjuntos clásicos; los conjuntos difusos, como ya vimos, son definidos por una función: el ºG de pertenencia (membresía), y que era muy distinta a la distribución de la estadística probabilística.

Otro término que se debe esclarecer es el de 'universo': los elementos de un conjunto difuso están contenidos dentro de un universo del discurso. {universo a secas. [al incluir la palabra 'discurso', sin querer se está sometiendo todo el razonamiento al pensamiento lógico, es decir, a la lógica binaria que es de la que, supuestamente, se quiere huir. Por esta y por otras razones, la lógica difusa no es una alternativa a la lógica aristotélica. La única alternativa es la LT]} El universo contiene todos los elementos tenidos en consideración y es contexto dependiente.

Hay veces en que los integrantes de un universo no pueden ser expresados por números (por ejemplo: los estados emocionales - alegría, tristeza, melancolía, etc.). Se dice entonces que los elementos de este universo son tomados desde un 'continuum psicológico'. {la realidad es discretizable aunque no está discretizada.} [a pesar de la última aclaración, un 'continuum psicológico' no significa absolutamente nada, porque es un criterio totalmente arbitrario.]

- Normalización: un conjunto difuso (CD) está normalizado si el mayor valor del ºG de pertenencia es igual a 1. Para normalizar un conjunto se divide cada ºG de pertenencia por el valor mayor de membresía del conjunto: x/max(x).

Hablando estrictamente, un CD es una colección de pares ordenados:

A = {(x, μ(x))}

El ítem x pertenece al universo y μ(x) es su ºG de pertenencia en A. Un par unitario: (x, μ(x)) es llamado: 'singletón' o CD unitario. Luego, el conjunto completo puede verse como la unión de estos 'singletones' constituyentes. Es conveniente pensar en un conjunto A como un vector:

a = (μ(x1), μ(x2), ... , μ(xn))

Se comprende así que la posición i(1, 2, ... , n) corresponde a un punto en el universo de n puntos.

[continuará ... ]

¡Nos vemos mañana!