Preferir es lógicamente secundario a distinguir; preferir de forma estable es lógicamente secundario a aprender; un ente que prefiere debe buscar aprender
La vida social, o al menos la vida social de los entes para los cuales tiene sentido tener una ciencia social específica, opera a través del hecho que esos entes pueden aprender y esos entes tienen preferencias. Las nociones de aprendizaje y preferencias que resultan útiles para una ciencia social han de ser conceptos amplios.
La idea más básica de aprendizaje es la que implica que un agente asocia, con cierta permanencia, ciertos elementos. Asociará ciertos sabores a ciertos alimentos (‘las manzanas son menos dulces que las cerezas’), asociará cierto tiempo a ciertos modos de transporte (‘me demoro tantos minutos caminando si voy de mi casa al trabajo’), asociará ciertos resultados a ciertas conductas (‘si saludo me tratarán mejor’) etc. Si seguimos usando el lenguaje de distinciones que hemos usado, diremos que un agente realiza un aprendizaje cuando conecta distinciones, o mejor dicho cuando conecta lados de diferentes distinciones. Toda distinción genera (al menos) dos lados, y aprender implica que un lado de una distinción es conectado con un lado de otra distinción. Así distingo la acción de saludar /no saludar y distingo a su vez entre mejor / peor trato. La situación de aprendizaje opera cuando asocio un lado de una distinción (saludar) con un lado de otra distinción (mejor trato). Para que opere como aprendizaje sostendremos que esa asociación debe ser estable. No sólo que en esta ocasión estos dos lados se dieron, sino que en general esos lados se asocian entre sí.
Para que podamos decir de un ente que aprende requerimos entonces que sea capaz de distinguir, de asociar (lados de) distinciones y que sea capaz de estabilizar dichas asociaciones.
Se podrá observar que en ningún momento de esta discusión hemos mencionado algo en torno a si al aprendizaje es correcto. Esto no quiere decir (se puede recordar una discusión similar en sección 1) que esta aproximación niegue que existan afirmaciones (aprendizajes) que son correctas y otras que no lo son; simplemente que para los propósitos de este análisis esa distinción no puede usarse. Y no puede usarse por la siguiente consideración: Porque dado que todos somos actores sociales (incluyendo a quienes los observan) para todos ellos es válido que no tienen acceso directo a la realidad. Nadie sabe -con certeza- cuál sería la idea correcta sobre la realidad. Pero para que un observador pudiera evaluar (con certeza) si otro observador tiene un conocimiento correcto se requeriría que tuviera ese tipo de acceso. Nuevamente: esto no quiere decir que el tema de la corrección del aprendizaje sea irrelevante, más aún podemos declarar (lo argumentaremos más tarde) que es probable que los propios actores tengan un fuerte interés en que sus aprendizajes sean correctos; la diferencia entre lo falso y lo verdadero no es menor para los actores. Y en toda discusión concreta ello será un asunto a discutir. En términos generales, cuando se quiere hablar aquí de cualquier aprendizaje posible, entonces al no tener criterio cierto y claro que distinga lo correcto de lo incorrecto, se ha de integrar cualquier asociación bajo el concepto.
Los agentes actúan. Si queremos entender su acción es necesario un móvil para ella. La idea de preferencias cumple con esa función; y nuevamente hay que partir de la noción más básica y simple de preferencia. Se puede decir que Ego prefiere X a Y cuando elige realizar X por sobre Y. Es una noción muy sencilla que aplica, de hecho, a buena parte de los entes vivientes (una bacteria que se mueve rechazando cierto lugar en pos de otro está, en ese sentido, prefiriendo el lugar al cual se mueve). En un sentido más estricto, y restringiendo la aplicabilidad de los entes que prefieren, podemos decir que hay preferencia cuando el actor se representa esas opciones (i.e. es el propio agente quien distingue y observa esas opciones) y toma una decisión sobre ellas (i.e. el propio agente distingue su propia decisión, la observa). Esto incluye entonces la consideración que las preferencias correspondan a actos deliberados si se quiere.
En el caso de aprendizaje no exigimos que éste fuera correcto, en el caso de preferencias no exigiremos criterios usuales de consistencia o completitud etc. Un conjunto de preferencias intransitivo (A se prefiere a B que se prefiere a C que se prefiere a A) no es un conjunto imposible, y el agente de hecho tiene una elección clara en varias situaciones posibles (si se presenta sólo A y B como opciones, por ejemplo). La reducción de todas las preferencias a una sola dimensión donde puedan ordenarse es una exigencia de la racionalización de la acción, pero no es necesaria para actuar en el mundo. Y si el actor no se concibe de manera unitaria, bien pueden aplicar al caso individual lo que Arrow había aplicado a la idea de elección colectiva. Si ello fuera así, entonces la racionalización de la acción bien pudiera ser una ilusión. En cualquier caso, esos elementos no son necesarios para analizar y describir la acción.
Preferir es elegir lados de esas distinciones. En principio, para preferir sólo resulta necesario tener distinciones. Dado que una preferencia se expresa en una acción entonces (por lo que se mencionaba en sección 1) está asociado a una distinción. Ahora, una distinción no implica en sí una preferencia. Se puede tener un mundo con distinciones y sin preferencias; pero no es posible lógicamente un mundo de preferencias sin distinciones. Este carácter secundario de la preferencia es más relevante cuando se observa el carácter indefinido (ilimitado) del distinguir -si no es posible determinar el conjunto de todas las distinciones, entonces no resulta posible determinar el conjunto de todas las preferencias.
Hasta ahora las preferencias que estamos analizando no requieren ninguna permanencia. Alguien puede preferir A y B en t, y luego preferir B sobre A en t+1. Supongamos ahora que el agente aprende -en otras palabras que asocie de manera recurrente lados de diferentes distinciones. Dado eso, entonces puede generar una preferencia estable. Prefirió A sobre B porque en una situación encontró que A era superior; pero si aprende cosas sobre A y B (asocia de manera estable ciertos elementos), entonces ahora tiene una razón para mantener esa preferencia (porque ha asociado A a características positivas). Si el sujeto no aprende sobre A o B, no asocia de manera estable ninguna otra distinción, entonces el actor no tiene razón alguna para mantener una preferencia estable de A sobre B. La generación de expectativas sobre estas preferencias (si se quiere que el actor ‘sepa’ que prefiere A sobre B) requiere aprendizaje. Sin esa construcción de asociaciones estables es posible que la preferencia se mantenga (que siga encontrando A superior), pero el actor no tiene motivo alguno para esperar ello, y por lo tanto para determinar acciones a partir de esa preferencia. En ese sentido, entonces una preferencia estable requiere que el actor aprenda cosas sobre el mundo.
Más aún, un actor que se oriente por las preferencias (un actor que sabe que tiene preferencias) entonces es plausible que esté en su interés (tenga una preferencia) por aprender. Manejar un conjunto estable de preferencias simplifica las consideraciones necesarias para actuar (quien ya sabe que prefiere en general A sobre B puede, en efecto, planificar al respecto). Lo que permite esa simplificación es el aprendizaje. Como veremos más adelante (en la sección 4), estos actores tienen un interés permanente en simplificar el mundo.
En general, entonces preferir es algo posterior a distinguir y aprender. Primero se necesita tener alguna idea sobre el mundo antes de realizar cualquier operación de preferencia sobre éste. Y dado que las distinciones no están pre-determinadas, se sigue que las preferencias tampoco.
Esta disquisición es relevante porque existen muchas aproximaciones en las cuales se invierte la relación entre preferencias y aprendizaje. El aprender se comprende alrededor de la preferencia (y lo que se aprende es en torno a cómo lograr y acercarse a aumentar la ‘utilidad’, o sea a obtener resultados más preferidos). Sin embargo, para preferir es menester -en primer lugar- poder distinguir; y el aprendizaje opera en el orden del distinguir. El aprendizaje no puede comprenderse como optimización porque para que pueda optimizarse algo (para que incluso un observador pueda evaluar si se ha optimizado algo) se requiere primero y antes que nada tener un ‘mapa del mundo’. Distintos ‘mapas del mundo’ pueden generar diferentes estructuras de preferencias y reglas que permitan acercarse a ellas. Y como no hay forma de acceder al ‘mapa del mundo’ correcto (porque como vimos en la sección 1 no hay límite a las posibles distinciones) entonces nunca es posible determinar si el aprendizaje es correcto.
Todos los modelos que así operan sólo pueden hacerlo porque, en primer lugar, ya han decidido limitar el posible aprendizaje. Ya determinan como es el mundo (ya que han determinado cuál es el ‘mapa del mundo’ a usar). Fijado eso es posible que estas cosas operen, pero al hacer eso han limitado las posibilidades de aprendizaje.
En el mundo real, las posibilidades de aprendizaje son permanentes e indefinidas (nadie sabe que es lo que puede aprender), porque así lo es el acto de distinguir, del cual el aprendizaje deriva.