Lema de Zorn

Este artículo o sección necesita referencias que aparezcan en una publicación acreditada.
Busca fuentes: «Lema de Zorn» – noticias · libros · académico · imágenes
Este aviso fue puesto el 2 de enero de 2016.
Max Zorn, fotografiado en 1930.

El lema de Zorn, también llamado de Kuratowski-Zorn, es una proposición de la teoría de conjuntos que afirma lo siguiente:

Todo conjunto parcialmente ordenado no vacío en el que toda cadena (subconjunto totalmente ordenado) tiene una cota superior, contiene al menos un elemento maximal.

Debe su nombre al matemático Max Zorn.

Nociones preliminares

Los términos se definen como sigue.

Dado un conjunto X {\displaystyle X} , un orden en ese conjunto es una relación {\displaystyle \leq } definida entre elementos del conjunto con las tres propiedades siguientes:

  • Reflexividad: x X x x {\displaystyle \forall x\in X\quad x\leq x} .
  • Antisimetría: x , y X ( x y     y x ) x = y {\displaystyle \forall x,y\in X\quad (x\leq y~\land ~y\leq x)\Rightarrow x=y} .
  • Transitividad: x , y , z X ( x y     y z ) x z {\displaystyle \forall x,y,z\in X\quad (x\leq y~\land ~y\leq z)\Rightarrow x\leq z} .

En este caso, diremos que ( X , ) {\displaystyle (X,\leq )} es un conjunto parcialmente ordenado. Si además se tiene la siguiente propiedad:

  • x , y X x y     y x {\displaystyle \forall x,y\in X\quad x\leq y~\lor ~y\leq x} ,

diremos que ( X , ) {\displaystyle (X,\leq )} es un conjunto totalmente ordenado.

Nótese que el orden más habital (en los números enteros, reales, etc.) es total, pero hay otros órdenes que no tienen por qué serlo. Por ejemplo, en Z + {\displaystyle \mathbb {Z} ^{+}} , se puede comprobar que la relación de divisibilidad es un orden: n m n | m {\displaystyle n\leq m\Leftrightarrow n\vert m} (tiene las tres propiedades anteriores). Sin embargo, no es un orden total, pues hay elementos que no son comparables. Por ejemplo, el 3 y el 5 no son comparables por ese orden, pues ni uno divide al otro, ni el otro al uno.

Diremos que un subconjunto Y {\displaystyle Y} de X {\displaystyle X} tiene una cota superior u {\displaystyle u} si y u {\displaystyle y\leq u} para cualquier y Y {\displaystyle y\in Y} ; no se necesita que u {\displaystyle u} sea miembro de Y {\displaystyle Y} . Por ejemplo, 10 es una cota superior de { 1 , 2 , 4 , 6 } {\displaystyle \{1,2,4,6\}} con el orden habitual en Z {\displaystyle \mathbb {Z} } , sin embargo no lo es con el orden de divisibilidad, pues 10 4 , 6 {\displaystyle 10\not \geq 4,6} . En este caso, una cota podría ser, por ejemplo, 24 {\displaystyle 24} .

Un elemento m Y {\displaystyle m\in Y} es maximal si el único y Y {\displaystyle y\in Y} tal que m y {\displaystyle m\leq y} es m {\displaystyle m} mismo. Nótese la diferencia entre maximal y máximo: un elemento es maximal de un conjunto si no existe ningún elemento más grande en el conjunto, y es máximo si es más grande que todos los elementos del conjunto. Por ejemplo, en Z + {\displaystyle \mathbb {Z} ^{+}} con el orden de divisibilidad, el conjunto { 1 , 2 , 4 , 6 } {\displaystyle \{1,2,4,6\}} tiene dos maximales: el 4 y el 6, pues ninguno divide a ningún otro elemento del conjunto. Sin embargo, ninguno de ellos es un máximo, pues ninguno es más grande (es múltiplo) que todos los demás.

Con esto ya estamos en condiciones de entender el enunciado:

Demostración a partir del axioma de elección

El axioma de elección dice que dada una familia (posiblemente infinita) de conjuntos no vacíos podemos definir una aplicación que tome un elemento de cada conjunto:

A : A ( f : A A ) : B A , f ( B ) B {\displaystyle \forall A:\emptyset \not \in A\implies \exists (f:A\to \bigcup A):\forall B\in A,f(B)\in B} .

Con este axioma podemos demostrar el lema de Zorn:

Sea que X {\displaystyle X} el conjunto parcialmente ordenado del enunciado. Suponemos que X {\displaystyle X} no tiene ningún elemento maximal y llegaremos a contradicción.

Por hipótesis, cada subconjunto A X {\displaystyle A\subseteq X} totalmente ordenado tiene una cota superior. Por el axioma de elección podemos definir una función g {\displaystyle g} que dado cada uno de estos subconjuntos devuelva su cota superior. Además, como estamos suponiendo que X {\displaystyle X} no tiene ningún elemento maximal, se puede pedir que la cota de cada uno de estos subconjuntos no esté dentro del subconjunto. Es decir, dado A X {\displaystyle A\subseteq X} totalmente ordenado, g ( A ) X A {\displaystyle g(A)\in X\setminus A} nos da una cota superior. Para cada A X {\displaystyle A\subseteq X} y a A {\displaystyle a\in A} , denotamos A < a = { x A : x < a } {\displaystyle A_{<a}=\{x\in A:x<a\}} (notamos que, en particular, a A < a {\displaystyle a\notin A_{<a}} )

Diremos que A X {\displaystyle A\subseteq X} es un g {\displaystyle g} -conjunto si:

(i) Es totalmente ordenado.

(ii) No contiene secuencias infinitamente descendientes, es decir, no existen secuencias a 1 > a 2 > {\displaystyle a_{1}>a_{2}>\dots } infinitas en A {\displaystyle A} .

(iii) Para cada a A {\displaystyle a\in A} , g ( A < a ) = a {\displaystyle g(A_{<a})=a} (está bien definido porque a A < a {\displaystyle a\notin A_{<a}} ).

Observamos que:

  • El conjunto vacío es trivialmente un g {\displaystyle g} -conjunto.
  • Si A {\displaystyle A} es un g {\displaystyle g} -conjunto, entonces A { g ( A ) } {\displaystyle A\cup \{g(A)\}} también lo es. ( 1 ) {\displaystyle \quad \quad (1)}
Demostración de ( 1 ) {\displaystyle (1)}
Esto último se demuestra comprobando las tres propiedades:

(i) A { g ( A ) } {\displaystyle A\cup \{g(A)\}} es totalmente ordenado porque A {\displaystyle A} ya lo era y, por definición, g ( A ) > x x A {\displaystyle g(A)>x\quad \forall x\in A} .

(ii) Las longitudes de las secuencias descendientes ha aumentado en uno al añadir g ( A ) {\displaystyle g(A)} , pero si eran finitas, lo siguen siendo.

(iii) Para a A {\displaystyle a\in A} , es cierto porque A {\displaystyle A} ya era un g {\displaystyle g} -conjunto, y g ( A { g ( A ) } < g ( A ) ) = g ( A { g ( A ) } { g ( A ) } ) = g ( A ) {\displaystyle g(A\cup \{g(A)\}_{<g(A)})=g(A\cup \{g(A)\}\setminus \{g(A)\})=g(A)} .

Afirmamos que si A , B X {\displaystyle A,B\subseteq X} son g {\displaystyle g} -conjuntos diferentes, entonces A = B < b {\displaystyle A=B_{<b}} para cierto b B {\displaystyle b\in B} o bien B = A < a {\displaystyle B=A_{<a}} para cierto a A {\displaystyle a\in A} . ( 2 ) {\displaystyle \quad \quad (2)}

Demostración de ( 2 ) {\displaystyle (2)}
Sea C = { c A B : A < c = B < b } {\displaystyle C=\{c\in A\cap B:A_{<c}=B_{<b}\}} . Afirmamos que C = A {\displaystyle C=A} o C = A < a {\displaystyle C=A_{<a}} para cierto a A {\displaystyle a\in A} . Supongamos que C A {\displaystyle C\neq A} . Entonces, A C {\displaystyle A\setminus C\neq \emptyset } y, como A {\displaystyle A} es un g {\displaystyle g} -conjunto, por (ii), existe un a A C {\displaystyle a\in A\setminus C} mínimo. Por tanto, A < a C {\displaystyle A_{<a}\subseteq C} . Por otro lado, si c C A < a {\displaystyle \exists c\in C\setminus A_{<a}} , como C A {\displaystyle C\subseteq A} , tenemos que c A {\displaystyle c\in A} y c A < a {\displaystyle c\notin A_{<a}} , por lo que a < c a A < c def  C C {\displaystyle a<c\Rightarrow a\in A_{<c}{\overset {{\text{def }}C}{\subseteq }}C} , pero a A C {\displaystyle a\in A\setminus C} , lo cual es una contradicción. Por tanto, C A < a {\displaystyle C\subseteq A_{<a}} y así, C = A < a {\displaystyle C=A_{<a}} , como queríamos. Simétricamente, tenemos que C = B {\displaystyle C=B} o C = B < b {\displaystyle C=B_{<b}} para cierto b B {\displaystyle b\in B} .Supongamos que C A {\displaystyle C\neq A} y que C B {\displaystyle C\neq B} . Entonces, A < a = C = B < b {\displaystyle A_{<a}=C=B_{<b}} para ciertos a A , b B {\displaystyle a\in A,b\in B} , pero por ser A , B {\displaystyle A,B} g {\displaystyle g} -conjuntos, a = g ( A < a ) = g ( B < b ) = b a A B {\displaystyle a=g(A_{<a})=g(B_{<b})=b\Rightarrow a\in A\cap B} y A < a = B < b = B < a def  C a C = A < a {\displaystyle A_{<a}=B_{<b}=B_{<a}{\overset {{\text{def }}C}{\Rightarrow }}a\in C=A_{<a}} , lo que es contradictorio. Por tanto, C = A {\displaystyle C=A} o C = B {\displaystyle C=B} . Si C = A {\displaystyle C=A} , como A B {\displaystyle A\neq B} por hipótesis, C B {\displaystyle C\neq B} , por lo que, por lo anterior, C = B < b {\displaystyle C=B_{<b}} para cierto b B {\displaystyle b\in B} . De donde A = C = B < b {\displaystyle A=C=B_{<b}} para cierto b B {\displaystyle b\in B} . Simétricamente, si C = B {\displaystyle C=B} , entonces B = C = A < a {\displaystyle B=C=A_{<a}} para cierto a A {\displaystyle a\in A} . Es decir, A = B < b {\displaystyle A=B_{<b}} para cierto b B {\displaystyle b\in B} o bien B = A < a {\displaystyle B=A_{<a}} para cierto a A {\displaystyle a\in A} , que es lo que queríamos ver.

Sea ahora E = A X A   g -conjunto A {\displaystyle E=\bigcup _{\underset {A~g{\text{-conjunto}}}{A\subseteq X}}{A}} . Entonces, a E {\displaystyle \forall a\in E} , si A {\displaystyle A} es un g {\displaystyle g} -conjunto que contiene a a {\displaystyle a} , tenemos que A < a = E < a {\displaystyle A_{<a}=E_{<a}} . ( 3 ) {\displaystyle \quad \quad (3)}

Demostración de ( 3 ) {\displaystyle (3)}
Vemos las dos inclusiones:

( ) {\displaystyle (\subseteq )} Claramente, A < a E < a {\displaystyle A_{<a}\subseteq E_{<a}} , porque x A < a { x A def  E x E x < a } x E < a {\displaystyle x\in A_{<a}\Leftrightarrow \left\{{\begin{matrix}x\in A{\underset {{\text{def }}E}{\Rightarrow }}x\in E\\x<a\end{matrix}}\right\}\Rightarrow x\in E_{<a}} .

( ) {\displaystyle (\supseteq )} Sea x E < a {\displaystyle x\in E_{<a}} y supongamos que B {\displaystyle B} es un g {\displaystyle g} -conjunto tal que x B {\displaystyle x\in B} .

  • Si B A {\displaystyle B\subseteq A} , entonces x A {\displaystyle x\in A} y, como x E < a {\displaystyle x\in E_{<a}} , entonces x < a {\displaystyle x<a} , por lo que x A < a {\displaystyle x\in A_{<a}} .
  • Si B A {\displaystyle B\not \subseteq A} , en particular, A B {\displaystyle A\neq B} y, por ( 2 ) {\displaystyle (2)} , A = B < b {\displaystyle A=B_{<b}} para cierto b B {\displaystyle b\in B} . Además, tenemos que a < b {\displaystyle a<b} porque si b a A = B < b B < a {\displaystyle b\leq a\Rightarrow A=B_{<b}\subseteq B_{<a}} , por lo que a B < a {\displaystyle a\in B_{<a}} , lo que es contradictorio. Entonces, x E < a x < a a < b x < b x B x B < b = A x < a x A < a {\displaystyle x\in E_{<a}\Rightarrow x<a{\overset {a<b}{\Rightarrow }}x<b{\overset {x\in B}{\Rightarrow }}x\in B_{<b}=A{\overset {x<a}{\Rightarrow }}x\in A_{<a}} .

En cualquier caso, x A < a {\displaystyle x\in A_{<a}} , como queríamos.

Por último, E {\displaystyle E} es un g {\displaystyle g} -conjunto. ( 4 ) {\displaystyle \quad \quad (4)}

Demostración de ( 4 ) {\displaystyle (4)}
(i) Es totalmente ordenado: Por definición de E {\displaystyle E} , a , b E A , B {\displaystyle \forall a,b\in E\quad \exists A,B} g {\displaystyle g} -conjuntos con a A , b B {\displaystyle a\in A,b\in B} . Por ( 2 ) {\displaystyle (2)} , B A B A A = B < b B {\displaystyle B\not \subseteq A\Rightarrow B\neq A\Rightarrow A=B_{<b}\subseteq B} , de forma que A B {\displaystyle A\subseteq B} o B A {\displaystyle B\subseteq A} . En cualquier caso, a {\displaystyle a} y b {\displaystyle b} están en un único g {\displaystyle g} -conjunto y son, por tanto, comparables.

(ii) No existen secuencias descendientes infinitas: Supongamos que existe una: a 1 > a 2 > {\displaystyle a_{1}>a_{2}>\dots } . Sea A {\displaystyle A} un g {\displaystyle g} -conjunto con a 1 A i 2 a i E < a 1 = ( 3 ) A < a 1 A A {\displaystyle a_{1}\in A\Rightarrow \forall i\geq 2\quad a_{i}\in E_{<a_{1}}{\overset {(3)}{=}}A_{<a_{1}}\subseteq A\Rightarrow A} tiene una secuencia descendiente infinita, lo cual es contradictorio con que A {\displaystyle A} es un g {\displaystyle g} -conjunto.

(iii) g ( E < a ) = a {\displaystyle g(E_{<a})=a} . Sea A {\displaystyle A} un g {\displaystyle g} -conjunto con a A {\displaystyle a\in A} . Entonces, a = g ( A < a ) = ( 3 ) g ( E < a ) {\displaystyle a=g(A_{<a}){\overset {(3)}{=}}g(E_{<a})} .

Por tanto, E {\displaystyle E} es, por definición y por ( 4 ) {\displaystyle (4)} , el g {\displaystyle g} -conjunto más grande, pero g ( E ) E {\displaystyle g(E)\notin E} y, por ( 1 ) {\displaystyle (1)} , E { g ( E ) } {\displaystyle E\cup \{g(E)\}} es un g {\displaystyle g} -conjunto más grande que E {\displaystyle E} , lo que es contradictorio. La contradcción proviene de haber supuesto que X {\displaystyle X} no tiene ningún elemento maximal. Por tanto, sí que tiene, que es lo que queríamos demostrar. {\displaystyle \quad \square }

Consecuencias

Al igual que el teorema del buen orden, el lema de Zorn es equivalente al axioma de elección, en el sentido de que cualquiera de ellos, junto con los axiomas de Zermelo-Fraenkel, basta para probar los otros. Aparece en las demostraciones de varios teoremas importantes, tales como el teorema de Hahn-Banach en análisis funcional, el teorema de que todo espacio vectorial tiene una base, el teorema de Tychonoff en topología, y los teoremas en álgebra abstracta que afirman que todo anillo con elemento unitario tiene un ideal maximal y que todo cuerpo tiene clausura algebraica.

Ejemplo

Se considerará una aplicación usual del lema de Zorn: la prueba de que todo anillo R con unidad contiene un ideal maximal. Sea P el conjunto de todos los ideales bilaterales de R excepto R mismo, que no es vacío pues incluye al menos al ideal trivial {0} de R. Este conjunto está parcialmente ordenado por inclusión.

Sea entonces T un subconjunto totalmente ordenado de P; se demostrará que T tiene cota superior, es decir, hay un ideal IR que contiene a todos los miembros de T, pero que no es igual a R (de lo contrario no estaría en P). Sea I la unión de todos los ideales en T. Esta es también un ideal: para cualquier a, bI, existen J, KT tales que aJ y bK. Como T está totalmente ordenado, KJ o JK. En el primer caso, bJ y por lo tanto, como J es un ideal, a + b, ar, raJI para cualquier rR. En el segundo caso se razona de manera similar.

Para demostrar que I es distinto de R, basta con observar que un ideal es igual a R si y solo si incluye a 1. Es evidente que si es igual a R debe incluir a 1; recíprocamente, si incluye a 1 debe incluir a 1r = r para cualquier rR, y por lo tanto debe contener a R. Ahora bien, si I = R debería incluir a 1, con lo que habría un JT tal que 1 ∈ J, y por lo tanto J = R, contradiciendo la definición de P, que no lo incluía.

Se demostró que T tiene una cota superior en P. Aplicando el lema de Zorn, se tiene que P debe tener un elemento maximal, y por lo tanto, R tiene un ideal maximal.

Es de notar que la demostración depende del hecho de que R tenga un elemento unitario 1. De lo contrario, no solo la prueba fallaría, el mismo enunciado del teorema sería falso.

Referencias

  • Jinpeng An, A proof of Zorn's lemma, disponible en [1] (en inglés).

Véase también

Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q290810
  • Diccionarios y enciclopedias
  • Britannica: url
  • Wd Datos: Q290810