28 de junio de 2012

Análisis no estándar II


Algunos conjuntos estándar y el principio de extensionalidad transferido

Observación. Los conjuntos $$0=\emptyset,1,2,12^3,e,\pi,\mathbb{N},\mathbb{R},\mathbb{C},\mathbb{F}_2=\mathbb{Z}/2\mathbb{Z}$$ están definidos de manera única por medio de fórmulas clásicas; por lo tanto, por (T′), son conjuntos estándar. En particular, (T′) implica que todos los números definidos explícitamente y de manera única por medio de una fórmula clásica son estándar. Por lo tando, 3, 4, -1,... son estándar.
     Por ejemplo, para la propiedad (o fórmula con una sola variable libre) $P(x)=\;\forall\,y\;[y\notin x]$, existe un único conjunto $x$ tal que $P(x)$, a saber, el conjunto vacío $\emptyset$.

Observación. Consideremos las siguientes fórmulas: $$x=E\cup F,\qquad x=E\cap F,\qquad x=E\times F,\qquad x=F^E.$$ Si los parámetros $E$ y $F$ son estándar, estos definen un $x$ estándar. Por lo tanto, si $E$ y $F$ son estándar, entonces, por (T′), $$E\cup F,\qquad E\cap F,\qquad E\times F\quad\text{y}\quad F^E$$ son estándar.
     Similarmente, por (T′), si $E$ es estándar, también lo es $\mathcal{P}(E)$: considérese la fórmula con variables libres $x,E$ $F(x,E)=\,\forall\,A\;[A\in x\Leftrightarrow A\subseteq E]$.

El principio de extensionalidad transferido. El axioma de transferencia (T) se puede aplicar a la fórmula $F(x,E_1,E_2)$ dada por ‘$x\in E_1\Rightarrow x\in E_2$’ si los dos conjuntos $E_i$ son estándar. Así que, por (T), las siguientes proposiciones son equivalentes: \begin{align} &\forall x(x\in E_1\Rightarrow x\in E_2)\qquad (E_1\subseteq E_2)\notag\\ &\forall^e x(x\in E_1\Rightarrow x\in E_2)\notag. \end{align} En otras palabras, dados dos conjuntos $E_1$ y $E_2$ estándar, para verificar que $E_1$ es subconjunto de $E_2$, basta checar que los elementos estándar de $E_1$ son elementos de $E_2$. Cualquier relación de inclusión entre conjuntos estándar se puede probar a nivel de sus elementos estándar.
     De lo anterior se sigue que dos conjuntos estándar son iguales si tienen los mismos elementos estándar.

Observación. La unicidad del subconjunto estándar $A$ de $E$ cuya existencia es postulada por (E) se sigue del principio de extensionalidad transferido; en efecto, de haber otro subconjunto $B$ de $E$ tal que $\forall^e x\in B,\;P(x)$, entonces $x$ es elemento estándar de $B$ si y sólo si se cumple $P(x)$ si y sólo si $x$ es elemento estándar de $A$. Entonces, por el principio de extensionalidad transferido, $\forall x\; (x\in A\Leftrightarrow x\in B)$.
     Si $E$ es estándar, se tiene la siguiente notación funcional para este subconjunto estándar bien definido $A$ correspondiente a la propiedad $P$: $$A:= ^e\{x\in E\mid P(x)\}.$$

Observación. Si $n\in\mathbb{N}$ es estándar, como $\mathbb{N}$ es estándar, entonces, por (T'), $$I_n:=[0,n[:=\{m\in\mathbb{N}\mid\,m < n\}$$ es estándar. Considérese la fórmula $$F(x,E,n)=\forall m\;[m\in x\Leftrightarrow m\in E\wedge m < n].$$      Similarmente, si $a,b\in\mathbb{R}$ son estándar entonces $[a,b]$ es estándar.


Axioma de especificación

La teoría de conjuntos sobre (ZF) evita las paradojas clásicas (como la de Russell) mediante el siguiente principio. Para especificar un conjunto, es necesario empezar con un conjunto. Más explícitamente, (ZF) postula que si $E$ es un conjunto y $P$ es una propiedad (aplicada a los elementos de $E$), entonces existe un conjunto $E_P$ (un subconjunto de $E$) que consiste precisamente de los elementos $x$ de $E$ para los cuales se cumple $P(x)$: $$E_P=\{x\in E\mid P(x)\}.$$ En otras palabras, para formar un conjunto —dentro de (ZF)—, hay que empezar con un conjunto.
     Es decir, no toda propiedad forma conjuntos; por ejemplo, la propiedad ‘$x=x$’ no forma conjuntos: no existe el conjunto de todos los conjuntos. De otra manera obtendríamos la paradoja de Russell. De ahí que en el axioma de especificación de (ZF), se pida de antemano un conjunto para formar otro.
     De la misma manera, no todas las propiedades dentro de (IET) forman conjuntos: la propiedad ‘$x$ es estándar’ no forma conjuntos. De hecho, hay que hacer una restricción más fuerte en (IET). Si la propiedad $P$ contiene explícita o implícitamente el término ‘estándar’, no existe en general un subconjunto de $E$ que contenga exactamente los elementos $x$ de $E$ para los cuales se cumple $P(x)$. Si tal subconjunto existe, hay que demostrarlo mediante algún método (por ejemplo, especificándolo de otra manera). En otras palabras, si $P$ es no-clásica, antes de escribir $\{x\in E\mid P(x)\}$, hay que demostrar que $P$ forma conjuntos. En general, la propiedad ‘$x$ es estándar’ no forma conjuntos. Notemos, sin embargo, que si $E=\emptyset$, la propiedad anterior —o cualquier otra— forma conjuntos. Similarmente, si el conjunto $E=\{a\}$ consiste precisamente de un elemento estándar $a$, entonces la propiedad ‘$x$ es estándar’ forma conjuntos en $E$ y el $\{x\in E\mid x\text{ es estándar}\}$ es el conjunto $E$ mismo.
     Si $P$ es una propiedad clásica, la existencia del conjunto $\{x\in E\mid P(x)\}$ está garantizada en (ZF) por el axioma de especificación.


Los naturales y algunos teoremas

Teorema. Sea $E$ un conjunto. Las siguientes condiciones son equivalentes:
  1. $\forall x\in E,\;x$ es estándar,
  2. $E$ es estándar y finito.
Demostración. Consideremos las siguientes equivalencias: \begin{align} \exists x\in &E\; x\text{ no-estándar}\Leftrightarrow\exists x\in E\;\forall^e y(x\neq y)\quad (I)\notag\\ &\Leftrightarrow\forall^{ef} F\;\exists x\in E\quad (x\neq y\text{ para todo }y\in F)\notag\\ &\Leftrightarrow\forall^{ef} F\;\exists x\in E\;(x\notin F)\notag\\ &\Leftrightarrow\forall^{ef} F\;\text{$E$ no está contenido en $F$.}\notag \end{align} Por lo tanto, por negación, $$\forall x\in E\; x\text{ es estándar}\Leftrightarrow\text{$E$ está contenido en un conjunto $F$ estándar finito}\;(\ast).$$ Si $E$ es un conjunto estándar finito, entonces, por el ‘sólo si’ de $(\ast)$, se tiene que todos los elementos de $E$ son estándar. Así que hemos demostrado ‘ii$\Rightarrow$i’
     Recíprocamente, si todos los elementos de $E$ son estándar entonces, por $(\ast)$, existe un conjunto estándar finito $F$ tal que contiene a $E$. Entonces, tenemos que $\mathcal{P}(F)$ es estándar y finito, y $E\in\mathcal{P}(F)$; por lo tanto, como ya demostramos ii$\Rightarrow$i, se tiene que $E$ es estándar, y como $E\subseteq F$, se tiene que $E$ es finito.

Observación. Consideremos la relación binaria clásica $R(x,y)$=‘$x > y$’. Entonces, se tiene que se cumple $R(x,F)$ precisamente cuando el natural $x$ es una cota superior estricta del subconjunto $F\subseteq\mathbb{N}$. Cuando $F$ es un subconjunto finito, es posible encontrar un intervalo $[0,n]$ tal que $F\subseteq [0,n]$. Si $F$ es finito y estándar, existe un $x\in\mathbb{N}$ tal que $x > y\;\forall y\in F$, a saber, $x=n+1$. Así que, por (I), se tiene que $$\exists x\in\mathbb{N}\;\forall^e y\in\mathbb{N}\; x > y.$$ Por lo tanto, existen los naturales no-estándar.

Nota. Nelson descubrió que podía axiomatizar la relación ‘$x > n$’ de la siguiente manera: si $x > n$ entonces $$x > y \quad\text{para todo}\quad y\in[0,n],$$ y si $n$ es estándar, todos los subconjuntos (finitos) de $[0,n]$ deberían de ser estándar también.

Definición. Sea $n\in\mathbb{N}$. Se dice que $n$ es ilimitado (o indefinidamente grande) si $n > y $ para todo estándar $y\in\mathbb{N}$.

Proposición. Dado un conjunto $E$, existe un subcojunto finito $A$ de $E$ tal que $A$ contiene a todos los elementos estándar de $E$.

Demostración. Definamos $$\mathcal{P}_f(E):=\{B\in\mathcal{P}(E)\mid B\text{ es finito}\}.$$ Notemos que la propiedad ‘es finito’ está dentro de (ZF), así que tal propiedad forma conjuntos.
     Ahora consideremos la relación binaria clásica $R(B,y)=$ ‘$B$ es un subcojunto finito que contiene a $y$’. Así que $R(B,F)$ equivale a $$B,F\subseteq E\text{ tales que }F\subseteq B.$$ Por lo tanto, si $F$ es un subconjunto estándar y finito de $E$, existe un subconjunto $A$ finito de $E$ tal que $F\subseteq A$ (a saber, $F$ mismo), y de aquí, por idealización, existe un subconjunto finito $A$ de $E$ tal que $A$ contiene a todos los elementos estándar de $E$.

Proposición. Si $E$ es un conjunto infinito, entonces $E$ tiene elementos no-estándar.

Demostración. Consideremos la relación binaria clásica $R(x,y)$ dada por ‘$x\neq y$’ en $E$. Si $F\subseteq E$, la relación extendida $R(x,F)$ equivale a ‘$x\notin F$’. Si $E$ es infinito, entonces para todo subconjunto finito $F$ de $E$, existe $x\in E$ tal que $x\notin F$. Por lo tanto, por idealización, existe $x\in E$ tal que $x\neq y$ para todo elemento estándar de $E$. Así que $x$ es no-estándar.
     Notemos que si $E$ es infinito, entonces $E\setminus\{x\}$ sigue siendo infinito, así que, de lo anterior, existe $x'\in E$ no-estándar distinto de $x$.
     La contrapositiva de esta proposición es ‘Si todos los elementos de $E$ son estándar, entonces $E$ es finito’. El teorema de esta sección nos dice algo más, que, además, $E$ es estándar, y, por supuesto, nos da la recíproca.

Proposición. Si $E$ es un conjunto infinito estándar y $A\subseteq E$ tal que contiene todos los elementos estándar de $E$, entonces $A$ contiene algún elemento no-estándar.

Demostración. Sea $E$ estándar infinito y sea $A\subseteq E$ tal que $\forall^e\,x\;(x\in E\Rightarrow x\in A)$. Si $A$ contiene sólo elementos estándar, entonces $A$ es finito y estándar; así que, por el Principio de Extensionalidad Transferido, se tiene que $E=A$, pues $$\forall^e\,x\;(x\in E\Leftrightarrow x\in A).$$ Pero entonces $E$ es finito, contradicción.

Nota. La afirmación clásica ‘todos los naturales son finitos’ sigue siendo cierta dentro de ANE, pues es una afirmación de (ZF). Es decir, en $\mathbb{N}$ tenemos naturales finitos limitados (los estándar) e ilimitados.
     Pienso que el nombre ‘ilimitados’ no es muy apropiado, pues la idea o la noción de finitud normalmente viene acompñada de la idea de limitado. Sugeriría hablar más bien de naturales finitos indefinidamente grandes; por eso añadí este apelativo en la definición de números naturales ilimitados. Sin embargo, si ya se empezó a usar el apelativo ‘ilimitado’, difícil será cambiarlo, pues, en el lenguaje, el uso es la norma.

Observación. Sean $n,m\in\mathbb{N}$ tales que $n > m$, así que $n+1 > m, n+2 > m,\ldots$; en general, $n+k > m$ para todo $k\in\mathbb{N}$. De aquí, si $n$ es ilimitado, entonces $n+k$ también lo es, para todo $k\in\mathbb{N}$.
     Dado $n$ indefinidamente grande, consideremos el intervalo $I_n$. Entonces, $$J_n:=\mathbb{N}\setminus I_n$$ es un conjunto infinito que sólo contiene naturales ilimitados. Sin embargo, no contiene a todos los naturales ilimitados, pues $n-1\notin J_n$ pero $n-1$ es ilimitado (si no lo fuera, existiría un estándar $k\in\mathbb{N}$ tal que $k > n-1$, y, por lo tanto, $k+1 > n$ con $k+1$ estándar, contradicción). Notemos que, como $n$ es ilimitado, $I_n$ es finito pero contiene a todos los naturales estándar; por supuesto, también contiene elementos no-estándar, a saber, $n-1$.
     Habíamos visto que si $n$ es estándar entonces $I_n$ también lo es. En el párrafo anterior, $I_n$ no puede ser estándar; de lo contrario, todos sus elementos serían estándar, incluido $n-1$.

Observación. Sea $n\in\mathbb{N}$ no-estándar. Entonces $\forall^e m\in\mathbb{N}\; n > m$ (sólo hemos demostrado que existen naturales no-estándar que son estrictamente mayores que todo natural estándar, no que todo no-estándar cumpla tal condición). En efecto, supongamos que existe un estándar $k\in\mathbb{N}$ tal que $k > n$; entonces, el intervalo $I_k$ es finito y estándar, así que todos los elementos de $I_k$ son estándar, pero $n\in I_k$, contradicción. Por lo tanto, $n > m$ para todo estándar $m\in\mathbb{N}$.

Ejemplos y notación. Sea $E$ un conjunto estándar y $A\subseteq E$. Consideremos la propiedad ‘$x\in A$’ y construyamos el subconjunto estándar $$^eA:=\{x\in E\mid x\in A\}.$$ Este subconjunto estándar $^eA$ contiene todos los elementos estándar que pertenecen a $A$ con ningún otro elemento estándar.
     Si $\nu\in\mathbb{N}$ es no-estándar y $A:=[0,\nu]$, entonces $^eA$ contiene todos los naturales estándar. Existe un único subconjunto estándar de $\mathbb{N}$ con esta propiedad; a saber, $\mathbb{N}$. En efecto, por tranferencia, $^eA=\mathbb{N}$.
     De hecho, $$^e[0,\nu]=\mathbb{N}\text{ para todo natural no-estándar $\nu$.}$$      De manera similar, consideremos la propiedad ‘$x$ es estándar’ (la cual no es clásica) en el conjunto $\mathbb{N}$. El subconjunto estándar $$A:=^e\{n\in\mathbb{N}\mid n\text{ es estándar}\}$$ de $\mathbb{N}$ está bien definido por estandarización. Por transferencia, $A=\mathbb{N}$.

Observación. El principio de inducción permanece válido con tal que podamos definir el subconjunto en cuestión: la propiedad que lo especifica tiene que ser clásica. Así que el principio de inducción toma la forma siguiente:
Si $P$ es una propiedad clásica para la cual es cierto $P(0)$ y tal que $$\forall\,n\in\mathbb{N}\;P(n)\Rightarrow P(n+1),$$ entonces $P(n)$ es cierto para todo $n\in\mathbb{N}$.

Parte precedente
Parte siguiente

18 de junio de 2012

Análisis no estándar I


Introducción

Hace tiempo quise acercarme al análisis no estándar; mi primer intento ha de haber sido hace seis años, pero no avancé mucho, no sé por qué. Ahora me he vuelto a acercar, y me está gustando bastante. Lo poco que he leído me ha dejado la impresión de trabajar con límites pero sin límites, algo bien abracadabrante. Así que me he llenado de entusiasmo y me han dado ganas de hablar de análisis no estándar. El libro que estoy siguiendo es el Nonstandard Analysis de Alain M. Robert, de la editorial Dover.
     La intención detrás del análisis no estándar es hacer una fundamentación rigurosa de la noción de “infinitesimal”. Abraham Robinson hizo tal fundamentación en su libro Non Standard Analysis de 1966, y basó su trabajo sobre la teoría de modelos. Sin embargo, no fue sino a partir de 1977 que los matemáticos pudieron acercarse al análisis no estándar sin pasar por previas discusiones sobre lógica, pues Edward Nelson en su artículo Internal Set Theory, a new approach to NSA, Bull. Amer. Math. Soc., 83, (1977), mostró cómo circunscribir los fundamentos lógicos de manera puramente axiomática.
     Es bien sabido que toda la matemática tradicional se puede fundamentar sobre el sistema axiomático de Zermelo-Fraenkel (ZF). Por supuesto que hay otros sistemas sobre los que se puede fundamentar la matemática; sin embargo, vamos a trabajar sobre el sistema axiomático sobre el que trabajó Nelson: (ZF) y tres axiomas más: el axioma de idealización (I), el axioma de estandarización (E) y el axioma de transferencia (T). Estos tres axiomas son los que van a codificar el comportamiento de nuestros nuevos números: los infinitamente grandes y los infinitamente pequeños. Estos tres axiomas codifican su comportamiento de la misma manera que (ZF) codifica la relación $\in$.
     Una de las ventajas del punto de vista de Nelson es que todos los teoremas matemáticos conocidos siguen siendo válidos, ya que conserva todos los axiomas de la teoría de conjuntos. A la matemática que esté basada y construida solamente dentro de (ZF) se le llamará matemática clásica. Llamaremos ANE (Análisis No Estándar; en inglés, NSA, Non Standard Analysis) a la matemática que haga uso de los tres axiomas adicionales (I), (E) y (T), además de los de (ZF). Al sistema axiomático de (ZF) junto con (I), (E) y (T) lo llamaremos (IET). (En inglés a este sistema se le llama (IST), que además son las siglas del nombre que le dio Nelson a la teoría basada en (IST): Internal Set Theory. En español las siglas no coinciden: Teoría de Conjuntos Internos).
     Los tres axiomas (I), (E) y (T) introducen un nuevo término a la matemática, a saber, ‘estándar’. Puesto que ANE está basado en (ZF), el nuevo término se puede aplicar a cualquier conjunto, es decir, a cualquier objeto matemático. En otras palabras, si $x$ es un conjunto, tiene sentido la afirmación “$x$ es estándar”, al igual que “$x$ no es estándar” (es una expresión bien formada dentro de ANE), y como tales, dichas afirmaciones pueden ser verdaderas o falsas.
     Ya que las matemáticas existentes, las clásicas, están construidas y basadas, únicamente, en (ZF), estas quedan inmersas dentro de ANE. Así que todos los sistemas numéricos usuales son los mismos en ANE: $\mathbb{N}$, $\mathbb{Q}$, $\mathbb{R}$, etc. son los mismos en ANE. Más aún, no se añadirán nuevos elementos a estos conjuntos, así que no se hará referencia a ninguna extensión de aquellos. En cierto sentido, lo que ocurre es que ahora, con los axiomas adicionales, seremos capaces de discernir más elementos dentro de los conjuntos clásicos $\mathbb{N}$, $\mathbb{Q}$, $\mathbb{R}$, etc.
     Algo que hay que notar es que todos los objetos considerados por (ZF) son conjuntos. Por ejemplo, los elementos de $\mathbb{N}$ son conjuntos también: el número $0$ es (o representa) el conjunto vacío $\emptyset$, el número $1$ es el conjunto $\{\emptyset\}$, el número $2$ es el conjunto $\{\emptyset,\{\emptyset\}\}$; en general, inductivamente, $n+1:=n\cup\{n\}$. Así que dentro de ANE cabe preguntarse si un número natural $n$ es estándar o no-estándar. Lo que obtendremos, de hecho, es que hay números naturales estándar y no-estándar.


(I), (E) y (T)

Notación. Antes de comenzar, haremos las siguientes abreviaciones: $$\forall^e\ x\in E\ldots,\quad\forall^{ef}x\in E\ldots,\quad\exists^e x\in E\ldots,\quad\exists^{ef}x\in E\ldots,$$ las cuales significan respectivamente
  • para todo elemento estándar $x$ de $E$, (se tiene que)$\ldots$
  • para todo $x$ estándar y finito de $E$, (se tiene que)$\ldots$
  • existe un elemento estándar $x$ en $E$ tal que$\ldots$
  • existe un $x$ finito y estándar en $E$ tal que$\ldots$
Nota. Cualquier afirmación, definición, fórmula, resultado, etc que no use el término estándar, ya sea explícita o implícitamente, se dirá que es clásico, como ya se dijo antes.

El axioma de idealización (I) dice:
Sea $R(x,y)$ una relación binaria clásica. Las siguientes propiedades son equivalentes:
  1. para todo conjunto finito y estándar $F$ existe un $x=x_F$ tal que $R(x,y)$ se cumple para todo $y\in F$,
  2. existe un $x$ tal que $R(x,y)$ se cumple para todo $y$ estándar.
Más formalmente, este axioma se cumple para la relación binaria clásica $R(x,y)$ y afirma que $$\forall^{ef}F\;\exists (x=x_F)\forall\,y\in F\;R(x,y)\Leftrightarrow\exists\,x\forall^e\,y\;R(x,y).$$ Notación. En lugar de escribir $$\text{se cumple}\quad R(x,y)\quad\text{para todo $y\in F$},$$ escribiremos $$\text{se cumple}\quad R(x,F).$$ Así que (I) se puede reenunciar de la siguiente manera:
dada una relación binaria clásica $R(x,y)$, las siguientes propiedades son equivalentes:
  1. para todo conjunto finito estándar $F$ existe un $x$ (que depende de $F$) tal que se cumple $R(x,F)$,
  2. existe un $x$ tal que $R(x,y)$ se cumple para todo $y$ estándar.
Observación. Cuando se considere la relación $R$ en el axioma de idealización, se puede pensar que $R$ es su gráfica y que es un subconjunto de $E\times E'$ con $E$ y $E'$ conjuntos estándar. Es decir, se puede pensar que $R(x,y)$ se cumple si y sólo si $(x,y)\in R$. Sin embargo, esta simplificación no siempre tiene sentido; por ejemplo, la relación binaria clásica ‘$y\in x$’ no puede escribirse de la manera antedicha.
     Entonces para esta relación $R$ (la de pertenencia), tendríamos que $R(x,F)$ representa la relación $F\subseteq x$. Apliquemos el axioma de idealización: si $F$ es un conjunto finito estándar, podemos tomar $x:=F$, y entonces tenemos que $R(x,F)$; por lo tanto, según (I) existe un conjunto $x$ tal que todo conjunto estándar $y$ pertenece a $x$.

El axioma de estandarización (E) dice:
Sea $E$ un conjunto estándar y $P$ una propiedad (clásica o no). Entonces existe un (único) subconjunto estándar $A=A_P\subseteq E$ tal que tiene por elementos estándar precisamente los elementos estándar $x\in E$ que cumplen $P(x)$.
En otras palabras, dado un conjunto estándar $E$ $$\exists^eA\subseteq E\;\forall^e\,x\, [x\in A\Leftrightarrow x\in E\;\text{y}\;P(x)].$$
El axioma de transferencia (T) dice:
Si $F$ es una fórmula clásica y todos los parámetros $t_1,\ldots,t_n$ de $F$ tienen valores estándar, entonces $F$ se cumple para todo $x$ y sólo si $F$ se cumple para todo estándar $x$. En otras palabras, si $F$ es una fórmula clásica cuyas únicas variables libres son $x,t_1,\ldots,t_n$ entonces $$\forall^e\,t_1\cdots\forall^e\,t_n[\forall\,x\;F\Leftrightarrow\forall^e\,x\;F].$$
Forma dual del axioma de transferencia. La forma dual equivalente (T') de la transferencia se obtiene al reemplazar $F$ por su negación $\neg F$. Por (T) (para una fórmula clásica $F$ con valores estándar para todos sus parámetros $t_1,\ldots,t_n$), se tienen las siguientes equivalencias:
  1. para todo $x$ se cumple $F$,
  2. para todo estándar $x$ se cumple $F$.
Se pueden reformular respectivamente como
  1. no existe $x$ tal que $F$ no se cumple,
  2. no existe ningún estándar $x$ tal que $F$ no se cumple.
Por otro lado, $$\neg\forall\,x\;\neg F\Leftrightarrow\exists\,x\;F,$$ entonces se obtiene la forma dual de (T), como equivalencia entre
  1. existe un $x$ tal que $F$ y
  2. existe un estádar $x$ tal que $F$.
si $F$ es una fórmula clásica con valores estándar en todos sus parámetros $t_1,\ldots,t_n$. Así que para una fórmula clásica $F$ cuyas únicas variables libres son $x,t_1,\ldots,t_n$, el axioma de transferencia se puede reescribir en la forma (T') $$\forall^e\,t_1\cdots\forall^e\,t_n[\exists x\; F\Leftrightarrow\exists^e x\; F].$$ Observación. De la formulación anterior, se sigue que todos los conceptos que están bien definidos (es decir, que están definidos de manera única) dentro de la matemática clásica son estándar. En otras palabras, si existe un único $x$ tal que $F$ ($F$ clásica y $t_1,\ldots,t_n$ parámetros de $F$ con valores estándar), entonces este $x$ tiene que ser estándar.

Parte siguiente

8 de junio de 2012

Racionales y expansiones decimales

No estoy seguro si fue en la secundaria o en la preparatoria donde vi por primera vez que $1=0{.}99999\ldots$ (con puros nueves ad infinitum). Cuando lo vi, me pareció realmente muy extraño, hasta que el maestro nos demostró que eran realmente el mismo número. No recuerdo exactamente qué hizo, pero seguramente no fue algo muy diferente de lo siguiente.
     Sea $x:=0{.}999\ldots$. Entonces $$10x=9.999\ldots$$ y \begin{align} 10x-x&=9\notag\\ 9x&=9\notag, \end{align} y de aquí, $x=\frac{9}{9}=1$.
     Pues resulta que todo número racional tiene una expansión decimal (infinita) periódica y todo número real con una expansión decimal (infinita) periódica es racional. Antes de seguir hagamos unas cuantas definiciones para que todo quede más claro.

Definición. Sea $a\in\mathbb{R}$ con expansión decimal $$a'{.}a_1a_2a_3\ldots;$$ es decir, $a'\in\mathbb{Z}$ y $a_i\in\mathbb{N}$ con $0\leq a_i\leq 9$. Diremos que la expansión decimal de $a$ es periódica si existe una sucesión finita de numerales $b_1b_2b_3\ldots b_n$ tal \begin{align} a&=a'{.}a_1a_2a_3\ldots\notag\\ &=a'{.}a_1a_2a_3\ldots a_kb_1b_2b_3\ldots b_nb_1b_2b_3\ldots b_nb_1b_2b_3\ldots b_n\ldots\notag \end{align} Es decir, si existe una sucesión finita de $n$ numerales que se repite indefinidamente a partir de cierto $k$ a lo largo de la expansión de $a$. A $n$ se le llama el periodo de $a$.
     A los numerales que se repiten se les denota de las siguientes maneras: $$a'{.}a_1a_2a_3\ldots a_k\overline{b_1b_2b_3\ldots b_n}$$ o $$a'{.}a_1a_2a_3\ldots a_k(b_1b_2b_3\ldots b_n).$$
     Por ejemplo, $1=0{.}\overline{9}$, $\frac{4}{33}=0{.}\overline{12}$, $\frac{77}{111}=0{.}\overline{693}$, $\frac{23}{27}=0{.}\overline{851}$, $\frac{111}{7}=15{.}\overline{857142}$.
     Veamos que toda expansión decimal periódica es un racional. Sea $a\in\mathbb{R}$ con expansión decimal $$a=a'{.}a_1a_2a_3\ldots a_k\overline{b_1b_2b_3\ldots b_n}$$ Entonces $$10^{k+n}a-10^ka=a'a_1\ldots a_kb_1\ldots b_n-a'a_1\ldots a_k;$$ así que $$a=\frac{a'a_1\ldots a_kb_1\ldots b_n-a'a_1\ldots a_k}{10^{k+n}-10^k}\in\mathbb{Q},$$ pues tanto el numerador como el denominador son enteros.
     Esto nos da una manera de calcular la expresión como cociente de dos enteros para un racional expresado como una expansión decimal periódica. Por ejemplo, si $a=23{.}478\overline{27}$, entonces \begin{align} a&=\frac{2347827-23478}{10^5-10^3}\notag\\ &=\frac{2324349}{99000}\notag. \end{align}      Ahora veamos que todo racional tiene una expansión decimal periódica. Sean $p,q\in\mathbb{Q}$ con $q\neq 0$. Se tiene que los residuos posibles para esta división son $0,1,2,\ldots q-1$; así que hay un número finito de residuos; por lo tanto, a la hora de hacer la división, en algún momento alguno se ha de repetir durante la división. Cuando esto ocurra, comenzarán a repetirse los numerales del cociente. Esto se verá de la siguiente manera: $$\begin{array}{c c c c c c c c c c c} & a' & {.} & a_1 & \ldots & a_{k-1} & a_k & b_1 & b_2 & \ldots & b_n & b_1\ldots\\ q\quad| & p & & & & & & & & & & \\ & & \ddots & & & & & & & & & \\ & & & c_1 & & & & & & & & \\ & & & & \ddots & & & & & & & \\ & & & & & c_{k-1} & & & & & & \\ & & & & & & d_1 & 0 & & & & \\ & & & & & & & d_2 & 0 & & & \\ & & & & & & & & d_3 & & & \\ & & & & & & & & & \ddots & & \\ & & & & & & & & & & d_1 & 0 \\ & & & & & & & & & & & d_2 \end{array}.$$ Por lo tanto, todo racional tiene una expansión decimal periódica. En consecuencia todo irracional tiene expansión decimal aperiódica.
     En este enlace hay algunos resultados interesantes en relación a las expansiones decimales y los racionales.

4 de junio de 2012

Concepto de número


1. Funciones

El concepto de función se puede definir de varias maneras. En la Teoría de conjuntos se define de dos maneras, una presenta problemas y la otra no. En la Teoría de categorías es un término primitivo. Intentaré dar una definición informal y después la formal.
     Una función que va de un conjunto $A$ (llamado su dominio) a un conjunto $B$ (llamado su codominio) es una regla que asigna a cada elemento de $A$ un elemento de $B$ y uno solo.
La definición formal es la siguiente.

Definición Dados dos conjuntos $A$ y $B$ con $B\neq\emptyset$, una función $f$ de $A$ a $B$, denotada $f:A\rightarrow B$, es una tripleta $(A,\bar{f},B)$ donde $\bar{f}$ es un subconjunto de $A\times B$ (el producto cartesiano de $A$ y $B$) tal que si $(a,b_1)$ y $(a,b_2)$ son elementos de $\bar{f}$ entonces $b_1=b_2$ y tal que para todo $a\in A$ existe $b\in B$ tal que $(a,b)\in\bar{f}$. A $A$ se le llama dominio de $f$ y a $B$ codominio de $f$.

     Lo que significa la condición después del `tal' es que la regla que determina a $f$ asigna a cada elemento de $A$ un elemento de $B$ y uno solo.
     Por ejemplo, consideremos dos diagramas de Venn, llamémosle a uno $S$ y a otro $T$. Ahora dibujemos dentro del diagrama $S$ tres puntitos y dentro de $T$ cinco puntitos. Ahora vamos a hacer una correspondencia entre los puntitos de $S$ y los de $T$. Digamos que el diagrama de $S$ lo dibujamos a la izquierda y $T$ a la derecha.
     Hagamos una flecha para cada puntito en $S$ que vaya a un solo elemento de $T$. Esta correspondencia es una función. Llamémosle $f_1$.
     Ahora dibujemos otra vez a $S$ con sus tres puntitos y a $T$ con sus cinco. Digamos que los puntitos de $S$ se llaman $s_1,s_2,s_3$ y los de $T$ se llaman $t_1,...,t_5$. Entonces, hagamos una flecha de $s_1$ a $t_1$, otra de $s_2$ a $t_5$, otra de $s_3$ a $t_3$ y otra de $s_1$ a $t_2$. Entonces, esta regla de correspondencia que va de $S$ a $T$ no es una función porque a $s_1$ le estamos asignando dos elementos distintos de $T$.
     Ahora dibujemos otra vez a $S$ con sus tres puntitos y a $T$ con sus cinco. Hagamos una flecha de $s_2$ a $t_1$ y una de $s_3$ a $t_2$. Esta regla de correspondencia tampoco es una función, porque no asigna a cada elemento de $S$ un elemento de $T$: a $s_1$ no se le ha asignado ningún elemento de $T$.
     Ahora definamos lo que es una función inyectiva, suprayectiva y biyectiva.

Definición. Dada una función $f:A\rightarrow B$ y un subconjunto $C\subseteq A$, la imagen de $C$ bajo $f$ es el conjunto $$f(C):=\{f(c)\mid c\in C\}.$$ A la imagen de $A$ bajo $f$ también se la llama la imagen de $f$.



Definición. Dada una función $f:A\rightarrow B$, diremos que $f$ es suprayectiva si para todo $b\in B$ existe un $a\in A$ tal que $f(a)=b$.

     Lo que esto significa es que si $f$ es una función suprayectiva, entonces $B$ queda completamente cubierto por la imagen de $f$. En otras palabras, si $f:A\rightarrow B$ es suprayectiva entonces $f(A)=B$.
     Veamos algunos ejemplos.
     Consideremos a nuestros conjuntos $S$ y $T$ del principio.
     Notemos que es imposible definir una función suprayectiva de $S$ a $T$: siempre nos van a sobrar elementos de $T$. Sin embargo, sí podemos definir una función suprayectiva de $T$ a $S$.

Definición. Dada una función $f:A\rightarrow B$ y un subconjunto $D$ de $B$, definimos la imagen inversa de $D$ bajo $f$ como $$f^{-1}(D)=\{a\in A\mid \exists d\in D\ f(a)=d\}.$$


Definición. Dada una función $f:A\rightarrow B$, diremos que $f$ es inyectiva si para cualesquiera $a_1,a_2\in A$ si $f(a_1)=f(a_2)$ entonces $a_1=a_2$. O dicho de otro modo (con la contrapositiva), si para cualesquiera $a_1,a_2\in A$ si $a_1\neq a_2$ entonces $f(a_1)\neq f(a_2)$.

     Lo que esto significa es que si queremos definir una función inyectiva de $A$ a $B$, no podemos asignarle a dos elementos de $A$ un mismo elemento de $B$. O dicho de otra manera, que $f^{-1}(\{b\})$ o es vacío o tiene un solo elemento: que $f^{-1}(\{b\})$ tiene a lo más un elemento. O que $f$ asigna a elementos distintos de $A$ elementos distintos de $B$.
     Consideremos otra vez nuestros conjuntos $S$ y $T$ del principio. Notemos que es imposible definir una función inyectiva de $T$ a $S$, pero sí podemos definir una (de hecho, varias) de $S$ a $T$.

Definición. Dada una función $f:A\rightarrow B$, diremos que $f$ es biyectiva si es suprayectiva e inyectiva.

     Antes de seguir, quisiera explicar por qué es importante considerar una función $f:A\rightarrow B$ como una tripleta $(A,\bar{f},B)$ y no sólo como su gráfica $\bar{f}$.

Definición. Dadas dos funciones $f:A\rightarrow B$ y $g:C\rightarrow D$ tales que $B=C$, se define la composición $g\circ f:A\rightarrow D$ de $g$ con $f$ como sigue: $$\forall x\in A\ g\circ f(x)=g(f(x)).$$
     Notemos que no se puede definir la composición de funciones, a menos que $\mathit{cod}(f)=\mathit{dom}(g)$.
     Entonces, por ejemplo, la función identidad $id_{\mathbb{Z}}:\mathbb{Z}\rightarrow\mathbb{Z}$ tiene la misma gráfica que la función inclusión $j:\mathbb{Z}\hookrightarrow\mathbb{Q}$, que incluye los enteros en los racionales; sin embargo, no son la misma función. Debido a la composición, es importante considerar a las funciones con sus dominios y codominios, no sólo con sus gráficas. Esa es la definición de función en la Teoría de Conjuntos que presenta problemas, la considera a una función sólo como su gráfica. Por otro lado, la identidad y la inclusión son conceptualmente diferentes.
     Sigamos. Ahora consideremos otra vez a nuestros conjuntos $S$ y $T$. Definamos la siguiente función suprayectiva $g$ de $T$ sobre $S$: $t_1$ va a $s_1$, $t_2$ a $s_2$, $t_3$ a $s_3$, $t_4$ a $s_2$ y $t_5$ a $s_2$. Recomiendo hacer el dibujo de los diagramas de Venn.
     Ahora consideremos las siguientes imágenes inversas: \begin{align} g^{-1}(\{s_1\})&=\{t_1\}\notag\\ g^{-1}(\{s_2\})&=\{t_2,t_4,t_5\}\notag\\ g^{-1}(\{s_3\})&=\{t_3\}\notag. \end{align}      Esto nos dice que podemos definir una función $h:S\rightarrow T$ tal que $g\circ h_1=id_S$, la identidad de $S$. A saber, $h_1(s_1)=t_1$, $h_1(s_2)=t_4$ y $h_1(s_3)=t_3$. De hecho, tenemos otras dos funciones de $S$ a $T$ que hacen eso. Sólo habría que enviar el $s_2$ al $t_2$ o al $t_5$.
     De hecho, esto es cierto para toda función suprayectiva; es decir, toda función suprayectiva $f:A\rightarrow B$ tiene una inversa derecha. Si $B$ es infinito, que $f$ tenga inversa derecha es equivalente al axioma de elección. Y recíprocamente, toda función con inversa derecha es suprayectiva.
     Ahora consideremos la función $h:S\rightarrow T$ definida como sigue: $h(s_1)=t_1$, $h(s_2)=t_2$ y $h(s_3)=t_3$. Tenemos que $h$ es inyectiva. Consideremos las imágenes inversas: \begin{align} h^{-1}(\{t_1\})&=\{s_1\}\notag\\ h^{-1}(\{t_2\})&=\{s_2\}\notag\\ h^{-1}(\{t_3\})&=\{s_3\}\notag\\ h^{-1}(\{t_4\})&=\emptyset\notag\\ h^{-1}(\{t_5\})&=\emptyset\notag. \end{align}      Esto nos dice que podemos definir una función $k:T\rightarrow S$ tal que $k\circ h=id_S$, si definimos $k$ como sigue: $k(t_1)=s_1$, $k(t_2)=s_2$, $k(t_3)=s_3$, $k(t_4)=s_1$ y $k(t_5)=s_1$. (Nótese que hay más funciones que son inversa izquierda de $h$).
     De hecho, es cierto que para toda función inyectiva $f:A\rightarrow B$ existe una inversa izquierda $g:B\rightarrow A$ tal que $g\circ f=id_A$. Y recíprocamente toda función con inversa derecha es inyectiva.
     Ahora, supóngase que tenemos una función biyectiva $f:A\rightarrow B$. Como $f$ es biyectiva, es suprayectiva y entonces existe $g:B\rightarrow A$ tal que $f\circ g=id_B$, y como es $f$ es inyectiva, existe una $h:B\rightarrow A$ tal que $h\circ f=id_A$. Tenemos que $$h=h\circ id_B=h\circ (f\circ g)=(h\circ f)\circ g=id_A\circ g=g.$$ Entonces, $f$ tiene una sola inversa, tanto izquierda como derecha. Además, $g$, la sola inversa, es inyectiva y suprayectiva, pues su inversa izquierda y derecha es $f$. Dijimos que toda función con una inversa izquierda es inyectiva y que toda con inversa derecha es suprayectiva.


2. Primeros números

Imaginemos que estamos en los comienzos de la domesticación y que nuestro idioma sólo cuenta con los cardinales uno, dos y tres, y ningún otro. Ahora imaginemos que somos pastores de ovejas y que tenemos muchas muchas ovejas, y que un día, hartos de perder muchas ovejas, decidimos inventar una manera de tener el número exacto de ovejas que tenemos para no perderlas. Se nos han ocurrido dos maneras de hacerlo. Una es hacer nudos en una cuerda y ponerlos en correspondencia biyectiva con nuestras ovejas. Otra es tener una caja con piedras y ponerlas en correspondencia biyectiva con nuestras ovejas. Es decir, a pesar de que nuestro idioma no cuente con un nombre para números mayores que tres, vamos a saber exactamente cuántas ovejas tenemos. Esa correspondencia biyectiva (o biyección) encierra el concepto de número: si tenemos dos conjuntos finitos $A$ y $B$ y definimos entre ellos una función biyectiva, entonces esto significará que tienen el mismo número de elementos. Si tal cosa no es posible, entonces sus números de elementos son distintos, o uno mayor que otro. Sin embargo, si es posible definir una función suprayectiva de $A$ sobre $B$ entonces sabremos que el número de elementos de $A$ es mayor o igual al número de elementos de $B$. Si es posible definir una función inyectiva de $A$ a $B$ entonces el número de elementos de $A$ es menor o igual al número de elementos de $B$. Si es posible definir una biyección de $A$ sobre $B$ entonces el número de elementos de $A$ y $B$ es el mismo. Estas pequeñas observaciones para conjuntos finitos se pueden extender para conjuntos infinitos. Es decir, este mismo método de contar, mediante biyecciones entre conjuntos, se puede extender a cualquier conjunto, sea finito o infinito. Es decir, con la ayuda de las biyecciones podemos definir la noción de número de cualquier tamaño.
     Ahora, veamos que el número de elementos del conjunto de números pares es el mismo que el de los números naturales. Denotemos por $\mathbb{PAR}$ el conjunto de números pares; es decir, $$\mathbb{PAR}=\{0,2,4,6,8,10,\ldots\}.$$ Definamos $g:\mathbb{PAR}\rightarrow\mathbb{N}$ como sigue: \begin{align} g:\mathbb{PAR}&\rightarrow\mathbb{N}\notag\\ k&\mapsto \frac{k}{2}\notag. \end{align}      Esta función $g$ es suprayectiva e inyectiva. Veamos que es suprayectiva, es decir, que $g(\mathbb{PAR})=\mathbb{N}$. Sea $n\in\mathbb{N}$; entonces $2n\in\mathbb{PAR}$ y $g(2n)=n$. Por lo tanto, para todo $n\in\mathbb{N}$ exite $k\in\mathbb{PAR}$ tal que $g(k)=n$; a saber, $k=2n$. Veamos que $g$ es inyectiva. Sean $k,p\in\mathbb{PAR}$ tales que $g(k)=g(p)$. Entonces, por definición de $g$, tenemos que $$\frac{k}{2}=\frac{p}{2}.$$ De aquí, $k=p$; por lo tanto, $g$ es inyectiva, y por lo tanto biyectiva, así que el número de elementos de $\mathbb{PAR}$ es igual que el de $\mathbb{N}$.
     Notemos que la función inversa de $g$ es \begin{align} f:\mathbb{N}&\rightarrow\mathbb{PAR}\notag\\ n&\mapsto 2n\notag. \end{align} Y $f$ también es biyectiva.
     Ahora consideremos la $f$ anterior y la inclusión $j:\mathbb{PAR}\hookrightarrow\mathbb{N}$. La composición $j\circ f:\mathbb{N}\rightarrow\mathbb{N}$ no es una biyección, pues en esta composición nos sobran los impares en el lado derecho; es decir, esta función no aparea biunívocamente elementos de uno y otro conjunto; dicho de otro modo, esta función no es un conteo.


3. Números transfinitos

Un resultado conocido dentro de las matemáticas (el Teorema de Cantor) es que dado un conjunto $A$ (sea finito o infinito), no es posible encontrar o definir una función suprayectiva $f:A\rightarrow\mathcal{P}(A)$ (de $A$ sobre su conjunto potencia $\mathcal{P}(A)$). Sin embargo, sí se puede definir una función inyectiva $g$ de $A$ en $\mathcal{P}(A)$; a saber \begin{align} g:A&\rightarrow\mathcal{P}(A)\notag\\ a&\mapsto\{a\}\notag. \end{align} Así que esto nos dice que siempre, sea $A$ finito o infinito, el número de elementos de $\mathcal{P}(A)$ es estrictamente mayor que el de $A$. En particular, esto es cierto para $\mathcal{P}(\mathbb{N})$ y $\mathbb{N}$.
     Ahora, por otro lado, se tiene que dado un conjunto $A$ y $B\subseteq A$, podemos definir la siguiente función $\chi_B:A\rightarrow 2$ (llamada la función característica de $B$), donde $2=\{0,1\}$, como $$\chi_B(a)=\begin{cases} 1 &\text{si $a\in B$}\\ 0 &\text{si $a\notin B$}. \end{cases}$$      Entonces, veamos que existe una biyección entre $\mathcal{P}(A)$ y $2^A$ (el conjunto de todas las funciones que van de $A$ a 2).
     Definamos esa función $h:\mathcal{P}(A)\rightarrow 2^A$ como \begin{align} h:\mathcal{P}(A)&\rightarrow 2^A\notag\\ B&\mapsto\chi_B\notag. \end{align} Veamos que $h$ es suprayectiva. Sea $f:A\rightarrow 2$ una función cualquiera de $A$ a $2$. Definamos entonces $$C:=f^{-1}(\{1\}).$$      Entonces, $C\subseteq A$ y se tiene que $\chi_C=f$; por lo tanto, $h(C)=f$, así que $h$ es suprayectiva.
     Es fácil ver que si $B,C\subseteq A$ y $\chi_B=\chi_C$ entonces $B=C$, y por lo tanto $h$ es inyectiva. Así que $\mathcal{P}(A)$ y $2^A$ tienen el mismo número de elementos.
     Entonces, volviendo a $\mathbb{N}$, tenemos que $\mathcal{P}(\mathbb{N})$ y $2^{\mathbb{N}}$ tienen el mismo número de elementos, y sabemos que el número de elementos de $2^{\mathbb{N}}$ es $2^{\aleph_0}=\aleph_1$, que es el número de elementos de $\mathbb{R}$, así que $\aleph_0=|\mathbb{N}|<|\mathcal{P}(\mathbb{N})|=\aleph_1$ (las barras denotan “número de elementos”). Entonces, de manera indirecta se ha demostrado que hay más números reales que naturales, sin usar el argumento de las expansiones decimales.
     Así que podemos encontrar números infinitos cada vez más grandes: si $A$ es infinito, $$|A|<|\mathcal{P}(A)|<|\mathcal{P}(\mathcal{P}(A))|<|\mathcal{P}(\mathcal{P}(\mathcal{P}(A)))|<\ldots$$

4. Teorema de Cantor y el argumento por la diagonal1

Lo que se demuestra en el Teorema de Cantor es que dado un conjunto $A$, no se puede definir una función suprayectiva de $A$ sobre $\mathcal{P}(A)$. La demostración es bastante simple; es la siguiente.
     Sea $f:A\rightarrow\mathcal{P}(A)$ una función. Veamos que no es suprayectiva. Sea $$B:=\{x\in A\mid x\notin f(x)\}.$$ Se tiene que $B\subseteq A$ y no hay $a\in A$ tal que $f(a)=B$, pues de haberlo si $a\in B$ entonces $a\notin f(a)=B$, contradicción; si $a\notin B=f(a)$ entonces $a\in B$ por definición de $B$, contradicción.
     La definición de $B$ es una generalización del argumento por la diagonal. Ahora veamos en qué consiste el argumento por la diagonal de Cantor. Tal argumento demuestra que no es posible definir una biyección entre $\mathbb{N}$ y $\mathbb{R}$. Para hacerlo bastará demostrar que $|[0,1]|\neq\aleph_0$ (basta demostrarlo para $[0,1]$ porque se tiene la siguiente sucesión de funciones inyectivas: $$\mathbb{R}\overset{h}{\rightarrow}(0,1)\hookrightarrow[0,1]\hookrightarrow\mathbb{R},$$ donde \begin{align} h:\mathbb{R}&\rightarrow (0,1)\notag\\ x&\mapsto \frac{e^x}{1+e^x}\notag \end{align} y las otras dos funciones son las inclusiones. Así que se tiene que $$|\mathbb{R}|\leq |(0,1)|\leq |[0,1]|\leq|\mathbb{R}|,$$ y, por lo tanto, $|\mathbb{R}|=|(0,1)|=|[0,1]|$). La demostración será por contradicción. Supongamos que [0,1] y $\mathbb{N}$ tienen el mismo número de elementos. Es decir, supongamos que existe una función biyectiva f:N→[0,1]; en otras palabras, que para todo $s\in[0,1]$ existe un $n\in\mathbb{N}$ tal que $f(n)=s$, y para cualesquiera $n,m\in\mathbb{N}$, si $f(n)=f(m)$ entonces $n=m$. Esto significa que podemos numerar todos los elementos de [0,1]. Digamos que dicha numeración es la siguiente: $$b_0, b_1, b_2,\ldots$$ Es decir que $f(0)=b_0$, $f(1)=b_1$, $f(2)=b_2,\ldots$ Que en general, $f(n)=b_n$ para todo $n\in\mathbb{N}$, donde $b_n\in [0,1]$ para todo $n\in\mathbb{N}$.
     Ahora, consideremos la expansión decimal de esos números. Entonces, tenemos lo siguiente: \begin{align} b_0&=0.b_{00} b_{01} b_{02}\ldots\notag\\ b_1&=0.b_{10} b_{11} b_{12}\ldots\notag\\ b_2&=0.b_{20} b_{21} b_{22}\ldots\notag\\ \vdots\notag \end{align} Entonces, como la expansión sólo consta de dígitos entre 0 y 9, para cada $b_{ii}$, sea $0\leq a_i\leq 9$ un dígito distinto de $b_{ii}$. Entonces, el número real $a$ con expansión decimal $$0.a_0 a_1 a_2\ldots$$ no es ninguno de los $b_i$. Se tiene que $a\neq b_0$, porque $a_0\neq b_{00}$; que $a\neq b_1$, porque $a_1\neq b_{11}$; que $a\neq b_2$, porque $a_2\neq b_{22}$; en general, $\forall i\in\mathbb{N}\ a\neq b_i$, porque $\forall i\in\mathbb{N}\ a_i\neq b_{ii}$. Esto significa que $f$ no es una suprayección, pues no existe $i\in\mathbb{N}$ tal que $f(i)=a$. Por lo tanto, no puede existir una biyección entre $[0,1]$ y $\mathbb{N}$, y en consecuencia entre $\mathbb{N}$ y $\mathbb{R}$.
     Ahora veamos por qué definir $B:=\{x\in A\mid x\notin f(x)\}$ es una generalización del argumento por la diagonal. Tenemos que $2^{\mathbb{N}}$ es el conjunto de todas las funciones que van de $\mathbb{N}$ a $2=\{0,1\}$. En otras palabras, son sucesiones de 0s y 1s. Si $g$ fuera una tal función, $g$ podría ser $$g(0)=0,g(1)=1,g(2)=1,g(3)=0,g(4)=0,\ldots$$ es decir, $$01100\ldots$$ Si la escribiéramos como $0.01100\ldots$ tendríamos la expansión binaria de un número en el intervalo $[0,1]$. Es decir, $2^{\mathbb{N}}$ podemos considerarlo como $[0,1]$.
     Si $A=\mathbb{N}$ en la demostración del Teorema de Cantor entonces tendríamos que $$B=\{n\in\mathbb{N}\mid n\notin f(n)\}.$$ Tenemos que $f(n)$ nos da un subconjunto de $\mathbb{N}$; si pensamos en la biyección entre $\mathcal{P}(\mathbb{N})$ y $2^{\mathbb{N}}$, lo que obtendríamos sería $\chi_{f(n)}$, la función característica de $f(n)$, y entonces que “$n\notin f(n)$” significaría que $\chi_{f(n)}(n)=0$. Entonces, al considerar $B$ como elemento de $\mathcal{P}(\mathbb{N})$, lo que obtenemos del otro lado es $\chi_B$, que cambia los 0s por 1s y los 1s por 0s en la diagonal $\chi_{f(i)}(i)$ de la matriz infinita $\chi_{f(-)}(-)$.


5. Aclaraciones

Hay varios conceptos que se pueden encontrar asociados con la noción de infinito, además del de número de elementos. Uno de ellos es el de medida (sugiero mejor leer la entrada en inglés). Por ejemplo, la longitud (la medida de Lebesgue sobre $\mathbb{R}$) de la recta real es infinita y la del intervalo $[0,1]$ es 1. Que haya una biyección entre $\mathbb{R}$ y $[0,1]$ no significa que se meta un conjunto de longitud infinita dentro de uno de longitud 1, sólo que tienen el mismo número de elementos y sólo eso: una biyección no mete un conjunto dentro de otro, sólo aparea elementros entre conjuntos. Se tiene que el área (la medida de Lebesgue sobre $\mathbb{R}^2$) de $[0,1]\times [0,1]$ es 1 y el área del intervalo $[0,1]$ es 0, al igual que el área de $\mathbb{R}$. Es decir, la medida de Lebesgue definida sobre $\mathbb{R}$ no es la misma que la definida sobre $\mathbb{R}^2$.
     Una curva de Peano es una función continua suprayectiva que va del intervalo $[0,1]$ sobre $[0,1]^k$ para $k\leq\infty$. Las curvas de Peano no pueden ser inyectivas, pues de serlo eso significaría que $[0,1]$ y $[0,1]^k$ son homeomorfos; es decir, que como espacios se comportan igual, pero no es así, pues el cuadrado unitario $[0,1]\times [0,1]$ no tiene puntos de corte, pero el intervalo unitario $[0,1]$ sí (todos salvo los extremos). A pesar de eso, existe una biyección entre $[0,1]$ y $[0,1]\times [0,1]$, lo que significa que tienen el mismo número de elementos y sólo eso, no que como espacios sean iguales: dicha biyección no puede ni es continua, pues de serlo, como espacios serían iguales.
     Las dos observaciones anteriores lo que muestran es que cuando uno está interesado en comparar el número de elementos de dos conjuntos, uno sólo está interesado en los conjuntos sin considerar alguna estructura sobre estos, como podría ser un orden parcial, una topología, una medida, etc, pues si hemos de comparar esos conjuntos junto con sus estructuras, las funciones que hemos de considerar tienen que preservar dicha estructura: entre conjuntos ordenados las funciones tienen que preservar el orden (ser monótonas), entre espacios topológicos tienen que ser continuas, entre espacios medibles (con una medida) tienen que ser medibles, etc. Por ejemplo, hay una biyección entre el intervalo unitario y el cuadrado unitario, pero no una biyección continua con inversa continua.
     Otro concepto que podría encontrarse asociado con la noción de infinito es el de distancia: se puede hablar de distancias infinitas.
     Se ha de notar que cuando se trata de medida o distancia, una medida o distancia infinita se denota $\infty$ y cuando se trata de número de elementos infinito, se denota con los $\aleph$, pues “longitud” y “número de elementos” son conceptos distintos.


1. El texto anterior fue un mensaje que le mandé a Fermín Huerta por correo electrónico en respuesta a una entrada en su blog. No lo puse como comentario a dicha entrada debido a que Blogger sólo me deja poner comentarios de a lo más cuatro mil y cacho caracteres, y este texto tiene más de lo permitido. Fermín me pidió que publicara dicho texto. Las secciones 4 y 5 no estaban en el mensaje, pero resultan útiles para demostrar afirmaciones anteriores.
     Modifiqué un poco el texto para que cualquier lector lo pueda leer independientemente de los comentarios vertidos en la entrada mencionada.
     Me piqué con la entrada de Fermín y me entusiasmé por hablar de matemáticas en mi blog. Gracias, Fermín.