Monday, August 15, 2016

Definitud en lógica analítica de Solomon Feferman (Descanse en paz 1928-2016)

Hace unos días murió uno de los grandes en Lógica, el cual en mis aires amateur de Lógico analítico me agradaba mucho entender sus ideas, él fue Solomon Feferman, alumno de Alfred Tarski, que a sus 87 años muere pero deja una nueva manera de observar la matemática que nos dejó Gödel después de demostrar sus teoremas de incompletud que rompieron la supuesta "perfección" de la matemática y la sumergieron en un objeto "imperfecto" lleno de hoyos y preguntas sin respuesta que son los indecidibles en el lenguaje de la teoría de conjuntos que gobierna a toda la matemática, eso lo explico y demuestro en mi blog aquí Incompletud de Gödel

Hay nuevas cosas relacionadas hoy en día con un problema en lógica y conjuntos que se creía resuelto, más específico con la hipótesis del continuo, el cual es un problema en matemáticas que es indecidible, es decir no se puede demostrar con el sistema axiomático ZFC que sea verdadero o que sea falso, uno más de los hoyos en la matemática bajo este sistema axiomático que todos usamos que fue demostrado por Gödel en su teorema de incompletud que ahora es una herramienta formal que gobierna a la matemática.

Sólo para recordar rápido un ejemplo en ZF (sin C) de la hipótesis del continuo es

Sí ℵ = |ℕ| y ℑ=|ℝ| son los infinitos que corresponden a los tamaños de los conjuntos de números naturales y reales respectivamente (los cuales es bien sabido que no son iguales ya que por el teorema de Cantor Schroeder Bernstein no están en biyección y uno se puede construir como el conjunto potencia del otro) entonces NO existe un X tal que ℵ<|X|<ℑ.

Es decir, no hay un infinito estrictamente intermedio.

Esto lo explico en mi blog con más detalle aquí Infinitos grandes y chicos

En 1940 Gödel demostró que la hipótesis del continuo no era falsa.

En 1964 Cohen demuestra que la hipótesis del continuo no es verdadera.

Por lo tanto es indecidible. Es decir está demostrado usando teoría de modelos que no se puede demostrar que la hipótesis del continuo es demostrable falsa o verdadera.

Pero hay más

En 2011 Solomon Feferman encontró un argumento filosóficamente complejo en lógica analítica, en este paper se explica su teoría (Feferman) que propone una nueva teoría de "Definitud" usando un sub sistema semi intuicionista del sistema de teoría de conjuntos que usamos generalmente, el cuál es ZF, que acepte lógica clásica (donde toda proposición P tiene un valor de verdad) para operadores acotados (ej en el universo de los números reales. ∀x>0", "∃y<0", "∀x ∊ ℝ", para todo x>0, Existe y<0 , para todo x real ), y para operadores no acotados que uses lógica intuicionista (donde toda proposición no necesariamente tienen asignado un valor de verdad pero tiene una noción de pruebabilidad constructivista... Sí "pruebabilidad", es decir que se puede construir un camino lógico en el sistema axiomático de una teoría que conlleva a una demostración de su veracidad o falsedad) (ej. en teoría de conjuntos de un operador no acotado. ∀A ∅⊆A).
Feferman define que una proposición P es matemáticamente definida si el subsistema semi intuicionista puede probar P∨¬P (Es decir que existe una demostración para la proposición P o su negación).
Sólomon Feferman conjetura que la hipótesis del continuo NO está definida bajo este concepto de definitud por lo que la hipótesis del continuo está definida de manera "incompleta" y no tiene un valor de verdad. Koellner el mismo año propone que la teoría de conjuntos vista desde un sistema multiverso podría definir la hipótesis del continuo bajo la noción de Feferman.

Un documento de Hamkins define y usa los "Set Theoretic Multiverses" pero no ahondaré en ello ya que estoy en proceso de comprenderlo pero para el curioso que sepa de ultrafiltros aquí lo tiene: The Set theoretic multiverse

En este documento se demuestra la conjetura de Feferman.
https://arxiv.org/pdf/1405.4481.pdf



Solomon Feferman 1928-2016

Sunday, July 17, 2016

Algebras de endomorfismos en curvas elípticas (Parte 1 Anillos de Endomorfismos)

Hoy quiero hablar un poco de cómo analizar internamente la estructura de un grupo abeliano, lo cual lo haremos con el grupo abeliano que forma una curva elíptica.

Es decir, a veces para poder entender a un objeto, es indispensable poder entender los morfismos internos del objeto.
En este caso, lo que quiero es poder estudiar al grupo abeliano como un "espacio vectorial" y estudiar las transformaciones que hay en él... y pues con esto podemos incluso hablar de matrices, determinantes, trazas, polinomios característicos y valores propios.

Pero primero en esta parte, le daremos estructura de anillo a los homomorfismos de la curva en si misma, y en la siguiente parte de este post le daremos ya estructura de álgebra.

Recordando muy informalmente curvas elípticas

Recordemos rápidamente el contexto deseado, que son la curvas elípticas de una manera muy informal ya que he hablado antes de esto aquí en mi blog (busca keyword "elíptica").

Las curvas elípticas son objetos muy usados en criptografía ya que proveen con su estructura geométrica una manera diferente de "sumar y restar" que al ésta ser sustituida en los algoritmos de llave pública como Diffie-Hellman que es el más usado en todas las telecomunicaciones en vez de grupos finitos (enteros módulo un número primo usualmente) resulta muy rápido y más seguro. Un ejemplo intuitivo de cómo funciona esta suma es el siguiente:




Lo que estamos viendo aquí es una curva $latex E$ en azul, y dos puntos en ella que son $latex P,Q\in E$ , que su suma está definida como la proyección con el eje $latex x$ del tercer punto de intersección de la linea que los une, que en este dibujo está denotado como $latex P+Q$.

Siempre habrá este tercer punto de intersección si la curva es vista de manera proyectiva, lo cual veremos en la siguiente sección y es justificado por el teorema de Bézout.

Si quisieras calcular el punto $latex P+P$ se hace de manera parecida, sólo que la linea a considerar es la tangente a $latex P$ en la curva $latex E$.

El negativo de un punto es sólo su proyección con el eje $latex x$ es decir si $latex (x,y)\in E$ entonces $latex -(x,y)=(x,-y)$, y sumar $latex P+ (-P)=\infty$ , donde este $latex \infty$ será explicado en la siguiente sección y este $latex \infty$ nos funcionará como el cero (identidad) en la estructura de grupo abeliano que tiene la curva.

Bajo esta operación tenemos que la curva $latex E$ y sus puntos forman un grupo abeliano, es decir, con sus puntos bajo esta operación ya explicada es conmutativa, cada elemento tiene un inverso, es asociativa y cerrada, y lo más importante... es algebraica... es decir,  hay fórmulas explícitas que no necesitan funciones raras para definirlas (como raíces cuadradas, logaritmos ni nada).

Entrando un poco más en lo que significa "algebraico" es que su suma se puede definir con simples cocientes de polinomios, a eso me refiero con que algo sea "algebraico", y más allá de ser una curva, esto se le llama variedad abeliana, que es un objeto algebraico dotado de una estructura de grupo con una operación continua bajo cierta topología (Zariski), y que está dada por polinomios cuya operación explícita puede ser vista aquí en wikipedia.

Puedes notar que también puedes calcular "$latex n$ veces el punto $latex P$ , es decir $latex P+P+\ldots +P$  ($latex n$ veces) para todo $latex n\in \mathbb{Z}$ , por lo que significa que podemos "hacer actuar a los enteros en la curva", esto es lo que se le conoce como un $latex \mathbb{Z}$-módulo, y todo grupo abeliano, tiene esta capacidad, por más abstracto que sea el grupo, siempre se puede hablar de "$latex n$ veces aplicar la operación + del gropo".

La definición formal es que son curvas suaves proyectivas de género 1 con un punto distinguido.

Suaves significa que son diferenciables en todos lados y no hay puntos dobles o nodales por ejemplo dos que cumplen la definición vistas en $latex \mathbb{R}\times\mathbb{R}$ serían:


Espacio proyectivo.

Aquí justificamos este símbolo $latex \infty$.
Proyectivo significa que en vez de vivir en espacios vectoriales usales como $latex \mathbb{R}^n$ o $latex \mathbb{F}_{q}$ , vive en un nuevo espacio que ahora definiremos que es $latex \mathbb{P}^n_\mathbb{R}$ o en  $latex \mathbb{P}^n_{\mathbb{F}_q}$ respectivamente, donde estos espacios incluyen un punto nuevo, que es el infinito y múltiplos de vectores serán identificadas con un sólo punto.

Este espacio proyectivo lo tengo bien explicado aquí pero a grandes rasgos es un espacio en el cual identificamos todos los múltiplos de un punto como el mismo punto, imaginen un espacio vectorial, donde un vector $latex v$ al aumentar su magnitud por una constante $latex c\neq 0 \in \mathbb{R}$ tenemos que el nuevo vector sería $latex c \cdot v$. Aquí , tenemos que por ejemplo en $latex \mathbb{R}^n$ los puntos $latex v$ y $latex c \cdot v$ serán identificados con el mismo vector, es decir es como una contracción y a este nuevo espacio con esta nueva regla lo denotamos como  $latex \mathbb{P}^n_\mathbb{R}$.

El punto $latex [0:0:0]$ no existe, lo cual es una consecuencia de las reglas que acabo de definir, por lo que al interesado en álgebra le serviría la definición que es:  $latex \mathbb{P}^n_\mathbb{R}:=\mathbb{R}^{n+1}\setminus \lbrace \overline{0} \rbrace /\sim$ donde la relación $latex \sim$ es que si $latex \overline{u},\overline{v}\in \mathbb{R}^{n+1}$ entonces $latex \overline{u}\sim \overline{v}$ sí y sólo sí $latex \overline{u} = \lambda \overline{v}$ donde $latex \lambda\in \mathbb{R}^{*}$ , es decir esto nos colapsa toda una familia de puntos en $latex \mathbb{R}^{n+1}$ a un sólo punto que denotaremos como $latex [u] \in \mathbb{P}^n_\mathbb{R}$ y tenemos que en este caso $latex [u]=[v]$.


Y de hecho las ecuaciones proyectivas de los ejemplos anteriores serían la ecuación homogénea que hace que los grados de todos los monomios sean iguales $latex y^2z=x^3-xz^2$  así como $latex y^2z=x^3-xz^2 + z^3$ donde ahora vemos que tiene otra variable $latex z$ que nos permitirá agregar otra familia de puntos, por ejemplo, los puntos de la ecuación afín serían los puntos de la forma $latex [x:y:1]$ pero también tenemos que la ecuación también tiene el punto $latex [0:1:0]$  que será el punto racional distinguido, y todas las ecuaciones cúbicas de esta forma lo contienen.


También agregamos un punto muy especial como ya vimos que es usualmente $latex \infty:=[0:1:0]$ que es muy usado en el modelo matemático de lo que significa dibujar "horizontes" en un paisaje, y observando que unas vías del tren no son paralelas, ya que se tocan en el infinito, como lo pueden ver aquí.




Y bueno una curva elíptica de género 1 sin puntos raros, siempre es transformable a una ecuación de la forma $latex y^2 = x^3 + ax+b$ mediante sustitución de variables, a esta forma se le llama forma de Weierstrass.

Género de una curva

El género es un poco más difícil de explicar en este post y con esta informalidad, pero imaginen que tiene que ver con que si la ecuación de la curva la vemos en el espacio complejo... su gráfica será una dona con 1 hoyo... si fueran dos hoyos tendría género 2, por lo que una curva elíptica tiene género 1 y se ve así  "intuitivamente" como una función compleja:







A mi me gusta mucho el álgebra así que podemos calcular de hecho géneros de maneras más abstractas gracias aun teorema muy interesante, de Riemann-Roch, que nos dice el género de un objeto geométrico con la dimensión de ciertos espacios de funciones el cual tengo explicado de manera formal aquí.

Estoy trabajando en mi mente un artículo para explicar el teorema de Riemann-Roch sin necesitar álgebra tan dura, con pura teoría de espacios vectoriales, espero pronto tenerlo.

El género cuando no hay puntos raros en la ecuación, se puede calcular con los grados de los monomios en una ecuación.


En términos criptográficos, recuerden que hasta ahora las computadoras no saben cómo manejar a los números reales (ni complejos), de manera continua, es decir, cuando ustedes programan un "float" o "double" sabemos que tienen un "límite" en su representación, por lo que realmente la computadora sólo sabe manejar estructuras finitas.

Estructura finita asociada a las curvas para poder usada en criptografía y computación.

Algo interesante de las curvas elípticas es que su estructura de grupo funciona en cualquier campo... no sólo en los números reales, los complejos o los racionales que son infinitos... sino en campos finitos, como son los enteros módulo p.

De manera básica y para no entrar en detalles tenemos que si escogemos cualquier número primo $latex p$ , tenemos que si $latex a,b\in \mathbb{Z}$ podemos calcular que $latex a\cdot b\equiv c \bmod p$  donde $latex c$ será solamente el residuo de la división al calcular $latex a\cdot b/p $ , este residuo está entre el 0 y $latex p-1$, y todo entero se puede reducir módulo $latex p$ de la misma forma (dividiendo entre $latex p$ y calculando su residuo), este conjunto donde juntas a todos los elementos reducidos en sus respectivas clases se denota como $latex \mathbb{F}_p$ y consta de $latex p$ elementos, del 0 al $latex p-1$.


La suma se define de manera similar y todo elemento tiene un inverso multiplicativo y aditivo, es decir para todo $latex [a]\in \mathbb{F}_p$ tenemos que existe un $latex [a]^{-1}\in \mathbb{F}_p$ tal que $latex [a]\cdot [a]^{-1} = [1]$  , por ejemplo en $latex \mathbb{F}_7$ tenemos que el inverso  multiplicativo de $latex [3]$ es $latex [5]$ ya que $latex 5\cdot 3=15$ y $latex 15\equiv 1\bmod 7$ por lo que podemos decir abusando de la notación que "dividir entre $latex [3]$" módulo $latex 7$ equivale a multiplicar por $latex [5]$.
Con la suma el negativo de $latex [a]\in \mathbb{F}_p$ es de hecho $latex [p-1]\cdot [a]$ ya que $latex (p-1)\cdot a = pa-a \equiv -a \bmod p$ , por ejemplo en $latex \mathbb{F}_7$ tenemos que $latex -[3]= (p-1)\cdot 3 = 6\cdot 3 = 18 \equiv 4 \bmod 7$ , por lo que $latex -[3] \equiv [4]$ y es fácil verificarlo ya que al sumar con su inverso aditivo al 3 tenemos que $latex -[3] + [3] = [4] + [3] \equiv 0 \bmod 7$ (ya que no deja residuo).

Se pueden definir campos para cada potencia de $latex p$ es decir $latex \mathbb{F}_{p^n}$ pero eso queda de tarea para ustedes investigar cómo se hace.

Con esto tenemos que si evaluamos todas las posibles soluciones de una curva elíptica bajo esta aritmética, tenemos que ya no se ve como una "curva", pero realmente lo es en el sentido algebraico, y se ve por ejemplo $latex y^2=x^3 - 4x+6$ sobre $latex \mathbb{F}_{197}$ así:



Si implementan la regla de adición como en wikipedia, donde las divisiones que vean en las funciones que definen la suma de dos puntos las interpretan como "calcular el inverso multiplicativo" (lo cual se hace con el algoritmo de euclides extendido), una consecuencia del teorema fundamental del álgebra les dirán que las "lineas entre dos puntos" en aritmética modular también funcionan, esto es de manera informal pero sólo quiero meter la idea, en posts anteriores formalizo esto.



Grupos de homomorfismos en grupos abelianos (curvas elípticas en este caso)

Recordemos que un homomorfismo entre dos grupos (o dos curvas) $latex G_1$ y $latex G_2$ es un mapeo que respeta la estructura de grupo en cada uno. Es decir si $latex \langle G_1,+\rangle$ y $latex \langle G_2,\oplus\rangle$ son sus respectivas operaciones. tenemos que $latex \alpha \in Hom(G_1,G_2)$ es un homomorfismo entre $latex G_1$ y $latex G_2$ , es decir  $latex \alpha:G_1\rightarrow G_2$ si para $latex P,Q\in G_1$

$latex \alpha(P+Q)=\alpha(P)\oplus \alpha(Q)$

También tenemos que $latex \alpha$ también manda infinitos de un grupo a infinitos del otro.

 $latex \alpha(\infty_{G_1})=\infty_{G_2}$.


Algo muy interesante es que el conjunto de todos los homomorfismos, es decir $latex Hom(G_1,G_2)$ forma un grupo abeliano, es decir, puedes sumar los homomorfismos, noten que ya no estamos hablando de los puntos de la curva solamente o de elementos de grupos en general, es decir si $latex \alpha,\beta\in Hom(G_1,G_2)$ definimos bajo la operación nueva de homomorfismos $latex \boxplus$ una nueva función $latex \alpha\boxplus \beta\in Hom(G_1,G_2)$ :

$latex (\alpha\boxplus\beta):G_1\rightarrow G_2$
$latex P\mapsto \alpha(P)\oplus \beta(P)$

Es fácil demostrar que $latex \alpha\boxplus \beta$ también respeta estructura de grupo en $latex G_2$ (es decir que es un homomorfismo) , y pues tenemos que la identidad es el morfismo $latex [0]\in Hom(G_1,G_2)$ que manda todo al 0 del grupo $latex G_2$.
También para que $latex Hom(G_1,G_2)$ sea grupo bajo la operación $latex \boxplus$, necesitamos un inverso, es decir, si $latex \alpha\in Hom(G_1,G_2)$ existe un $latex -\alpha \in Hom(G_1,G_2)$ y de hecho pueden ver que este es simplemente $latex -\alpha:G_1\rightarrow G_2$ que mapea $latex P\mapsto \alpha(-P)$ por lo que $latex \alpha\boxplus -\alpha$ está definido como $latex (x,y)\mapsto \alpha(x,y)\oplus \alpha(x,-y)$ y esto y si $latex \alpha(P)=Q\in G_2$ tenemos que es igual a $latex Q\oplus -Q=\infty_{G_2}$ , por lo que mapea al cero de $latex G_2$ y $latex (\alpha\boxplus -\alpha)(P)=\infty_{G_2}$ para todo $latex P\in G_1$ por lo que $latex \alpha\boxplus -\alpha=[0]\in Hom(G_1,G_2)$.

De manera similar se puede demostrar que $latex \boxplus$ es asociativa,  por lo que $latex Hom(G_1,G_2)$ es un grupo.

También como mencionamos hace rato, todo grupo abeliano tiene estructura de $latex \mathbb{Z}$ módulo... es decir, en este ejemplo podemos hablar de aplicar en $latex Hom(G_1,G_2)$ la operación $latex \boxplus$ varias veces a sus elementos, (en este caso homomorfismos entre los dos grupos) es decir $latex n\alpha$ simplemente será:

$latex n\alpha:G_1\mapsto G_2$
$latex P\mapsto \alpha(P)\oplus\ldots \oplus \alpha(P)=\bigoplus_{k=1}^{n} \alpha(P)$

Por lo que decimos que $latex Hom(G_1,G_2)$ tiene estructura de $latex \mathbb{Z}$ módulo.

Anillos de Endomorfismos entre grupos abelianos.

Este es un caso especial de $latex Hom(G_1,G_2)$ , ahora imaginen que $latex G_1=G_2$ por o que lo denotaremos simplemente por $latex G$ , y vamos a definir que $latex End(G):=Hom(G,G)$ pero adicionalmente para que sea un anillo tenemos que la operación multiplicación de endomorfismos $latex \alpha,\beta\in End(G)$ es  $latex \alpha\circ \beta$ , es decir la composición entre ellos como funciones, es decir $latex (\alpha\circ\beta)(P)=\alpha(\beta(P))$.

Como tenemos que $latex \alpha,\beta Hom(G,G)$ está bien definido $latex \alpha\circ \beta:G\rightarrow G$.

La identidad bajo esta multiplicación es la función identidad , es decir, la que manda un punto a sí mismo, y la denotamos como $latex [1]\in End(G)$.

Ustedes pueden verificar que la operación $latex \circ$ es distributiva con $latex \boxplus$ , es decir que si $latex \alpha,\beta,\gamma\in End(G)$ y $latex P\in G$:

$latex (((\alpha\boxplus\beta)\circ \gamma)(P)=((\alpha\circ \gamma)\boxplus (\beta\circ \gamma))(P)$

y usando que $latex \gamma$ también es in homomorfismo.

$latex (\gamma\circ(\alpha\boxplus \beta))(P)=((\gamma\circ \alpha)\boxplus (\gamma\circ\beta))(P)$

Es fácil ver que por default, en $latex End(G)$ hay una infinidad de endomorfismos, de hecho para toda $latex n\in \mathbb{Z}$ tenemos el mapeo $latex [n]\in End(G)$ el cual definimos como:

$latex [n]:G\mapsto G$
$latex P\mapsto P+\ldots +P$  (n veces)

Donde $latex +$ es la operación del grupo $latex G$

Entonces es fácil ver que de hecho, en un nivel más alto hay otro homomorfismo de anillos entre los enteros y $latex End(G)$ , es decir:

$latex \Psi:\mathbb{Z}\rightarrow End(G)$
$latex n\mapsto [n]$

Y es homomorfismo ya que es fácil verificar que $latex \Psi(n+m)=\Psi(n)\oplus \Psi(m) = [n] \boxplus [m]=[n+m]$ y respeta la estructura de anillo ya que $latex \Psi(n\cdot m)=[n]\circ[m]=[nm]$.

Con esto tenemos mucho para argumentar que $latex \mathbb{Z}$ es un subanillo de $latex End(G)$ ya que $latex End(G)$ no tiene torsión, es decir, el aplicar $latex n$ veces cualquier endomorfismo diferente de $latex [0]$ , nunca nos dará $latex [0]$ y el mapeo entre $latex \mathbb{Z}$ y $latex End(G)$ es inyectivo.

Otra cosa es que $latex [n]\circ \alpha = \alpha \circ [n]$ es decir conmuta, y ustedes lo pueden demostrar fácilmente (pero no siempre es así entre cualquiera $latex \alpha,\beta\in End(G)$, que es cuando en el siguiente post definiremos que $latex End(G)$ está equipado con multiplicación compleja.

En el caso en que se esté trabajando sobre un campo finito en el grupo de una curva elíptica $latex E$ como $latex \mathbb{F}_q$ existe otro endomorfismo muy famoso que es usado mucho en investigación en criptografía , que es el endomorfismo de Frobenius, $latex \phi\in End(E)$ que equivale a $latex (x,y)\mapsto (x^q,y^q)$ , es decir, elevar a la $latex q$ cada coordenada de un punto en la curva usando la reducción en el campo finito $latex \mathbb{F}_q$. Este homomorfismo también conmuta.

Otro remark es que en una curva elíptica $latex \alpha,\beta\in End(E)$ son suprayectivos y por consecuencia $latex \alpha\circ\beta$ también lo es, por lo que jamás será el homomorfismo $latex [0]$ , esto nos dice que bajo la multiplicación del anillo $latex End(E)$ dada por la composición, nunca obtenemos el $latex [0]\in End(E)$ por lo que no existen múltiplos de 0, y $latex End(E)$ es un dominio entero, por lo que pueden usar las reglas de cancelación usuales entre sus elementos tanto por la izquierda como por la derecha.


Espero les haya gustado, la parte 2 la haré pronto, donde extenderemos la estructura de $latex \mathbb{Z}$-módulo de $latex End(E)$ a un $latex \mathbb{Q}$-módulo a través de un tensor.

Eduardo Ruíz Duarte (beck)
twitter: @toorandom



Sunday, April 17, 2016

Parametrización racional de curvas con teoría de Galois

El siguiente teorema me parece que es de las cosas más importantes en álgebra, y es debido a David Hilbert e hizo nacer la teoría de Kummer, pero en eso no entraremos.

Veremos cómo encontrar puntos racionales del círculo geométricamente y cómo hacerlo puramente algebraico.

El teorema se puede explicar con un poco de teoría algebraica de números y teoría de Galois, lo que trataré de resumir en el contexto de este teorema sólo para poder entenderlo de manera informal.

Nota importante:
Si no entienden el siguiente teorema, no importa, no se asusten ni dejen de leer los interesados, todo este post será dedicado a explorar cada concepto, hablaremos un poco de teoría de Galois, de Normas, Trazas y extensiones de campos, y veremos que este teorema inofensivo nos ayudará con muchos problemas geométricos.

Teorema 90 (David Hilbert)
Sea $latex L/K$ una extensión de campos cuyo grupo de Galois  $latex G:=Gal(L/K)=Aut_{K}(L) =\langle \sigma \rangle$ es cíclico y si $latex x\in L$ tiene norma $latex 1$, es decir $latex N_{L/K}(x)=1$ , entonces existe $latex y\in L$ con $latex x = \frac{\sigma(y)}{y}$

Seguramente hay muchas dudas, ¿por qué es tan importante?, vamos a analizar un problema, que es el de encontrar puntos con coordenadas racionales en una circunferencia, es decir con coordenadas $latex (\frac{a}{b},\frac{c}{d})$ con $latex a,b,c,d\in \mathbb{Z}$

Ejemplo para motivación 

Todos sabemos que la parametrización de una circunferencia de radio 1 está dada por los puntos $latex (cos(\theta),sen(\theta) )$ con un parámetro $latex \theta$, ya que tenemos el teorema de Pitágoras que nos dice en este contexto que $latex cos^2(\theta) + sen^2(\theta)=1$ es decir, el coseno es el lado en $latex x$ y el seno el lado en $latex y$ de todos los posibles triángulos rectos cuyo ángulo en el origen es $latex \theta$ con hipotenusa $latex 1$ forma una familia infinita de triángulos que está parametrizada por una sóla variable $latex \theta$, por lo que decimos que la circunferencia es un objeto geométrico de dimensión 1.

 Las coordenadas $latex (cos(\theta),sen(\theta))$ justamente por la hipotenusa estar fijada a 1, formarían todos los puntos de una circunferencia de radio 1.

Es decir, el círculo está definido justamente por triángulos de hipotenusa 1 (en rojo), con su lado en la base $latex x=cos(\theta)$  y en su altura $latex y=sen(\theta)$ por lo que es el conjunto de puntos en el plano tal que $latex x^2 + y^2 = 1$.


Ahora, pero como algebrista, a mi me interesan los puntos racionales de esa circunferencia, es decir, todos los puntos cuyas coordenadas son puntos racionales, es decir cuando los puntos del círculo
$latex (x,y) \in\mathbb{Q}\times\mathbb{Q}$, queremos excluir puntos como $latex (\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}})$  o $latex (\frac{\sqrt{3}}{2},\frac{1}{2})$  que respectivamente corresponden cuando el ángulo del eje $latex x$ y la hipotenusa es $latex 45^{o}=\frac{\pi}{4}$ y $latex 30^{o}=\frac{\pi}{6}$ que claramente pertenecen al círculo pero tienen componentes irracionales.

Si queremos localizar puntos racionales, primero nos aseguramos de conocer un punto racional (por ejemplo el $latex (-1,0)$ ,  después construimos la recta que pasa por $latex (-1,0)$ y un punto en general $latex (x,y)$, es decir, vamos a variar la pendiente $latex t$ de la recta que pasa por $latex (-1,0)$ , al final, al tener este haz de rectas parametrizadas por su pendiente $latex t$  para todo $latex t \in \mathbb{Q}$ vamos a intersectar esta recta con el círculo y ver qué nos da, es decir, vamos a buscar todas las intersecciones de las rectas fijadas en un punto racional del círculo y con pendiente racional, a ver si de pura coincidencia nos da un punto racional del círculo. 

La idea visual es ésta:



La recta que pasa por $latex (-1,0)$ y con pendiente parametrizada por $latex t$ está dada entonces por $latex y = t(x+1)$ , es fácil ver que esta familia de rectas para todo $latex t\in\mathbb{Q}$ son las rectas verdes en el dibujo de arriba que pasan con $latex (-1,0)$

Por otro lado, tenemos que como explicamos anteriormente, la ecuación del círculo algebraica está dada por todos los puntos $latex (x,y)$ cuya suma de sus cuadrados nos da una hipotenusa de tamaño 1, es decir $latex x^2 + y^2 = 1$.

Con esto, vamos a introducir la familia de rectas paramétrizadas por la pendiente dentro del círculo, sí, esto es que si las rectas son $latex y=t(x+1)$ entonces $latex y^2 = (t(x+1))^2$ , y si intersectamos este conjunto de soluciones en el plano con el conjunto de soluciones en el círculos nos queda $latex x^2 + t^2(x+1)^2 = 1$  que es una ecuación cuadrática, y de hecho representa explícitamente al polinomio $latex (t^2 + 1)x^2 + 2t^2x+t^2-1$.

Tenemos que este polinomio tiene como raíces a la $latex x=-1$ que ya conociamos, y también a $latex x=\frac{1-t^2}{1+t^2}$ lo cual suena ya interesante.

En otras palabras, el haz de rectas choca con el círculo en $latex x=-1$ y en $latex x= \frac{1-t^2}{1+t^2}$.

Vamos a despejar la $latex y$ en la familia de rectas dada esta nueva $latex x=\frac{1-t^2}{1+t^2}$ que obtuvimos al intersectar con el círculo y obtenemos $latex y=\frac{2t}{1+t^2}$, con esto tenemos que estas dos ecuaciones como son parte del círculo y una recta racional, pues nos dieron por suerte una función racional, por lo que  la ecuación del círculo funciona con estas soluciones, $latex \Big (\frac{1-t^2}{1+t^2}\big)^2 + \Big(\frac{2t}{1+t^2}\big)^2=1$ que es fácil verificar, y tenemos una nueva parametrización con números racionales del círculo, dada por todos los puntos $latex \Big(\frac{1-t^2}{1+t^2},\frac{2t}{1+t^2}\Big)\in \mathbb{Q}\times\mathbb{Q}$ con $latex t\in\mathbb{Q}$.


¿Qué tiene que ver este ejemplo con el Teorema 90?

Vamos a contextualizar el ejemplo con las hipótesis, y ver ¿cuándo podemos parametrizar con funciones racionales? , ya que no siempre se puede hacer esto, el Teorema 90 de Hilbert nos puede decir en qué casos conviene buscar esta parametrización, y en qué caso, simplemente... no existe de manera natural (a veces existe con otras funciones modulares, o en otros espacios).

Para ello necesitamos un poco de teoría.


Embarrada de Teoría de Galois en este contexto y grupo Gal(L/K)


Vamos a describir unos ejemplos, y definiciones, sin rigor, sólo queremos por ahora entender lo que nos dice el teorema 90 de Hilbert.

Tenemos que el campo en el que trabajamos es el de los racionales $latex \mathbb{Q}$ , vamos a extenderlo a que incluya el nuevo entero algebraico $latex i$ donde $latex i^2 = -1$, por lo que tenemos.

$latex \mathbb{Q}(i) = \lbrace a+ib : x,y\in\mathbb{Q} \rbrace$

Este como pueden observar es un espacio vectorial sobre $latex \mathbb{Q}$ , son los números complejos racionales.

Vamos a ver qué es una extensión de campos pero antes una nota de cómo construir este espacio algebraicamente, ya que de esto se trata esto... de álgebra, después entraremos a la parte de extensiones de campos y teoría de Galois.

Nota de construcción algebraica de $latex \mathbb{Q}(i)$ para interesados, si no te interesa puedes omitir este párrafo: 
Decimos que $latex i \in \mathbb{Q}(i)$ es un entero algebraico sobre $latex \mathbb{Q}$ ya que podemos construir este nuevo campo tomando el anillo de polinomios con coeficientes en $latex \mathbb{Q}$ módulo el ideal máximo generado por el polinomio irreducible con coeficientes en $latex \mathbb{Q}$ que tiene como raíz a $latex i$ , y esto es:  $latex \mathbb{Q}(i) = \mathbb{Q}[X]/\langle X^2 + 1 \rangle = \lbrace a+bX : X^2 + 1 = 0\rbrace$.
La última construcción simplemente por el hecho de que $latex \mathbb{Q}[X]$ es un anillo (dominio euclídeo) , podemos usar el algoritmo de la división (como en la prepa la división sintética) y sólo dice que $latex \mathbb{Q}[X]/\langle X^2 + 1 \rangle$ son todos los polinomios en una variable módulo $latex X^2 + 1$ , lo que significa que todos los de la forma $latex g(X)(X^2 + 1)\equiv 0 \bmod X^2 + 1$,  y como es un dominio entero si $latex g(X)\neq 0$ entonces eso implica que $latex X^2 = -1$ por lo que la variable $latex X$ en esta construcción actúa como la $latex i$ imaginaria, y así se construyen los números complejos algebraicamente.

Tenemos que la extensión de campos $latex \mathbb{Q}(i)/\mathbb{Q}$ como su construcción depende de un polinomio de grado 2 como lo hicimos anteriormente (no se puede con grado 1 ya que el campo resultante sería $latex \mathbb{Q}$ ) es un espacio vectorial de dimensión 2 con base $latex \lbrace 1,i \rbrace$.

Esta extensión $latex \mathbb{Q}(i)/\mathbb{Q}$ es normal lo que quiere decir que todos los polinomios irreducibles con coeficientes en el campo chico, es decir $latex \mathbb{Q}[X]$ que tienen alguna raiz en $latex \mathbb{Q}(i)$ entonces tienen todas ahí, en este caso es fácil, ya que si un polinomio cuadrático lo puedes factorizar, entonces lo puedes factorizar con factores lineales.

Un antiejemplo de extensión normal sería $latex \mathbb{Q}(\sqrt[3]{2})\cong \mathbb{Q}[X]/\langle X^3 -2 \rangle$  sobre $latex \mathbb{Q}$, ya que $latex X^3 - 2$ tiene como raíz $latex \alpha=\sqrt[3]{2}\ $ y también tiene $latex \alpha\omega$ donde $latex \omega = e^{\frac{2\pi i}{3}}$  y pues $latex \omega \notin \mathbb{Q}(\sqrt[3]{2})$.

Regresando a $latex \mathbb{Q}(i)/\mathbb{Q}$  donde aparte de ser una extensión normal tenemos que también es una extensión separable, lo que significa que para todo $latex \beta \in \mathbb{Q}(i)$ tenemos que el polinomio de grado mínimo de $latex \beta$ sobre $latex \mathbb{Q}$,  $latex f(X)$   (es decir tal que $latex f(\beta)=0$) , tiene raíces diferentes.

Un antiejemplo de un polinomio separable sería el polinomio $latex X^3 - 2 \in \mathbb{F}_3[X]$ (con coeficientes en el campo finito de 3 elementos), ya que   $latex X^3 - 2=(X+1)^3$ en ese campo, por lo que tiene una raíz triple.

Es fácil demostrar formalmente ya con estas observaciones que $latex \mathbb{Q}(i)/\mathbb{Q}$ es una extensión de campos separable y normal , por lo que decimos que la extensión es Galois.

Estas extensiones $latex L/K$ se les puede asociar un grupo , que es el Grupo de Galois, este grupo está formado por todos los Automorfismos de $latex L$, (isomorfismos de $latex \psi:L\rightarrow L$) tal que dejan a $latex K$ fijo, es decir, que $latex \psi(K)=K$, cuya operación naturalmente es la composición de funciones, el hecho de considerar que fijen a $latex K$ sirve para tomar los automorfismos interesantes, es decir, que nos permitan estudiar a $latex L$ con respecto a $latex K$.

Este grupo mide la simetría de la extensión de campos, y de hecho el numero de elementos en el grupo de Galois, está acotado por $latex [L:K]!$ es decir, por el factorial del grado de la extensión (el caso de extensión de grado infinito existe, como por ejemplo $latex \bar{\mathbb{Q}}/\mathbb{Q}$, y obviamente es un resultado diferente pero no lo necesitamos aquí)

En el caso de  $latex \mathbb{Q}(i)/\mathbb{Q}$  tenemos que el grado de la extensión es 2, y lo denotamos por $latex [\mathbb{Q}(i):\mathbb{Q}]=2$ (hay teoremas que te dicen cómo acotar también por el grado del polinomio mínimo, en este caso el polinomio mínimo de $latex i$ tiene grado 2) por lo que $latex |Gal(\mathbb{Q}(i)/\mathbb{Q})|=2$.

De hecho, tenemos que $latex id\in Gal(\mathbb{Q}(i)/\mathbb{Q})$ por lo que ya tenemos un elemento de este grupo de Galois, ya que la identidad es un automorfismo.

El otro elemento es un $latex \psi:\mathbb{Q}(i)\rightarrow \mathbb{Q}(i)$ tal que si $latex z=a+bi\in \mathbb{Q}(i)$ entonces $latex \psi(z)=\psi(a)+\psi(bi)=a+b\psi(i)$ ya que $latex a,b\in\mathbb{Q}$ y $latex \psi$ es un automorfismo, y como mencionamos anteriormente $latex \psi(\mathbb{Q})=\mathbb{Q}$.

Por otro lado tenemos que $latex i^2 = -1$ por lo que $latex \psi(-1)=\psi(i^2)=\psi(i)\psi(i)=\psi^{2}(i)=-1$, esto implica que $latex \psi(i)=\pm i$ , ya que $latex (-i)(-i)=-1$ y $latex (i)(i)=-1$ .

Para la opción de $latex \psi$ tal que $latex \psi(i)=id(i)=i$ tenemos ya a la identidad, pero la otra opción $latex \psi(i)=-i$ tenemos ya el otro automorfismo, que es la conjugación por lo que.

$latex Gal(\mathbb{Q}(i)/\mathbb{Q})=\lbrace id,\psi \rbrace$.

Y como es un grupo de grado primo (2) , es cíclico, es decir está generado por 1 sólo elemento, en este caso la conjugación, ya que $latex \psi \circ \psi = id$ 

Normas y trazas 
  
Para terminar de entender el Teorema 90 nos hace falta lo que es la norma.
Esto ya lo expliqué en otro post en mi blog aquí, pero doy un resumen en este contexto.

Lo que queremos es definir una manera de poder medir a los elementos de un campo $latex L$ con respecto a un valor en $latex K$ para una extensión de campos $latex L/K$

Considera la extensión $latex L/K$ y define los siguientes $latex K$-endomorfismos de $latex L\rightarrow L$ para todo elemento $latex \alpha \in L$

$latex \mu_\alpha : L\rightarrow L$
$latex z \mapsto \alpha z$

Es decir, es sólo multiplicar cualquier elemento $latex z\in L$ por $latex \alpha \in L$ , lo cual claramente es $latex K-$lineal, es decir $latex \mu_\alpha(z_1+z_2)=\mu_\alpha(z_1)+\mu_\alpha(z_2)$, por lo que le podemos asociar una matriz a $latex \mu_\alpha$, y tenemos entonces que la norma de $latex x\in L$ es:

$latex N_{L/K}(x) = det(\mu_x) \in K$
$latex Tr_{L/K}(x) = Tr(\mu_x) \in K$

Es claro que $latex N_{L/K}(xy)=N_{L/K}(x)N_{L/K}(y)$ y $latex Tr_{L/K}(x+y)=Tr_{L/K}(x)+Tr_{L/K}(y)$ por propiedades de determinantes.

Ejemplo. en $latex \mathbb{Q}(\sqrt{2})/\mathbb{Q}$

Sea $latex \mathbb{Q}(\sqrt{2})/\mathbb{Q}$ , y como espacios vectoriales fijemos la base $latex \lbrace 1, \sqrt{2} \rbrace$, entonces tenemos que si $latex \alpha=a+b\sqrt{2}\in \mathbb{Q}(\sqrt{2})$ entonces tenemos que las columnas de la matrix definida por la multiplicación por $latex \alpha$ , es decir la matriz asociada a $latex \mu_\alpha$ la podemos armar evaluando en los elementos de la base: 

$latex \mu_\alpha(1) = a+b\sqrt{2}$
$latex \mu_\alpha(\sqrt{2}) = 2b+ a\sqrt{2}$

Por lo que:

$latex \mu_\alpha = \mu^{*}_\alpha = \begin{pmatrix} a &2b \\ b & a \end{pmatrix}$

Es fácil ver que si para $latex \alpha=a+b\sqrt{2}\in \mathbb{Q}(\sqrt{2})$ multiplicamos la matriz $latex \mu^{*}_\alpha$ por cualquier elemento $latex x+y\sqrt{2}\in \mathbb{Q}(\sqrt{2})$ nos da el mapeo de multiplicación por $latex \alpha$, $latex \mu_\alpha$

Es decir:

$latex \mu^{*}_\alpha \begin{pmatrix}x \\ y\end{pmatrix} = \begin{pmatrix} a &2b \\ b & a \end{pmatrix}\begin{pmatrix}x \\ y\end{pmatrix}=(ax+2by,bx+ay)$

El cual un cálculo rápido verifica que es lo mismo que esta matriz es lo mismo que el mapeo:

$latex \mu_\alpha(x+y\sqrt{2}) = \alpha(x+y\sqrt{2})=(a+b\sqrt{2})(x+y\sqrt{2}) =ax + 2by + (bx+ay)\sqrt{2}$ 

Por lo que tenemos que la norma y traza de $latex \alpha=a+b\sqrt{2}\in \mathbb{Q}(\sqrt{2})$ es:

$latex N_{\mathbb{Q}(\sqrt{2})/\mathbb{Q})}(\alpha)=det(\mu^{*}_\alpha)=a^2-2b^2$
$latex Tr_{\mathbb{Q}(\sqrt{2})/\mathbb{Q})}(\alpha)=Tr(\mu^{*}_\alpha)=2a$


Ejemplo. en $latex \mathbb{Q}(i)/\mathbb{Q}$

No vamos a hacer el detalle aquí , pero tenemos que si usamos la base de $latex \mathbb{Q}(i)/\mathbb{Q}$ dada por $latex \lbrace 1,i \rbrace$ tenemos que para $latex \alpha=a+bi$ la matriz de la multiplicación por $latex \alpha$ 

$latex \mu_{\alpha}:\mathbb{Q}(i) \rightarrow \mathbb{Q}$
$latex z \mapsto \alpha z$

Por lo que las columnas generadas por $latex \mu_\alpha(1)=a+bi$ y $latex \mu_\alpha(i)=-b+ai$

por lo que 

$latex \mu^{*}_\alpha = \begin{pmatrix}a&-b\\b & a\end{pmatrix}$

Por lo que:


$latex N_{\mathbb{Q}(i)/\mathbb{Q})}(\alpha)=det(\mu^{*}_\alpha)=a^2+b^2$
$latex Tr_{\mathbb{Q}(i)/\mathbb{Q})}(\alpha)=Tr(\mu^{*}_\alpha)=2a$

Puedes notar que esta última norma, es la misma norma que utilizas en $latex \mathbb{C}$ , así es como formalmente se construyen las normas algebraicamente.

Todo listo para El teorema 90 de Hilbert y el ejemplo de la parametrización racional de la circunferencia.

Vamos a volver a enunciar el teorema y luego el corolario del ejemplo de parametrización con todos los ejemplos y lo anterior ya desarrollado.


Teorema 90 (David Hilbert)
Sea $latex L/K$ una extensión de campos cuyo grupo de Galois  $latex G:=Gal(L/K)=Aut_{K}(L) =\langle \sigma \rangle$ es cíclico y si $latex x\in L$ tiene norma $latex 1$, es decir $latex N_{L/K}(x)=1$ , entonces existe $latex y\in L$ con $latex x = \frac{\sigma(y)}{y}$


Corolario 90 
Considera la extensión de grado 2 $latex \mathbb{Q}(i)/\mathbb{Q}$  sabemos que es Galois y que tiene grupo  $latex G:=Gal(\mathbb{Q}(i)/\mathbb{Q})=Aut_{\mathbb{Q}}(\mathbb{Q}(i)) =\langle \psi \rangle=\lbrace id, \psi \rbrace$ (donde $latex \psi$ es la conjugación como ya la construimos anteriormente), tenemos que este grupos es cíclico y de 2 elementos, si $latex \alpha=x+yi\in \mathbb{Q}(i)$ es tal que $latex N_{\mathbb{Q}(i)/\mathbb{Q})}(\alpha)=1$ esto implica que $latex N_{\mathbb{Q}(i)/\mathbb{Q})}(\alpha)=x^2 + y^2 = 1$ por lo que existe $latex \beta=c-di \in \mathbb{Q}(i)$ tal que:
$latex \alpha = \frac{\psi(\beta)}{\beta}=\frac{c+di}{c-di}=\frac{c^2-d^2}{c^2+d^2}+i\frac{2cd}{c^2+d^2}$

Por lo que $latex (\frac{c^2-d^2}{c^2+d^2}, \frac{2cd}{c^2+d^2} )\in \mathbb{Q}\times\mathbb{Q}$ es la caracterización de los puntos de norma 1 (circulo en este caso) , usando teoría de Galois.

Puedes verificar que $latex \Big(\frac{c^2-d^2}{c^2+d^2}\Big)^2 + \Big(\frac{2cd}{c^2+d^2} \Big)^2 = 1$ por lo que si $latex c=1$ obtenemos la misma ecuación de parametrización que construimos anteriormente dada por $latex \Big(\frac{1-t^2}{1+t^2},\frac{2t}{1+t^2}\Big)$


Conclusión


El álgebra y la geometría son prácticamente lo mismo, un razonamiento puramente geométrico tiene respuesta algebraica,, de eso se encargó Alexander Grothendieck de formalizar, vimos que con teoría de Galois podemos llegar al mismo resultado geométrico.

No me dio tiempo de demostrar el teorema 90, pero tal vez pronto lo haga, no es tan difícil teniendo más herramientas a la mano que sólo para el que tenga curiosidad le podrá ser útil.



Eduardo Ruiz Duarte (beck)
twitter: @toorandom


Monday, December 28, 2015

Cohomología de Monsky-Washnitzer y punto fijo de Lefschetz (parte 1 Cohomología Grothendieck-deRham Algebraico)

Este es el último post de este año, mañana me voy de vacaciones a Israel pero vine a la oficina en 28 de diciembre para no sentirme culpable de estar en el mar muerto flotando y no continuando mis algoritmos y proyectos pendientes para mi trabajo de investigación en mi actual casa académica que es el Instituto Johann Bernoulli en los Países Bajos.

Parte de lo que estoy investigando tiene que ver con contar soluciones $latex \mathbb{F}_q$-racionales de jacobianas de curvas hiperelípticas de género 2, como ya lo he mencionado en posts anteriores, esto es importante, por razones prácticas y por razones puramente matemáticas.

En cuanto a las razones prácticas tenemos que estas jacobianas de curvas hiperelípticas están consideradas para suplir en un futuro a las curvas elípticas en criptografía, por lo que necesitamos ver maneras de extraer la cardinalidad de su conjunto de soluciónes con el fin de poder ver si el grupo abeliano asociado a la curva es seguro en términos criptográficos. Esta cardinalidad nos dará la traza del endomorfismo de Frobenius, y por lo tanto, podemos obtener también la cardinalidad de la curva hiperelíptica.

Las razones matemáticas son la riqueza matemática que conlleva poder conocer esto, ahora vamos a definir una teoría de cohomología útil para teoría de números que nos permite contar puntos, y que nace de la Cohomología de DeRham algebraica propuesta por Alexander Grothendieck así como del trabajo de Dwork quien probó que la función Zeta de una variedad algebraica sobre un campo finito es simplemente un cociente de polinomios.

Lo que queremos es que con esta teoría de Cohomología dada por Monsky-Washnitzer poder encontrar explícitamente la función zeta de una variedad $latex X$ sobre un campo finito $latex \mathbb{F}_q$ con $latex q=p^n$, esta cohomología es la misma que la de deRham algebraica pero aplicada a un anillo especial.

$latex \zeta_{\mathbb{F}_q}(t)=\exp{\sum_{s\geq 1} \frac{|X(\mathbb{F}_{q^s})|}{s}q^{-st}}$

Donde $latex |X(\mathbb{F}_{q^s})|$ denota el número de puntos racionales de $latex X$ en la extensión de grado $latex s$ de $latex \mathbb{F}_q$.

Queremos contar puntos, y un ingrediente crucial es el teorema del punto fijo de Lefschetz, que es la generalización del teorema del punto fijo de Brouwer el cual expuse aquí en mi blog, este teorema en nuestro contexto nos dice básicamente que si $latex X$ es una variedad sobre un campo finito $latex \mathbb{F}_q$ y si $latex \bar{X}$ es el levantamiento (lifting) de $latex X$ a $latex \bar{\mathbb{F}_q}$ , sabemos que el endomorfismo de frobenius $latex \Phi_q$ va a mapear puntos con coordenadas $latex x_1,...,x_n$ a el punto con coordenadas $latex x_1^q, ..., x_n^q$, entonces los puntos fijos que $latex \Phi_q:\bar{X}\rightarrow\bar{X}$ son exactamente los puntos $latex X$ (porque Frobenius se comporta como la identidad en los puntos $latex \mathbb{F}_q$-racionales) entonces el teorema del punto fijo de Lefschetz implica que en el caso de que $latex X$ sea suave y bien portada como variedad:

$latex |X(\mathbb{F}_q)|=q^{\text{Dim }X} \sum_i (-1)^i Tr(\Phi_q)^{-1}|H^{i}(\bar{X},\mathbb{Q}_l)$

La cohomología que usaremos será la cohomología de deRham algebraica aplicada a un anillo especial que es un lifting (levantamiento) del anillo de coordenadas, hoy definiremos la cohomología de deRham y los problemas que nos va a causar no trabajar en el Lifting.

Hoy nos enfocaremos a construir esta cohomología definida en GAGA por Alexander Grothendieck, para cualquier anillo de tipo finito, que será la base de la cohomología de Monsky-Washnitzer aplicada a un anillo en específico.

Primero que todo, $latex \mathbb{K}$ es un campo perfecto y $latex A$ una $latex \mathbb{K}$-álgebra finitamente generada, que en el caso práctico puede ser un anillo de coordenadas de una variedad $latex X$ cuyas coordenadas a veces denotaremos como $latex \bar {x_i}$ para $latex i\leq n$ por lo que $latex A=\mathbb{K}[\bar{x_1},...,\bar{x_n}]=\mathbb{K}[x_1,...,x_n]/\langle f_1,...,f_r \rangle=\mathbb{K}[X]$ donde $latex X$ está definido por $latex \lbrace f_i \rbrace_{i=1}^{r}\subset \mathbb{K}[x_1,...,x_n]$ irreducibles sobre $latex \mathbb{K}$.

Cohomología de DeRham algebraica con diferenciales de Kähler

Ahorita queremos transportar el cálculo diferencial y análisis a álgebra, por lo que definiremos en abstracto lo que es una derivada y los diferenciales de un anillo de cierto modo generalizados, simplemente pidiendo simbólicamente la regla de Leibniz en este caso sobre el anillo de funciones de una variedad, donde la función de derivación sobre el álgebra finitamente generada será naturalmente heredada con la derivación parcial en cada variable de los polinomios.

Definición: $latex \Omega_{A/\mathbb{K}}$  es el $latex A$-módulo de diferenciales de Kähler, es decir, vamos a tomar $latex \forall a\in A$ los símbolos $latex\space da$ y las siguientes relaciones.

* $latex \space dk=0$ para $latex k\in\mathbb{K}$
* $latex d(a+b)=da+db$ 
* $latex d(ab)=a\cdot db+b\cdot da$ donde $latex a,b\in A$

Por ejemplo, si tenemos que $latex A$ es el anillo de coordenadas de $latex X$ una curva dada por la intersección de irreducibles, es decir, $latex f_1,..,f_r \in \mathbb{K}[x_1,...,x_n]$ entonces:

$latex A=\mathbb{K}[x_1,...,x_n]/\langle f_1,...,f_r\rangle$
Entonces tenemos que explícitamente:

$latex \Omega_{A/\mathbb{K}}=\bigoplus _{i=1}^{n} Adx_i /\langle f_1,...,f_r \rangle$

donde $latex df:=\sum_{j=1}^n \frac{\partial f}{\partial x_j} dx_j$ (Derivada total)

Es decir, como $latex A=\mathbb{K}[\bar{x_1},...,\bar{x_n}]$, tenemos que $latex \Omega_{A/\mathbb{K}}$ es un módulo libre en los generadores $latex d\bar{x_1},...,d\bar{x_n}$ y nota que el álgebra $latex A=\mathbb{K}[\bar {x_1},...,\bar{x_n}]$ está generada como una $latex \mathbb{K}$-álgebra por $latex \bar{x_1},...,\bar{x_n}$ por lo que $latex \Omega_{A/\mathbb{K}}$ esta generado como $latex \mathbb{K}[\bar{x_1},...,\bar{x_n}]$-módulo por $latex d\bar{x_1}, .., d\bar{x_n}$.

Existen muchas derivadas, pero la más natural $latex d:A\rightarrow \Omega_{A/\mathbb{K}}$ es la que manda $latex a\mapsto da$.

Como dije anteriormente, hay muchas derivadas, pero eso no perjudica la unicidad de $latex \Omega_{A/\mathbb{K}}$ ya que si nos encontramos con otra derivación $latex \mathbb{K}$-lineal $latex D:A\rightarrow M$ , ésta se factoriza de manera única como $latex A\xrightarrow{d}\Omega_{A/\mathbb{K}}\rightarrow M$.

De hecho si $latex A=\mathbb{K}[x_1,...,x_n]$ es el anillo de polinomios en $latex n$ variables, (es decir, el anillo de coordenadas del espacio afín $latex \mathbb{A}^n$ tenemos que $latex \Omega_{A/\mathbb{K}}\cong \bigoplus_{i=1}^n A$ , esto lo pueden demostrar ustedes utilizando el mapeo $latex A\rightarrow \bigoplus_{i=1}^n A$ dado por $latex f\mapsto (\frac{\partial f}{\partial x_1},...,\frac{\partial f}{\partial x_n})$ y notando que es una derivada $latex \mathbb{K}$-lineal y que el mapeo $latex \phi:\Omega_{A/\mathbb{K}}\mapsto \bigoplus_{i=1}^n A$ dado por $latex df\mapsto (\frac{\partial f}{\partial x_1},...,\frac{\partial f}{\partial x_n})$ es un isomorfismo con inverso $latex \psi:\bigoplus_{i=1}^n A \rightarrow \Omega_{A/\mathbb{K}}$ dado por $latex (f_1,...,f_n)\mapsto \sum_{i=1}^n f_idx_i$.

Una observación "geómetra algebraica" es que la curva definida por el álgebra $latex A$ (su anillo de coordenadas) , por más abstracto que sea esto y por más raro o más típico que sea el campo $latex \mathbb{K}$ es suave, sin singularidades extrañas en su geometría, entonces $latex \Omega_{A/\mathbb{K}}$ es un módulo localmente libre de rango exactamente la dimensión de Krull del anillo $latex A$ que coincide con la dimensión topológica de la variedad $latex X$ asociada al álgebra $latex A$.  


Ahora vamos a construir los grupos de cohomología, para esta parte es necesario que entiendas lo que es el producto cuña $latex dx_i\wedge dx_j$, yo aquí lo expongo con ejemplos y de manera geométrica.


Definición: Sea $latex \Omega^k_{A/\mathbb{K}}=\bigwedge_{i=1}^k \Omega_{A/\mathbb{K}}$ , es decir en particular $latex \Omega^{0}_{A/\mathbb{K}}=A$ y $latex \Omega^{1}_{A/\mathbb{K}}=\Omega_{A/\mathbb{K}}$


Y construyamos el complejo de cadenas dado por 

                 $latex d_{k}:\Omega^{k-1}_{A/\mathbb{K}}\rightarrow \Omega^{k}_{A/\mathbb{K}}$ 
$latex f_0 df_1\wedge ... \wedge df_{k-1}\mapsto df_0\wedge df_1\wedge ... \wedge df_{k-1}$

Estas $latex d_j$ entre los módulos de diferenciales de orden $latex j$ y  $latex j+1$ pueden demostrar que son derivaciones, y denotamos como $latex \Omega^{\bullet}_{A/\mathbb{K}}$ al complejo de cadenas resultante con su respectivo operador de frontera en cada flecha dado por $latex d_j$.

$latex \cdots\xrightarrow{d_{k-1}}\Omega^{k-1}_{A/\mathbb{K}}\xrightarrow{d_{k}} \Omega^k_{A/\mathbb{K}}\xrightarrow{d_{k+1}} \Omega^{k+1}_{A/\mathbb{K}}\xrightarrow{d_{k+2}}\cdots$

Pueden demostrar que en efecto $latex d_{k+1}\circ d_k =0$ por lo que $latex \text{Im}{d_k}\subseteq \ker d_{k+1}$, que es lo fundamental para construir la teoría de cohomología.

Definición: El complejo de DeRham para la $latex \mathbb{K}$-álgebra $latex A$ está dado por el complejo de cadenas $latex \Omega^{\bullet}_{A/\mathbb{K}}$ donde su i-ésimo grupo de Cohomología está definido como: 

$latex H^{i}_{dR}(A/\mathbb{K}):=H^{i}(\Omega^{\bullet}_{A/\mathbb{K}})=\ker{d_{i+1}}/\text{Im} d_{i}$

Nota que si $latex \space i> KrullDim(A)=Dim(X)$ por las propiedades del producto cuña $latex \wedge$ tendrás dependencia lineal por lo que $latex \Omega^i_{A/\mathbb{K}=0$ que implica que $latex H^i(A/\mathbb{K})=0$ , nota que podemos generalizar esta construcción a esquemas de tipo finito por lo que es mejor denotar $latex H^{i}_{dR}(X/\mathbb{K}):=H^{i}_{dR}(A/\mathbb{K})$ donde $latex X=Spec(A)$ , esto es la generalización usando el espectro del anillo y lo tengo explicado aquí con ejemplos, pero si no te gusta esto, o te es muy complicado, sigue usando el anillo $latex A$.


Cohomología en característica p

Vamos a jugar un poco con esta cohomología y supongamos ahora que $latex \mathbb{K}=\mathbb{F}_p$, queremos definir una teoría de cohomología para variedades sobre $latex \mathbb{F}_p$ , el punto aquí será definir una teoría de cohomología con coeficientes en un campo de característica 0 relacionado muy cercanamente con $latex \mathbb{F}_p$ para una variedad afín sobre $latex \mathbb{F}_p$.

Primero, observemos por qué el párrafo anterior, considera $latex X=\mathbb{P}^1_{\mathbb{F}_p}$ es decir $latex A=\mathbb{F}_p[X]=\mathbb{F}_p[x]$, es fácil ver que $latex H^{1}_{dR}(A/\mathbb{F}_p)$ es un $latex \mathbb{F}_p$-espacio vectorial de dimensión infinita ya que por ejemplo $latex d_1(x^{pk})=0$ $latex \forall k\geq 0$ por lo que $latex \lbrace x^{pk-1}dx \rbrace_{k\geq 0} \not\subset \text{Im }d_1$ y $latex \lbrace x^{pk-1}dx \rbrace_{k\geq 0}\subset \Omega_{A/\mathbb{F}_p}$  $latex \forall k\geq 0$
  
O sea tenemos que $latex d_1:A\rightarrow \Omega^{1}_{A/\mathbb{F}_p}$ está dado por $latex f\mapsto df$ y $latex d_2:\Omega^{1}_{A/\mathbb{F}_p}\rightarrow \Omega^{2}_{A/\mathbb{F}_p}$ está dado por $latex gdf\mapsto dg\wedge df$.

Con esto anterior y la observación de que $latex x^{pk-1}dx\notin \text{Im }d_1$ tenemos que:

$latex \ker d_2=\langle \lbrace cdf : f\in A,\text{ }\forall c\in\mathbb{F}_q\rbrace \cup \lbrace cx^{pk}df : k\geq 0\rbrace\rangle$

$latex \text{Im }d_1=\langle \lbrace df \in \Omega^{1}_{A/\mathbb{F}_q} : f=cx^{pk+r},\text{ }r\neq -1\rbrace\rangle$

Por lo tanto:

$latex H^{1}_{dR}(A/\mathbb{F}_q)=\ker d_{2}/\text{Im }d_{1}$

Es como $latex \mathbb{F}_p$-espacio vectorial tiene una infinidad de generadores dados por todos los valores que puede tener $latex k\geq 0$ ya que la Imágen de $latex d_1$ está totalmente contenida en la parte izquierda del kérnel de $latex d_2$ y la parte derecha es infinita.

Esto es un problema... tenemos que de hecho $latex \Omega^{1}_{A/\mathbb{F}_p}$ tiene dimensión infinita, esto no nos sirve de nada, es muy grande, necesitamos deshacernos de la característica $latex p$ que nos da problemas con las derivaciones de funciones polinomiales con exponente múltiplo de $latex p$.

El campo de característica 0 que usaremos es $latex \mathbb{Q}_p$ (campo de p-ádicos que lo puedes ver explicado en mi blog aquí )y considera su anillo de enteros asociado $latex \mathbb{Z}_p$ , es bien conocido que $latex \mathbb{Z}_p/p\mathbb{Z}_p\cong \mathbb{F}_p$, 

Supón que tienes una $latex \mathbb{F}_p$-álgebra $latex A$ , entonces si pudieramos encontrar una $latex \mathbb{Z}_p$-álgebra suave $latex \tilde{A}$ con $latex \tilde{A}\otimes_{\mathbb{Z}_p}\mathbb{F}_p\cong A$ podrías considerar la cohomología de DeRham de la $latex \mathbb{Q}_p$-álgebra $latex \tilde{A}_{\mathbb{Q}_p}:=\tilde{A}\otimes_{\mathbb{Z}_p}\mathbb{Q}_p$

Con esto, ya nos deshacemos de la dimensión infinita, pero el problema es que levantar (lift) el álgebra $latex A$ como $latex \mathbb{Z}_p$-álgebra da diferentes grupos de cohomología , aunque finitos pero diferentes y necesitamos una manera de poder encontrar un lifting único que nos sirva para poder aplicar el teorema del punto fijo.

Por ejemplo si $latex A=\mathbb{F}_p[x]$ y $latex \tilde{A}_1=\mathbb{Z}_p[x]$ , $latex \tilde{A}_2=\mathbb{Z}_p[x,y]/\langle (1+px)y-1 \rangle$, puedes verificar que $latex H^1_dR(\tilde{A}_{1,\mathbb{Q}_p}/\mathbb{Q}_p)=0$ y $latex H^1_dR(\tilde{A}_{2,\mathbb{Q}_p}/\mathbb{Q}_p)$ tiene dimensión 1

Como vemos, tenemos dos liftings de $latex A$ con diferente grupo de cohomología.

Vamos a seguir después con el anillo en el que queremos trabajar la cohomología, para aplicar el teorema del punto fijo de Lefschetz por ahora nos quedamos aquí.

Después le seguimos, espero les haya interesando.

Eduardo Ruíz Duarte (beck)
twitter: @toorandom


Monday, December 21, 2015

Conjetura de Kaplansky, grupos y anillos de grupo

Hay un problema que lleva 25 años sin resolverse y fue descubierto por Irving Kaplansky, es de esos problemas que se ven bien fáciles de atacar pero pues resulta que no es tan fácil, yo me topé en mi trabajo de investigación para criptografía en variedades con un anillo de grupo que quería ver si tenía múltiplos de 0, y al leer literatura me topé con esto que es muy interesante y que yo tendré que demostrar en mi caso particular.

Veremos un functor de la categoría de grupos a anillos (de hecho módulos), es decir, podemos asociar un anillo a todo grupo.

La conjetura dice lo siguiente:

Conjetura: (Kaplansky)
Sea $latex \mathbb K$ un campo y $latex G$ un grupo libre de torsión, entonces el  anillo de grupo $latex \mathbb{K}[G]$ no tiene divisores de $latex 0$ es decir es un dominio

Para entender este enunciado vamos a definir todo y construir $latex \mathbb{K}[G]$

Vamos a recordar todos los conceptos necesarios de esta conjetura a través de ejemplos no tan triviales de cada uno de los conceptos para poder adquirir intuición en la conjetura.

Grupos, anillos, campos, torsión a través de ejemplos

Grupos (no abelianos son los interesantes)

Un grupo $latex (G, \cdot)$ es un conjunto con una operacion binaria que cumple
a) Existe un $latex e\in G$ tal que $latex \forall g\in G$ tenemos que $latex g\cdot e=e\cdot g = g$ (hay neutro)
b) Si $latex g\in G$ entonces $latex \exists h$ tal que $latex h\cdot g =g\cdot h=e$ (todos son invertibles)
c) Si $latex g_1,g_2\in G$ entonces $latex g_1\cdot g_2 \in G$ (es cerrado)
d) Si $latex g_1,g_2,g_3\in G$ entonces $latex (g_1\cdot g_2)\cdot g_3=g_1\cdot (g_2\cdot g_3)$ (es asociativo)
e)* si sucede que $latex \forall g_1,g_2 \in G$ tenemos que $latex g_1\cdot g_2=g_2\cdot g_1$  (es conmutativo) decimos que $latex G$ es un grupo abeliano


Ejemplos:

No-Ejemplo:

Las matrices con la multiplicación no forman un grupo ya que hay algunas que tienen determinante 0 y no son invertibles, por lo que no se cumple la propiedad b

$latex (Mat_{n}\mathbb R,\cdot)$

Ejemplo $latex SL_2(\mathbb C)$

Las matrices sobre un campo, por ejemplo $latex \mathbb C$ de nxn cuyo determinante es 1 se les denota como $latex SL_n\mathbb C$ , es claro que es un grupo con la multiplicación de matrices ya que todos son invertibles, este se llama grupo especial lineal, y es "especial" porque es de hecho un subgrupo normal de otro mas grande que se llama $latex GL_n\mathbb C$ que es el grupo general lineal que consta de todas las matrices invertibles, es fácil mostrar que un subgrupo normal para los que saben un poco más de teoría de grupos , sabemos que el kernel de un morfismo de grupos es siempre un subgrupo normal y en este caso el operador de determinante induce un homomorfismo de grupos, en este caso $latex det:GL_n\mathbb{C} \rightarrow \mathbb{C}^{\times}$ donde $latex \mathbb{C}^\times$ es el grupo multiplicativo de los complejos sin el 0, entonces, $latex Ker(det)=\lbrace A\in GL_n\mathbb C\mid det(A)=1\rbrace=SL_n\mathbb C$, de hecho si te gusta la geometría diferencial hay más en este grupo que ya me extendí mucho en el ejemplo pero tenemos que existe un álgebra de Lie (haces nacer un espacio vectorial donde se pueden multiplicar vectores junto con una operación especial llamada corchete de Lie ) de $latex SL_n\mathbb C$ que es $latex \mathfrak{sl}_n\mathbb C =\lbrace A\in SL_n\mathbb C \mid Tr(A)=0\rbrace$ donde el corchete de Lie es la multiplicación de estos elementos dado por $latex [g,h]=g^{-1}h^{-1}gh$

La teoría en este grupo es hermosa y es favorita de muchos ultra-ingenieros (teoría de control) y de muchos físicos ya que tiene un entendimiento muy profundo, el hecho de que todos tengan determinante 1, y el determinante representar un polinomio con entradas en la matriz te dice que de hecho los elementos pertenecen a una variedad que se sumerge en un espacio y tiene cierta topología y se le da una interpretación a este grupo como el que preserva volúmenes y orientación con transformaciones de $latex \mathbb{C}^n$ (puedes usar $latex \mathbb R$) donde el determinante mide el cambio en volumen y orientación.


Otro grupos con funciones $latex S_n$

Otros ejemplos de grupos más aburridos pueden ser los números reales con la suma usual, o los reales sin el 0 con la multiplicación , estos son abelianos, otros más divertidos no conmutativos son las permutaciones $latex S_n$ que consta de todas las funciones que permutan $latex n$ elementos y su operación es la composición de estas funciones, por ejemplo si hacemos actuar a este grupo en el conjunto $latex X=[ 1,2,3 ]$ tenemos que hay un $latex \sigma_1\in S_3$ tal que intercambia los dos primeros, hay otro $latex \sigma_2$ que intercambia el primero por el tercero, y hay uno que no hace nada, por ejemplo $latex \sigma_1(X)=[2,1,3]$ y $latex \sigma_2(X)=[3,2,1]$ y $latex \sigma_1\circ \sigma_2(X)=[2,3,1]$ y $latex \sigma_2\circ \sigma_1(X)=[3,1,2]$ , este es un grupo (no abeliano) de $latex n!$ elementos , en este ejemplo tiene 6 elementos, toma en cuenta que consta de funciones y hay varios subgrupos de estos, que miden simetria, por ejemplo el grupo de las rotaciones de un cuadrado, donde no se vale por ejemplo intercambiar solo 2 vertices ya que "romperias el cuadrado" , o simplemente las rotaciones de un icosaedro, o un simplejo en dimensión 4, et cétera, hay otro tipo de grupos que alguna vez expuse aquí que se llama grupo de trenzas que tiene que ver con teoría de nudos, lo puedes explorar aquí en mi blog.

Campos

Un campo es sólo una estructura que consta de un conjunto y que contiene dos operaciones cerradas en el conjunto relacionadas con la ley distributiva donde el conjunto con cada operación por sí misma forma un grupo abeliano (por ejemplo $latex (\mathbb R ,+ , \times)$  o $latex (\mathbb {F}_q,+,\times)$ pero no $latex (\mathbb{Z},+,\times)$ ya que los enteros  con la multiplicación sólo tienen al 1 y -1 con inverso, los demás no por lo que no forma grupo abeliano con $latex \times$), hay campos más interesantes, por ejemplo todos los cocientes de polinomios en una variable $latex x$ sobre un campo $latex \mathbb K$ se le denota como $latex \mathbb K (x)$ donde un elemento de ahí puede ser $latex \frac{x^2-x}{x^3-x^2+1}$ estos campos de funciones polinomiales son interesantes cuando los haces en más variables y los elementos cumplen estar definidos sobre una superficie o una curva, y limitas que los denominadores de las funciones polinomiales no se anulen en algún punto de la curva (podrás encontrar un campo diferente para cada punto, eso le da una estructura muy rica a una curva algebraicamente), todo esto sigue conservando la estructura de campo y se puede estudiar la superficie/curva desde ciertas propiedades de este campo sin acudir ya a la geometría.


Anillos y dominios enteros

Un Anillo es como un campo pero a la operación multiplicativa no le pides que tenga inversos, por ejemplo las matrices cuadradas sin pedir condiciones al determinante forman un anillo de hecho forman un grupo con la adición, los polinomios también son un anillo conmutativo, et cétera.


Un anillo $latex R$ se dice que es un dominio entero si $latex \forall a,b\in R\setminus \lbrace 0 \rbrace$ se tiene que $latex a\cdot b \neq 0$

Por ejemplo $latex Mat_2\mathbb Z$ no es un dominio entero ya que $latex \begin{pmatrix} 1 & 0 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 0 & 0 \\ 1 & 1 \end{pmatrix} = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}$.

También tenemos que los polinomios con coeficientes en un campo si son un dominio entero, ya que no hay dos polinomios no nulos que al multiplicarse te den 0

Otro no-ejemplo son los enteros módulo un número NO-primo, por ejemplo $latex (\mathbb Z/(10),+,\cdot)$  donde la suma y multiplicación es la usual módulo 10 (esto es de manera intuitiva que $latex a\cdot b = c$ donde $latex c$ es el residuo de la división $latex \frac{a\cdot b}{10}$, esta estructura es un anillo pero no es un dominio ya que por ejemplo $latex 5\cdot 2 \equiv 0 \bmod 10$ pero si lo hicieramos con un número primo $latex (\mathbb Z/(p),+,\cdot)$ por la naturaleza de $latex p$ no vas a encontrar dos números que multiplicados te den $latex p$ entonces no existirán "residuos 0" al multiplicar dos números y dividir entre $latex p$ , pero bueno de hecho esto ya es más que un anillo, es un campo finito, todos son invertibles, lo puedes demostrar si tienes ganas.

Un grupo $latex G$ se dice que es libre de torsión si al iterar $latex n$ veces su operación con cualquier elemento $latex g\in G\setminus \lbrace e\rbrace$  no te da nunca el neutro de la operación $latex e\in G$ para todo $latex n\in \mathbb N$ , es decir, un grupo $latex G$ es libre de torsión si el elemento neutro es el único elemento de orden finito

Torsión en grupos

Por ejemplo TODOS los grupos finitos NO son libres de torsión, ya que iterar en un $latex g\in G$ te da elementos de un subgrupo generado por $latex g$ denotado por $latex (g)$ y su cardinalidad divide la cardinalidad de $latex G$ entonces $latex e\in (g)$ incluye a $latex e\in G$ por lo que todos los elementos tienen torsión.

Con esto ya excluimos TODA una familia de grupos de la conjetura de Kaplansky, ya que pedimos que sea infinito y sin torsión, por lo que todos los campos de característica p (que también son grupos) también quedan excluidos, y aquí es donde vamos viendo que todo se dificulta ya que los grupos a tratar deben ser más complicados, un grupo aburrido libre de torsión pues son los enteros $latex (\mathbb{Z},+)$ donde sumar nunca da 0 , las matrices tienen torsión ya que hay matrices que al elevarlas a la $latex n$ se anulan por ejemplo las matrices de 2x2 con coeficientes en el campo finito $latex \mathbb Z/(2)$ con la multiplicación tenemos que $latex \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}^2=\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}$ es la matriz identidad , por lo que ese elemento tiene orden 2


Conjetura de Kaplansky

La conjetura propone construir un anillo dado un campo y un grupo  y estudiar si es o no un dominio entero

Construcción de un anillo asociado a un grupo $latex G$ y un campo $latex \mathbb K$ 


Lo que haremos es construir un anillo desde un grupo denotado como $latex \mathbb{K}[G]$, es decir, tendremos que construir una suma y una multiplicación que cumpla todos los axiomas.

Grupos generados desde cualquier conjunto (Grupo libre abeliano)

Ya estamos casi listos con las definiciones aposteriori con los ejemplos, vamos a construir un grupo dado un conjunto cualquiera, imaginen que tenemos el conjunto $latex A=\lbrace \alpha,\beta,\gamma\rbrace$, si nos preguntaran cómo podríamos construir un $latex \mathbb K$ espacio vectorial  $latex V$ con el conjunto $latex A$ lo más adecuado es tomar las todas las combinaciones de sumas formales $latex k_1\alpha + k_2 \beta + k_3 \gamma$ $latex \forall k_i\in \mathbb K$, podemos generalizar esto apra cualquier conjunto de distinta cardinalidad, incluso infinita bajo ciertas condiciones (como por ejemplo que sólo un número finito de $latex k_i$ sean distintas de cero) y vamos a hacer más compacta la notación y a los elementos del campo vamos a ponerles un índice que nos indicará a qué elemento del conjunto está multiplicando, entonces:


$latex \sum k_\alpha \alpha \in V$ donde $latex \alpha \in A$ y $latex k_\alpha \in \mathbb K$

La adición está definida de manera natural como

$latex (\sum k_\alpha\cdot\alpha)+(\sum c_\alpha \cdot \alpha)=\sum (k_\alpha+c_\alpha)\cdot \alpha$

También tenemos la multiplicación por un escalar, por ejemplo si tomamos un $latex a\in \mathbb K$

$latex a(\sum k_\alpha \alpha)= \sum (a k_\alpha)\cdot \alpha$

Es decir, es la usual la suma coordenada a coordenada en el espacio vectorial $latex V$, y la multiplicación por escalar, pero nosotros somos más ambiciosos y queremos darle una estructura de álgebra para poder multiplicar los vectores,

Tenemos que observar que $latex A\subset V$ ya que si nos tomamos un $latex \gamma \in A$ tenemos que:

$latex V\ni \gamma^{*} = \sum k_\alpha \alpha$ donde $latex k_\gamma = 1$ y $latex k_\alpha = 0$ $latex \forall \alpha \neq \gamma$ por lo que $latex A$ es base de $latex V$ .

La multiplicación primera que se viene a la mente es una que es muy mediocre (al menos a mi se me ocurrió así) que es como la suma.. coordenada a coordenada pero eso no le da nada de estructura, pero bueno, ¿por qué no se puede ocurrir otra? , pues porque el conjunto $latex A$ no tiene nada de estructura..., no hay por donde podamos jugar.

Pero qué sucedería si le metemos estructura a $latex A$ y le pedimos que sea un grupo.


Anillo de grupo asociado a un campo $latex \mathbb K$ y un grupo $latex G$ 

Este lo denotaremos por $latex \mathbb{K}[G]$ y la suma está definida de la misma manera que con $latex A$ , pero lo que nos importa ahora es la es la multiplicación y explotando la operación en $latex G$ podemos definir lo siguiente:

Sean $latex \alpha.\beta \in G$ y $latex k_\alpha,k_\beta \in \mathbb K$ entonces definimos la multiplicación $latex \odot$ en $latex \mathbb{K}[G]$ como:


$latex (\sum_{\alpha \in G} k_\alpha\cdot\alpha)\odot (\sum_{\beta \in G} k_\beta \cdot \beta)=\sum_{\alpha,\beta \in G} (k_\alpha k_\beta)\cdot \alpha\beta =\sum_{\gamma\in G} k_\gamma \cdot \gamma$

Aquí tenemos que $latex \gamma = \alpha\beta\in G$ por lo que $latex \alpha=\gamma\beta^{-1}$

entonces para poder definir la multiplicación de manera directa.


tenemos que:

$latex k_\gamma$ es la suma de todos los productos $latex k_\alpha k_\beta$ tal que $latex \gamma=\alpha \beta$.

por lo que el coeficiente que le toca a $latex \gamma$ que es $latex k_\gamma$ está dado por:

$latex k_\gamma=\sum_{\alpha\beta=\gamma} k_\alpha k_\beta=\sum_{\alpha \in G} k_\alpha k_{\alpha^{-1}\gamma}$

La pregunta es, si suponemos que $latex \alpha,\beta \in\mathbb{K}[G]^{*}$ podría suceder que $latex \alpha\odot\beta=0$ , para cualquier campo $latex \mathbb{K}$ cuando $latex G$ es un grupo libre de torsión... no se sabe... hay algunos avances para ciertos $latex G$ y cuando $latex \mathbb{K}=\mathbb{C}$ , yo en particular estoy tratando de demostrar esto para un un grupo infinito de automorfismos de una variedad con su campo de funciones es decir algo así como $latex \mathcal{K}(V)[Aut_\mathcal{K}(V)]$.

Espero les haya gustado.

Eduardo Ruiz Duarte
twitter: @toorandom

Wednesday, December 02, 2015

Teorema de punto fijo de Brouwer y Equilibrio de Nash con topología general

Hoy es el aniversario luctuoso de Luitzen Egbertus Jan Brouwer, fue un matemático Holandés que murió hace 49 años, él demostró uno de los tantos cientos de teoremas de punto fijo, pero el suyo (teorema de punto fijo de Brouwer), considero es de los más importantes (Junto con el que es más importante para mí que es el de Lefschetz que se usa para hacer cohomología en campos finitos), el de Brouwer es un resultado que movió toda la teoría de topología de espacios euclídeos, ecuaciones diferenciales, topología algebraica y teoría de juegos, donde de hecho el teorema del equilibrio de Nash es una consecuencia/corolario del teorema del punto fijo de Brouwer.

También aparte del aniversario luctuoso de Brouwer escribo este post porque hace pocos meses John Nash murió en un accidente automovilístico, y con mi "modita" de escribir un poco de teoría para recordar sus grandes mentes, dejo este post, que como siempre es personal, sin tanto rigor, pero algunas demostraciones, podrán haber errores, los cuales con gusto me pueden corregir en los comentarios o contactarme.

Equilibrio de Nash

Todos vieron esa película "Beautiful Mind" con Russell Crowe que hace el papel de John Nash, el teorema de John Nash sin matemáticas dice aproximadamente que en cualquier juego multijugador donde se permitan cambiar estrategias, y donde cada quién ya está en cierta parte de la evolución del juego donde se conocen las estrategias de los demás, siempre habrá un punto (de equilibrio de Nash) en el que al haber ejecutado su mejor estrategia cada quien, todos tendrán el mejor resultado posible visto individualmente.

Esto quiere decir que está el punto final del juego donde uno gana y todos los demás pierden, pero también hay un punto en donde todos están en su mejor posición posible con respecto a su estrategia, donde al dejar el juego sería la maximización de sus ganancias.

En la película esto lo ejemplifican de manera un poco machista en la escena del bar, donde al todos "competir" por la chica linda, a nadie los va a pelar por atascados o sólo a uno y los demás no podrán ligarse a las amigas de la chica linda porque no querrán ser "plato de segunda mesa", pero al cambiar la estrategia si no pela nadie a la linda y todos se van con sus amigas, la mayoría habrá "ligado". Este punto es el punto en donde se maximiza la ganancia de todos, esta maximización existe... SIEMPRE, y es lo que probó Nash, y es parte de la base de toda la economía mundial y teoría de decisiones.

Esta teoría impactó mucho la teoría económica ya que Adam Smith antes había descrito el individualismo como principal estrategia para lograr los mejores objetivos, pero aquí entra un juego filosófico/social/económico donde a veces el individualismo no siempre es lo mejor, incluso para el individuo ganador, ya que la maximización de recursos de los contrincantes podría traer otro tipo de consecuencias positivas que en la evolución del juego traerían una mayor ganancia a otro plazo (por ejemplo Paz, economía sólida entre países, et cétera).

Teorema del punto fijo de Brouwer


Aquí expondré el Teorema del punto fijo de Brouwer, pero sólo en dimensión 1, recuerdo que esto fue parte de un examen que tuve, para dimensión $latex n$ desafortundamente no tengo el tiempo (ni tampoco la demostración en mi mente a la mano) para poder hacerla, aunque recuerdo que funciona con grupos de homología, espero pronto (en vacaciones) poder dedicarle un tiempo para dimensión $latex n$.

Teorema (Punto fijo de Brouwer)
Sea $latex f\in C^0$, $latex \mathbb{D}^n=\lbrace \bar{x}\in \mathbb{R}^n : ||\bar{x}||\leq 1 \rbrace$ y $latex f:\mathbb{D}^n \rightarrow \mathbb{D}^n$ entonces existe $latex \bar{x_0}\in \mathbb{D}^n$ tal que $latex f(\bar{x_0})=\bar{x_0}$

En español: Si tenemos una función continua que va del disco cerrado de dimensión $latex n$ a sí mismo, entonces siempre habrá al menos un punto $latex \bar{x_0}\in \mathbb{D}^n$ donde la función se comporta como la identidad, es decir donde $latex f(\bar{x_0})=\bar{x_0}$.

Demostración para $latex n=1$, usando topología en vez del el trillado teorema de valor intermedio.

Primero vamos a ver qué significa geométricamente, con este dibujito que hice en este sitio.


Aquí tenemos una función $latex f$ en verde claramente continua en $latex \mathbb{D}^1=\lbrace x\in \mathbb{R} : |x| \leq 1\rbrace=[-1,1]$, es decir, el disco de dimensión 1 es un intervalo cerrado en $latex \mathbb{R}$ , también vemos en azul la función identidad que corresponde a la diagonal $latex \Delta=\lbrace (x,x) : x\in\mathbb{D}^1\rbrace \subsetneq \mathbb{D}^1\times\mathbb{D}^1$, que es justamente la gráfica de la función $latex y=x$ en $latex \mathbb{R}^2$ delimitada al cuadrado $latex [-1,1]\times[-1,1]=\mathbb{D}^1\times\mathbb{D}^1$.

La gráfica verde de la función la definiremos como $latex G_f=\lbrace (x,f(x)) : x\in\mathbb{D}^1\ \rbrace\subsetneq \mathbb{D}^1\times\mathbb{D}^1$.

Lo que queremos demostrar para cualquier $latex f\in C^0$ donde $latex f:\mathbb{D}^1\rightarrow \mathbb{D}^1$ es que $latex G_f\cap \Delta \neq \emptyset$, o sea que existe un punto $latex x_0\in \mathbb{D}^1$ tal que $latex f(x_0)=x_0$ y esto lo haremos muy rápidamente usando topología básica.

Sólo necesitamos recordar que un abierto básico  $latex U\subset \mathbb{R}^n$ es aquel que para todo $latex x\in U$ existe un $latex \epsilon$ >  $latex 0$ tal que $latex B_\epsilon(x)\subset U$ es decir, siempre podemos encontrar una bola rellena alrededor de $latex x$ de radio $latex \epsilon$ (la medida del radio está dada por la métrica de $latex \mathbb{R}^n$) totalmente contenida en $latex U$, por más que ese $latex x$ esté cerca de la frontera/orilla de $latex U$, ese punto no puede estar en la frontera de $latex U$ porque la frontera de $latex U$ no es parte del abierto $latex U$ por cómo está definida la noción de abierto.

Continuemos con la demostración. sea $latex f(-1)=a$ y $latex f(1)=b$ , en el dibujo los podemos ver en rojo. Si $latex f(-1)=-1$ o $latex f(1)=1$ ya acabaríamos cuyo caso sería trivial, entonces vamos a suponer lo contrario que es que $latex f(-1)=a > -1$ y $latex f(1)=b < 1$.

Lo que queremos usar es una idea de conexidad topológica, diciendo que cualquier camino entre los puntos rojos $latex (-1,a),(1,b)$ el cual lo denotamos por $latex \gamma_{a,b}\subset \mathbb{D}^1\times\mathbb{D}^1$ debe cruzar por $latex \Delta$ , lo cual intruitivamente parecería muy fácil, pero demostrarlo formalmente requiere topología, ya que lo estamos generalizando para cualquier función continua, sea como sea, y no sólo la función verde linda del dibujo.


Tenemos que por hipótesis $latex f$ es continua, por lo que $latex G_f$ está conectado (es conexo), y esto es porque $latex G_f=Im(\Phi)$ (imagen de $latex \Phi$) donde $latex \Phi$:

$latex \begin{aligned}\Phi:\mathbb{D}^1&\rightarrow \mathbb{D}^1\times\mathbb{D}^1 \\ x&\mapsto (x,f(x)) \end{aligned}$

Donde este mapeo es fácil demostrar que es continuo usando la continuidad de $latex f$.
Y de la continuidad es sabido por topología básica que una función continua $latex \phi:X\rightarrow Y$ entre dos espacios topológicos, si $latex X$ es conexo (o aún más fuerte, conexo por trayectorias) , entonces $latex Im(\phi)\subseteq Y$ también es conexo (por trayectorias si $latex X$ lo era), en este caso aquí la $latex \phi$ es nuestra $latex \Phi$. Este resultado es una especie de generalización del teorema del valor intermedio que todos vieron en su clase de cálculo 1.

Ahora, construiremos dos conjuntos abiertos.

$latex A=\lbrace (x,f(x)) : f(x) > x \rbrace$
$latex B=\lbrace (x,f(x)) : f(x) < x \rbrace$

Nota que estos dos conjuntos jamás pueden ser vacíos, ya que $latex (-1,a)\in A$ y $latex (1,b)\in B$.

Estos dos conjuntos representan intuitivamente lo que está arriba ($latex A$) y lo que está abajo ($latex B$) de la diagonal $latex \Delta$, y también nota que no tienen puntos fijos (ya que es lo que queremos demostrar).

Procediendo por contradicción, si suponemos que de hecho $latex f$ no tiene puntos fijos, entonces debería suceder que $latex G_f\cap \Delta = \emptyset$, lo cual implicaría que por como construimos $latex A$ y $latex B$ entonces $latex G_f = A\cup B$, pero $latex A,B\subset G_f$ son abiertos en $latex G_f$, y disjuntos, por lo que su unión es disjunta, esto contradice que la imagen de $latex \Phi$ que es $latex G_f$ es conexa $latex \blacksquare$

Nota sobre $latex A$ y $latex B$ al final de la demostración

¿por qué $latex A$ y $latex B$ son abiertos EN $latex G_f$?

Esto no lo justifiqué hace algunos años en mi examen, y me causó un comentario al final de la demostración en mi escrito, pero aquí dejo una idea con la que ustedes pueden demostrarlo (que es muy fácil en $latex \mathbb{R}$), ya que la métrica de $latex \mathbb{R}$ heredada a $latex G_f$ te permite demostrar que en este caso intervalos semi-abiertos/semi-cerrados  (con un extremo que incluya su frontera) , realmente son ABIERTOS, ya que lo obtienes de la topología heredada de $latex \mathbb{R}^2$ intersectándolo con un abierto, por ejemplo si $latex \alpha\in \mathbb{D}^1$ y $latex \beta >1$:

$latex U=(\alpha,1]=\mathbb{D}^1\cap (\alpha,\beta)$.

Donde $latex (\alpha,\beta)\subset \mathbb{R}$ , por lo que $latex U\subset\mathbb{D}^1$ es abierto con respecto a $latex \mathbb{D}^1$.

La demostración en general para cualquier dimensión, no existe generalizada de esta forma, se utiliza álgebra homológica para construir algo así como el teorema del valor intermedio generalizado, o el teorema que generaliza esto aún más es el de Borsuk-Ulam  si eres más ambicioso.

El teorema del equilibrio de Nash y el teorema del punto fijo de Brouwer están conectados en que la funcion de ganancia (que él demuestra que es continua) de todos los jugadores con respecto al espacio de todas las estrategias de cada uno (ambas están en N variables, donde N es el número de jugadores que es fínito para asegurar que se trabaje en un espacio compacto), tienen un punto fijo, y él demuestra que este punto es de equilibrio, no puedo entrar en más detalles de la prueba porque no conozco los artificios de teoría de Juegos a ese nivel, pero espero les haya servido.


Eduardo Ruíz Duarte (beck)
Twitter: @toorandom