Beck's blog: geometría algebraica

Showing posts with label geometría algebraica. Show all posts

Wednesday, April 19, 2017

Why finding big prime numbers? why study weird arithmetic sequences?

Now I am sitting on my desk thinking on a technique to help me to identify BIG prime numbers in certain arithmetic sequences using algebraic geometry.

This was part of my last project for my PhD, which I think it was very interesting. When I say "BIG" I mean thousands of digits, maybe millions. When I say "primes in arithmetic sequences" I mean to separate prime numbers in a list like $latex \{ \alpha_n \}_{n=0}^\infty$.

A popular, a prostituted, an important and a "dumb" sequence.

Now we will describe some non trivial sequences and we will see a glimpse of why they are important (or not).

This is of course in my opinion, since there are infinitely many sequences which I ignore and could be more interesting. In fact there is a sequence of "uninteresting numbers" which contains all numbers which appear to not have known/interesting properties (like being prime, Mersenne prime, triangular number, cube, etc...).
But well, this sequence then..., is interesting as is unique, and then we get a paradox.

The popular sequence

The popular is a very famous arithmetic sequence, and is the "Mersenne Sequence", $latex \{ 2^n-1\}_{n=1}^\infty\subset\mathbb{N}$.

$latex \{ 2,7,15,31,63,127,255,...\}$

This is the sequence of all Mersenne numbers. We denote by $latex M_n$ to the number $latex 2^n-1$.
To identify the primes in this sequence, note that if $latex n=2k$ (is even) then $latex 2^n-1=(2^k-1)(2^k+1)$ and hence... not a prime number. This means that in the sequence we can discard all the values $latex n\in 2\mathbb{Z}$, that is $latex M_{2k}$ is not prime. A less trivial fact is that if $latex n$ is composite, namely $latex n=ab$ then we have that:

$latex 2^n-1=2^{ab}-1=(2^a-1)(\sum_{k=0}^{b-1}2^{ka})=(2^b-1)(\sum_{k=0}^{a-1}2^{kb})$

and then also $latex M_{pq}$ is not prime. So, we are left with all the elements in the sequence of the form $latex M_p$ for $latex p$ a prime number. A quick inspection says that $latex M_2, M_3, M_5, M_7$ are Mersenne primes. But $latex M_{11} = 2047 =23\cdot 89$ which is not prime. So, which Mersenne numbers are prime ?

This is a difficult question, there are big computer grids working in this, trying to find the most spectacular prime. The biggest Mersenne prime known, (and Biggest Prime in general) is $latex 2^{74207281}-1$. which has 22.3 million digits approximately. The way to check it without putting so much effort in the algebraic geometric or number theory rigor is the following:

To check that $latex 2^p -1$ is prime:

Consider the sequence $latex \{ \sigma_1=4, \sigma_2=14,...,\sigma_j=(\sigma_{j-1}^2)-2...\}$
then $latex M_p=2^p-1$ is prime if and only if $latex \sigma_{p-1}\equiv 0 \bmod M_p$.

This is the fastest way known today. is called the Lucas-Lehmer test.
There are other elegant tests (but not necessarily faster) using elliptic curves which I knew its existence when I was talking with Benedict Gross at the conference on L-Functions at Harvard the past year, and in some sense I have to do something similar as part of my PhD program.

The prostituted

Another famous and prostituted sequence is the so called "Fibonacci sequence".

$latex \{ 1,1,2,3,5,8,13,...,F_{n-1}+F_{n-2}, ...\} $

This is famous and is always presented as the building blocks of beauty in the universe. This just an exaggeration, but well, that is another story.

Is known that $latex \lim_{n\to\infty} \frac{F_{n}}{F_{n-1}}=\phi=1.618033...$.

This number $latex \phi$ has the property that squared is equal to $latex \phi+1$ so, is appears as a root of the polynomial $latex x^2 -x -1=0$.
The value of $latex \phi$ can be found when you divide lengths of middle lines in some polygons by the length of the sides. Also in your body, if you divide your height by the distance of your feet to your belly button, and in a lot of parts of our body. This number can be analyzed in a Leonardo da Vinci drawing called "Le proporzioni del corpo umano secondo Vitruvio" which can be seen here.
This is why $latex \phi$ has some kind of mystic and esoteric significance for some people, and that is why is called sometimes The Golden Ratio.

To identify primes in the Fibonacci sequence, there are no good ways. This is mainly because the sequence highly depends on the "addition" operation and not "multiplication", and believe it or not, addition in number theory is a mystery.
A very important Conjecture in mathematics about this mystery, predicts the possible relation between the multiplication and the addition of integers, through its prime factorization, called the abc conjecture, so Fibonacci, is difficult as a problem in terms of primality, but as seen, has more significance in geometry.

The important sequence

Now for the important sequence is this

$latex \{2, 1729, 87539319, 6963472309248, 48988659276962496, 24153319581254312065344...\}$

Do you see it?

Well, is not too easy to see, is called the "Hardy-Ramanujan sequence", if you denote by $latex \tau(n)$ the $latex n^{th}$ element of the sequence, it means that $latex \tau(n)$ can be written in $latex n$ different ways as a sum of two cubes. Fermat Proved that there are infinitely many of these numbers hundreds of years before, but they caught the attention of Hardy by Ramanujan in a very nice story.

When Ramanujan was dying at the hospital in England, Hardy went to visit him. Hardy told him that the number in his taxi to the hospital was a dull, boring number, 1729. Ramanujan said:

'No, Hardy, it is a very interesting number. It is the smallest number expressible as the sum of two cubes in two different ways'

That is why we use the letter $latex \tau$ because these numbers are called "taxicab numbers" because of this story.

The importance of these numbers, is the new theory in arithmetic geometry that arose, which in fact I am very interested personally, and professionally.

Practically Ramanujan discovered in his way of thinking, an integral solution to the equation $latex x^3+y^3=z^3+w^3$ which nowadays is studied over $latex \mathbb{Q}$ and then twisted.

This kind of surfaces are called K3 Surfaces (Kodaira-Kummer-Kahler, smooth minimal complete surface with trivial canonical bundle), there is no smart way of obtaining these numbers other than using this algebraic geometry in these surfaces. An example of these surfaces with a family of rational curves parametrized (the curves may contain taxicab solutions in it) is:

And yeah 1729 has the desired property, that is, $latex \tau(2)$ is a sum of two cubes in only two different ways.

Srnivasa Ramanujan was a human computer, in fact to verify this, we check for the $latex \tau(2)=1729$ and $latex \tau(6)=24153319581254312065344$ can be written as the sum of 2 cubes in 2 and 6 different ways respectively:

$latex \begin{matrix}\tau(2)&=&1729&=&1^3 + 12^3 \\&&&=&9^3 + 10^3\end{matrix}$

...
$latex \begin{matrix}\tau(6)&=&24153319581254312065344&=&582162^3 + 28906206^3 \\&&&=&3064173^3 + 28894803^3 \\&&&=&8519281^3 + 28657487^3 \\&&&=&16218068^3 + 27093208^3 \\&&&=&17492496^3 + 26590452^3 \\&&&=&18289922^3 + 26224366^3\end{matrix}$

The "dumb" sequence

There are plenty other sequences, for example, there are some "dumb" sequences that at the end... they are not so dumb, for example, consider the following sequence:

$latex \{1, 11, 21, 1211, 111221, 312211, 13112221, ... \}$

Do you see the pattern?

Well, the pattern is visual, you begin with "1" and then the following will be the "description of the previous", that is, you ask yourself "What symbols are in the preceding element of the sequence?", and you say "one one" (11) then the next is "two ones" (21), and so on... This sequence is called "look and say sequence".

There are a lot of things you can do in your spare time with this sequence, for example, prove that a "4" cannot appear in any element of the sequence. The number 13112221 is in fact the biggest prime known in this sequence, are there others?

This apparently dumb sequence has an amazing property which transforms it from dumb to analytic and it was due to John Conway.
Consider the $latex k^{th}$ element of that sequence, call it $latex a_k$ , and define $latex \ell(a_k)=$number of digits of $latex a_k$.
Is proved that $latex \lim_{n\to\infty} \frac{\ell(a_k)}{\ell(a_{k-1})}=\lambda=1.303577269034...$. The surprising thing is that $latex \lambda$ is an algebraic number that can be found as a root of a polynomial of degree 71. This was proved by John Conway, for more information, look at wikipedia.

But why?, why you want to find big primes or classify properties of sequences?

I have been questioned plenty of times "Why you want to find big primes?", today was one of these days where a master student asked me.
There is a FALSE answer which is very popular among a lot of people, namely

"It has cryptographic applications, since prime numbers are the basis for today's e-commerce and the development of cryptographic schemes"

This is false, since cryptographic schemes for public key cryptography need prime numbers with no more than 1000 decimal digits (and this is already too long). Using more than 1000 digits maybe would be more secure, but the speed will decrease exponentially, that is why you don't use 1 million bits of security.

Identifying these "cryptographic" prime numbers at random with certain properties (Like being a Sophie-Germain prime) to generate a public key with 4096 bits which has approx 1234 digits, (which is already paranoid for the public techniques of cryptanalysis) takes less than a second in my workstation (try: time openssl genrsa 4096).
So, cryptography is not a good excuse to generate BIG prime numbers, when I say big, I mean thousands of digits, millions.

The answer in my case is easy... To collect them... they are difficult to find, but they are present in a lot of shapes, for example in the last sequence, which elements are prime ? which is the biggest known ? how to identify them with geometric techniques?.

That is how the theory in mathematics is born, with a question regarding classification.

So, finding big primes is difficult, so is valuable, there are only 49 Mersenne Primes and nobody has proved that they are infinite. (but is believed heuristically that they are).

A couple of years ago I wrote here about finding a big prime of the form $latex 3\cdot 8^n -1$ , which I found here, there are a lot of possible primes disguised in infinitely many shapes, you could just define whatever recursive relation and analyze it.

Other people could say to test a big cluster, or to get some money (yes you get money if you break the records). Maybe an analytic number theorist could say To understand more the distribution of prime numbers which is unknown.

Conclusion

So well in conclusion, I think is good to collect primes and analyze sequences. This to find something hidden in the unknown nature of the logic of sequences of natural numbers, since, we don't know yet how the prime numbers arise. There is still a mystery of how the prime numbers are distributed among all the natural numbers, even with quantum computers is hard to find them arbitrarily large, so there are still work to do in mathematics.

For more information of all the known published sequences (yes, whatever you think will be there) go to www.oeis.org, this is the Online Encyclopedia of Integer Sequences.

Eduardo Ruíz Duarte (beck)
twitter: @toorandom

Sunday, July 17, 2016

Algebras de endomorfismos en curvas elípticas (Parte 1 Anillos de Endomorfismos)

Hoy quiero hablar un poco de cómo analizar internamente la estructura de un grupo abeliano, lo cual lo haremos con el grupo abeliano que forma una curva elíptica.

Es decir, a veces para poder entender a un objeto, es indispensable poder entender los morfismos internos del objeto.
En este caso, lo que quiero es poder estudiar al grupo abeliano como un "espacio vectorial" y estudiar las transformaciones que hay en él... y pues con esto podemos incluso hablar de matrices, determinantes, trazas, polinomios característicos y valores propios.

Pero primero en esta parte, le daremos estructura de anillo a los homomorfismos de la curva en si misma, y en la siguiente parte de este post le daremos ya estructura de álgebra.

Recordando muy informalmente curvas elípticas

Recordemos rápidamente el contexto deseado, que son la curvas elípticas de una manera muy informal ya que he hablado antes de esto aquí en mi blog (busca keyword "elíptica").

Las curvas elípticas son objetos muy usados en criptografía ya que proveen con su estructura geométrica una manera diferente de "sumar y restar" que al ésta ser sustituida en los algoritmos de llave pública como Diffie-Hellman que es el más usado en todas las telecomunicaciones en vez de grupos finitos (enteros módulo un número primo usualmente) resulta muy rápido y más seguro. Un ejemplo intuitivo de cómo funciona esta suma es el siguiente:

Lo que estamos viendo aquí es una curva $latex E$ en azul, y dos puntos en ella que son $latex P,Q\in E$ , que su suma está definida como la proyección con el eje $latex x$ del tercer punto de intersección de la linea que los une, que en este dibujo está denotado como $latex P+Q$.

Siempre habrá este tercer punto de intersección si la curva es vista de manera proyectiva, lo cual veremos en la siguiente sección y es justificado por el teorema de Bézout.

Si quisieras calcular el punto $latex P+P$ se hace de manera parecida, sólo que la linea a considerar es la tangente a $latex P$ en la curva $latex E$.

El negativo de un punto es sólo su proyección con el eje $latex x$ es decir si $latex (x,y)\in E$ entonces $latex -(x,y)=(x,-y)$, y sumar $latex P+ (-P)=\infty$ , donde este $latex \infty$ será explicado en la siguiente sección y este $latex \infty$ nos funcionará como el cero (identidad) en la estructura de grupo abeliano que tiene la curva.

Bajo esta operación tenemos que la curva $latex E$ y sus puntos forman un grupo abeliano, es decir, con sus puntos bajo esta operación ya explicada es conmutativa, cada elemento tiene un inverso, es asociativa y cerrada, y lo más importante... es algebraica... es decir, hay fórmulas explícitas que no necesitan funciones raras para definirlas (como raíces cuadradas, logaritmos ni nada).

Entrando un poco más en lo que significa "algebraico" es que su suma se puede definir con simples cocientes de polinomios, a eso me refiero con que algo sea "algebraico", y más allá de ser una curva, esto se le llama variedad abeliana, que es un objeto algebraico dotado de una estructura de grupo con una operación continua bajo cierta topología (Zariski), y que está dada por polinomios cuya operación explícita puede ser vista aquí en wikipedia.

Puedes notar que también puedes calcular "$latex n$ veces el punto $latex P$ , es decir $latex P+P+\ldots +P$ ($latex n$ veces) para todo $latex n\in \mathbb{Z}$ , por lo que significa que podemos "hacer actuar a los enteros en la curva", esto es lo que se le conoce como un $latex \mathbb{Z}$-módulo, y todo grupo abeliano, tiene esta capacidad, por más abstracto que sea el grupo, siempre se puede hablar de "$latex n$ veces aplicar la operación + del gropo".

La definición formal es que son curvas suaves proyectivas de género 1 con un punto distinguido.

Suaves significa que son diferenciables en todos lados y no hay puntos dobles o nodales por ejemplo dos que cumplen la definición vistas en $latex \mathbb{R}\times\mathbb{R}$ serían:

Espacio proyectivo.

Aquí justificamos este símbolo $latex \infty$.
Proyectivo significa que en vez de vivir en espacios vectoriales usales como $latex \mathbb{R}^n$ o $latex \mathbb{F}_{q}$ , vive en un nuevo espacio que ahora definiremos que es $latex \mathbb{P}^n_\mathbb{R}$ o en $latex \mathbb{P}^n_{\mathbb{F}_q}$ respectivamente, donde estos espacios incluyen un punto nuevo, que es el infinito y múltiplos de vectores serán identificadas con un sólo punto.

Este espacio proyectivo lo tengo bien explicado aquí pero a grandes rasgos es un espacio en el cual identificamos todos los múltiplos de un punto como el mismo punto, imaginen un espacio vectorial, donde un vector $latex v$ al aumentar su magnitud por una constante $latex c\neq 0 \in \mathbb{R}$ tenemos que el nuevo vector sería $latex c \cdot v$. Aquí , tenemos que por ejemplo en $latex \mathbb{R}^n$ los puntos $latex v$ y $latex c \cdot v$ serán identificados con el mismo vector, es decir es como una contracción y a este nuevo espacio con esta nueva regla lo denotamos como $latex \mathbb{P}^n_\mathbb{R}$.

El punto $latex [0:0:0]$ no existe, lo cual es una consecuencia de las reglas que acabo de definir, por lo que al interesado en álgebra le serviría la definición que es: $latex \mathbb{P}^n_\mathbb{R}:=\mathbb{R}^{n+1}\setminus \lbrace \overline{0} \rbrace /\sim$ donde la relación $latex \sim$ es que si $latex \overline{u},\overline{v}\in \mathbb{R}^{n+1}$ entonces $latex \overline{u}\sim \overline{v}$ sí y sólo sí $latex \overline{u} = \lambda \overline{v}$ donde $latex \lambda\in \mathbb{R}^{*}$ , es decir esto nos colapsa toda una familia de puntos en $latex \mathbb{R}^{n+1}$ a un sólo punto que denotaremos como $latex [u] \in \mathbb{P}^n_\mathbb{R}$ y tenemos que en este caso $latex [u]=[v]$.

Y de hecho las ecuaciones proyectivas de los ejemplos anteriores serían la ecuación homogénea que hace que los grados de todos los monomios sean iguales $latex y^2z=x^3-xz^2$ así como $latex y^2z=x^3-xz^2 + z^3$ donde ahora vemos que tiene otra variable $latex z$ que nos permitirá agregar otra familia de puntos, por ejemplo, los puntos de la ecuación afín serían los puntos de la forma $latex [x:y:1]$ pero también tenemos que la ecuación también tiene el punto $latex [0:1:0]$ que será el punto racional distinguido, y todas las ecuaciones cúbicas de esta forma lo contienen.

También agregamos un punto muy especial como ya vimos que es usualmente $latex \infty:=[0:1:0]$ que es muy usado en el modelo matemático de lo que significa dibujar "horizontes" en un paisaje, y observando que unas vías del tren no son paralelas, ya que se tocan en el infinito, como lo pueden ver aquí.

Y bueno una curva elíptica de género 1 sin puntos raros, siempre es transformable a una ecuación de la forma $latex y^2 = x^3 + ax+b$ mediante sustitución de variables, a esta forma se le llama forma de Weierstrass.

Género de una curva

El género es un poco más difícil de explicar en este post y con esta informalidad, pero imaginen que tiene que ver con que si la ecuación de la curva la vemos en el espacio complejo... su gráfica será una dona con 1 hoyo... si fueran dos hoyos tendría género 2, por lo que una curva elíptica tiene género 1 y se ve así "intuitivamente" como una función compleja:

A mi me gusta mucho el álgebra así que podemos calcular de hecho géneros de maneras más abstractas gracias aun teorema muy interesante, de Riemann-Roch, que nos dice el género de un objeto geométrico con la dimensión de ciertos espacios de funciones el cual tengo explicado de manera formal aquí.

Estoy trabajando en mi mente un artículo para explicar el teorema de Riemann-Roch sin necesitar álgebra tan dura, con pura teoría de espacios vectoriales, espero pronto tenerlo.

El género cuando no hay puntos raros en la ecuación, se puede calcular con los grados de los monomios en una ecuación.

En términos criptográficos, recuerden que hasta ahora las computadoras no saben cómo manejar a los números reales (ni complejos), de manera continua, es decir, cuando ustedes programan un "float" o "double" sabemos que tienen un "límite" en su representación, por lo que realmente la computadora sólo sabe manejar estructuras finitas.

Estructura finita asociada a las curvas para poder usada en criptografía y computación.

Algo interesante de las curvas elípticas es que su estructura de grupo funciona en cualquier campo... no sólo en los números reales, los complejos o los racionales que son infinitos... sino en campos finitos, como son los enteros módulo p.

De manera básica y para no entrar en detalles tenemos que si escogemos cualquier número primo $latex p$ , tenemos que si $latex a,b\in \mathbb{Z}$ podemos calcular que $latex a\cdot b\equiv c \bmod p$ donde $latex c$ será solamente el residuo de la división al calcular $latex a\cdot b/p $ , este residuo está entre el 0 y $latex p-1$, y todo entero se puede reducir módulo $latex p$ de la misma forma (dividiendo entre $latex p$ y calculando su residuo), este conjunto donde juntas a todos los elementos reducidos en sus respectivas clases se denota como $latex \mathbb{F}_p$ y consta de $latex p$ elementos, del 0 al $latex p-1$.

La suma se define de manera similar y todo elemento tiene un inverso multiplicativo y aditivo, es decir para todo $latex [a]\in \mathbb{F}_p$ tenemos que existe un $latex [a]^{-1}\in \mathbb{F}_p$ tal que $latex [a]\cdot [a]^{-1} = [1]$ , por ejemplo en $latex \mathbb{F}_7$ tenemos que el inverso multiplicativo de $latex [3]$ es $latex [5]$ ya que $latex 5\cdot 3=15$ y $latex 15\equiv 1\bmod 7$ por lo que podemos decir abusando de la notación que "dividir entre $latex [3]$" módulo $latex 7$ equivale a multiplicar por $latex [5]$.
Con la suma el negativo de $latex [a]\in \mathbb{F}_p$ es de hecho $latex [p-1]\cdot [a]$ ya que $latex (p-1)\cdot a = pa-a \equiv -a \bmod p$ , por ejemplo en $latex \mathbb{F}_7$ tenemos que $latex -[3]= (p-1)\cdot 3 = 6\cdot 3 = 18 \equiv 4 \bmod 7$ , por lo que $latex -[3] \equiv [4]$ y es fácil verificarlo ya que al sumar con su inverso aditivo al 3 tenemos que $latex -[3] + [3] = [4] + [3] \equiv 0 \bmod 7$ (ya que no deja residuo).

Se pueden definir campos para cada potencia de $latex p$ es decir $latex \mathbb{F}_{p^n}$ pero eso queda de tarea para ustedes investigar cómo se hace.

Con esto tenemos que si evaluamos todas las posibles soluciones de una curva elíptica bajo esta aritmética, tenemos que ya no se ve como una "curva", pero realmente lo es en el sentido algebraico, y se ve por ejemplo $latex y^2=x^3 - 4x+6$ sobre $latex \mathbb{F}_{197}$ así:

Si implementan la regla de adición como en wikipedia, donde las divisiones que vean en las funciones que definen la suma de dos puntos las interpretan como "calcular el inverso multiplicativo" (lo cual se hace con el algoritmo de euclides extendido), una consecuencia del teorema fundamental del álgebra les dirán que las "lineas entre dos puntos" en aritmética modular también funcionan, esto es de manera informal pero sólo quiero meter la idea, en posts anteriores formalizo esto.

Grupos de homomorfismos en grupos abelianos (curvas elípticas en este caso)

Recordemos que un homomorfismo entre dos grupos (o dos curvas) $latex G_1$ y $latex G_2$ es un mapeo que respeta la estructura de grupo en cada uno. Es decir si $latex \langle G_1,+\rangle$ y $latex \langle G_2,\oplus\rangle$ son sus respectivas operaciones. tenemos que $latex \alpha \in Hom(G_1,G_2)$ es un homomorfismo entre $latex G_1$ y $latex G_2$ , es decir $latex \alpha:G_1\rightarrow G_2$ si para $latex P,Q\in G_1$

$latex \alpha(P+Q)=\alpha(P)\oplus \alpha(Q)$

También tenemos que $latex \alpha$ también manda infinitos de un grupo a infinitos del otro.

$latex \alpha(\infty_{G_1})=\infty_{G_2}$.

Algo muy interesante es que el conjunto de todos los homomorfismos, es decir $latex Hom(G_1,G_2)$ forma un grupo abeliano, es decir, puedes sumar los homomorfismos, noten que ya no estamos hablando de los puntos de la curva solamente o de elementos de grupos en general, es decir si $latex \alpha,\beta\in Hom(G_1,G_2)$ definimos bajo la operación nueva de homomorfismos $latex \boxplus$ una nueva función $latex \alpha\boxplus \beta\in Hom(G_1,G_2)$ :

$latex (\alpha\boxplus\beta):G_1\rightarrow G_2$
$latex P\mapsto \alpha(P)\oplus \beta(P)$

Es fácil demostrar que $latex \alpha\boxplus \beta$ también respeta estructura de grupo en $latex G_2$ (es decir que es un homomorfismo) , y pues tenemos que la identidad es el morfismo $latex [0]\in Hom(G_1,G_2)$ que manda todo al 0 del grupo $latex G_2$.
También para que $latex Hom(G_1,G_2)$ sea grupo bajo la operación $latex \boxplus$, necesitamos un inverso, es decir, si $latex \alpha\in Hom(G_1,G_2)$ existe un $latex -\alpha \in Hom(G_1,G_2)$ y de hecho pueden ver que este es simplemente $latex -\alpha:G_1\rightarrow G_2$ que mapea $latex P\mapsto \alpha(-P)$ por lo que $latex \alpha\boxplus -\alpha$ está definido como $latex (x,y)\mapsto \alpha(x,y)\oplus \alpha(x,-y)$ y esto y si $latex \alpha(P)=Q\in G_2$ tenemos que es igual a $latex Q\oplus -Q=\infty_{G_2}$ , por lo que mapea al cero de $latex G_2$ y $latex (\alpha\boxplus -\alpha)(P)=\infty_{G_2}$ para todo $latex P\in G_1$ por lo que $latex \alpha\boxplus -\alpha=[0]\in Hom(G_1,G_2)$.

De manera similar se puede demostrar que $latex \boxplus$ es asociativa, por lo que $latex Hom(G_1,G_2)$ es un grupo.

También como mencionamos hace rato, todo grupo abeliano tiene estructura de $latex \mathbb{Z}$ módulo... es decir, en este ejemplo podemos hablar de aplicar en $latex Hom(G_1,G_2)$ la operación $latex \boxplus$ varias veces a sus elementos, (en este caso homomorfismos entre los dos grupos) es decir $latex n\alpha$ simplemente será:

$latex n\alpha:G_1\mapsto G_2$
$latex P\mapsto \alpha(P)\oplus\ldots \oplus \alpha(P)=\bigoplus_{k=1}^{n} \alpha(P)$

Por lo que decimos que $latex Hom(G_1,G_2)$ tiene estructura de $latex \mathbb{Z}$ módulo.

Anillos de Endomorfismos entre grupos abelianos.

Este es un caso especial de $latex Hom(G_1,G_2)$ , ahora imaginen que $latex G_1=G_2$ por o que lo denotaremos simplemente por $latex G$ , y vamos a definir que $latex End(G):=Hom(G,G)$ pero adicionalmente para que sea un anillo tenemos que la operación multiplicación de endomorfismos $latex \alpha,\beta\in End(G)$ es $latex \alpha\circ \beta$ , es decir la composición entre ellos como funciones, es decir $latex (\alpha\circ\beta)(P)=\alpha(\beta(P))$.

Como tenemos que $latex \alpha,\beta Hom(G,G)$ está bien definido $latex \alpha\circ \beta:G\rightarrow G$.

La identidad bajo esta multiplicación es la función identidad , es decir, la que manda un punto a sí mismo, y la denotamos como $latex [1]\in End(G)$.

Ustedes pueden verificar que la operación $latex \circ$ es distributiva con $latex \boxplus$ , es decir que si $latex \alpha,\beta,\gamma\in End(G)$ y $latex P\in G$:

$latex (((\alpha\boxplus\beta)\circ \gamma)(P)=((\alpha\circ \gamma)\boxplus (\beta\circ \gamma))(P)$

y usando que $latex \gamma$ también es in homomorfismo.

$latex (\gamma\circ(\alpha\boxplus \beta))(P)=((\gamma\circ \alpha)\boxplus (\gamma\circ\beta))(P)$

Es fácil ver que por default, en $latex End(G)$ hay una infinidad de endomorfismos, de hecho para toda $latex n\in \mathbb{Z}$ tenemos el mapeo $latex [n]\in End(G)$ el cual definimos como:

$latex [n]:G\mapsto G$
$latex P\mapsto P+\ldots +P$ (n veces)

Donde $latex +$ es la operación del grupo $latex G$

Entonces es fácil ver que de hecho, en un nivel más alto hay otro homomorfismo de anillos entre los enteros y $latex End(G)$ , es decir:

$latex \Psi:\mathbb{Z}\rightarrow End(G)$
$latex n\mapsto [n]$

Y es homomorfismo ya que es fácil verificar que $latex \Psi(n+m)=\Psi(n)\oplus \Psi(m) = [n] \boxplus [m]=[n+m]$ y respeta la estructura de anillo ya que $latex \Psi(n\cdot m)=[n]\circ[m]=[nm]$.

Con esto tenemos mucho para argumentar que $latex \mathbb{Z}$ es un subanillo de $latex End(G)$ ya que $latex End(G)$ no tiene torsión, es decir, el aplicar $latex n$ veces cualquier endomorfismo diferente de $latex [0]$ , nunca nos dará $latex [0]$ y el mapeo entre $latex \mathbb{Z}$ y $latex End(G)$ es inyectivo.

Otra cosa es que $latex [n]\circ \alpha = \alpha \circ [n]$ es decir conmuta, y ustedes lo pueden demostrar fácilmente (pero no siempre es así entre cualquiera $latex \alpha,\beta\in End(G)$, que es cuando en el siguiente post definiremos que $latex End(G)$ está equipado con multiplicación compleja.

En el caso en que se esté trabajando sobre un campo finito en el grupo de una curva elíptica $latex E$ como $latex \mathbb{F}_q$ existe otro endomorfismo muy famoso que es usado mucho en investigación en criptografía , que es el endomorfismo de Frobenius, $latex \phi\in End(E)$ que equivale a $latex (x,y)\mapsto (x^q,y^q)$ , es decir, elevar a la $latex q$ cada coordenada de un punto en la curva usando la reducción en el campo finito $latex \mathbb{F}_q$. Este homomorfismo también conmuta.

Otro remark es que en una curva elíptica $latex \alpha,\beta\in End(E)$ son suprayectivos y por consecuencia $latex \alpha\circ\beta$ también lo es, por lo que jamás será el homomorfismo $latex [0]$ , esto nos dice que bajo la multiplicación del anillo $latex End(E)$ dada por la composición, nunca obtenemos el $latex [0]\in End(E)$ por lo que no existen múltiplos de 0, y $latex End(E)$ es un dominio entero, por lo que pueden usar las reglas de cancelación usuales entre sus elementos tanto por la izquierda como por la derecha.

Espero les haya gustado, la parte 2 la haré pronto, donde extenderemos la estructura de $latex \mathbb{Z}$-módulo de $latex End(E)$ a un $latex \mathbb{Q}$-módulo a través de un tensor.

Eduardo Ruíz Duarte (beck)
twitter: @toorandom

Wednesday, November 18, 2015

Motivación en esquemas, gavillas, espacios localmente anillados, topología de Zariski

Antes que todo, hace una semana se cumplió un año del fallecimiento del que fue para mí el máximo matemático moderno del siglo XX, Alexander Grothendieck (aquí su obituario), es por eso que escribo este post el cuál tiene que ver con la teoría que él desarrolló que ahora es la piedra angular de la geometría algebraica y ha servido para demostrar muchas cosas incluyendo las conjeturas de Weil en cuanto a las propiedades de la función zeta de Riemann de curvas sobre campos finitos, de hecho él demostró que esta función es racional.

Antes de entrar en el post, dejo otro PDF de interés de una chica estudiante de Matemáticas que fue a visitarlo un año anes de morir, donde relata su experiencia la cual es un poco extraña

http://www.math.utah.edu/~honigs/Grothendieck.pdf

De la teoría que desarrolló Grothendieck tratará este post, daré una motivación, ejemplos y luego entraré de lleno a definir con base a la primera intuición lo que es un esquema en el sentido de Grothendieck, falta muchísimo para que este post sea.. "aceptable", de hecho jamás hablaré de espacios proyectivos, por lo que sólo me limitaré a esquemas afines, también cuando hablo de un anillo, éste es conmutativo con unidad y los campos son algebraicamente cerrados.

Recuerdo que cuando estaba estudiando mi maestría en el IMATE-UNAM mi colega y amigo Ángel Zaldivar me decía que pusiera más énfasis en la teoría de esquemas, pero yo ya iba encarrerado con la geometría algebraica clásica para hacer mi proyecto que fue un artículo que encontraba fórmulas explícitas en la adición de la jacobiana de una curva hiperelíptica de género 2 así como el modelo afín no singular de la jacobiana embebida:
a en $latex \mathbb{A}^4$ lo cual puedes ver aquí (DOI) .

La teoría de Grothendieck, dota de muchísima estructura a un objeto, un anillo, pudiéndolo analizar a simple vista, y a nivel "atómico", haciéndole relucir su geometría... por más abstracto que sea, es lo que trataremos también de construir.

Ahora que estoy haciendo mi doctorado, entendí por qué Ángel me decía eso, y bueno, he estudiado y usado ya esquemas para algunos resultados y por eso quise hacer una pequeña exposición muy elemental, básica y espero motivante (aunque no rigurosa).

Motivación inicial:

Empecemos con algo fácil.

¿Cuál es la diferencia entre los conjuntos $latex \lbrace V(x) \cap V(y-x^2)\rbrace$ y $latex \lbrace V(y) \cap V(y-x^2) \rbrace$?

Recuerden que si tenemos un conjunto de polinomios $latex S\subseteq k[x_1,...,x_n]$ entonces los ceros de los polinomios en $latex S$ son:

$latex V(S):=\lbrace (a_1,...,a_n)\in \mathbb{A}^n(k) : f(a_1,..,a_n)=0$ $latex \forall f\in S\rbrace $

Este $latex S$ podría ser un ideal de $latex k[x_1,...,x_n]$ y de hecho existe un operador dual a $latex V$ que nos da el ideal asociado a un conjunto de puntos:

$latex I(V):= \lbrace f\in k[x_1,...,x_n] : f(a_1,...,a_n)=0$ $latex \forall (a_1,...,a_n)\in V\rbrace$

Hay un teorema muy importante que marcó el inicio de todo esto desde mi punto de vista que es el teorema Nullstellensatz que en alemán significa "teorema de los ceros" de David Hilbert que dice que:

Si $latex J\subset \bar{k}[x_1,...,x_n]$ es un ideal, entonces

$latex I(V(J))=\sqrt{J}=\lbrace f\in k[x_1,...,x_n]: f^n\in J$ para algún $latex m\geq 1\rbrace$

Regresando al ejemplo , tenemos la intersección de la línea vertical $latex x=0$ que es justamente el eje y, con la parábola $latex y-x^2=0$ que nos da sólo el punto $latex (0,0)$ , y por otro lado, la linea horizontal $latex y=0$ que es el eje x intersectado con la misma parábola, en ambos casos el único punto de intersección es el $latex (0,0)$ , es decir como conjuntos son lo mismo, ¿cuál es la diferencia? , si ven las gráficas en $latex \mathbb{R}^2$ verán

La diferencia está en el álgebra detrás, la tangencia en la gráfica derecha se estudia a través de su álgebra afin asociada que es en este caso $latex k[x,y]/(y-x^2,y)\cong k[x]/(x^2)$ sin embargo , para la intersección transversal de la parábola con $latex x=0$ tenemos que $latex k[x,y]/(y-x^2,x)\cong k$, obviamente el primero no es un campo porque tiene un elemento nilpotente que es $latex x$, el segundo es isomorfo al campo base, y este ejemplo da una idea de una teoría que podría diferenciar en este caso cómo encontrar tangencia sin recurrir directamente a la geometría, lo que te permitirá analizar la geometría algebraicamente incluso de espacios que no son "visibles" de manera intruitiva (espacios de funciones, variedades sobre campos finitos, campos no arquimedianos, et cétera).

Geometría algebraica pre-esquemas, con sabor a esquemas (Primera Parte)

Si tenemos una curva algebraica plana y queremos estudiarla como las anteriores, podemos primero pensar en una topología para ésta, así que las siguientes definiciones son importantes.

Definición: Sea $latex V\in \mathbb{A}^n(k)$ un conjunto algebraico (es decir, está dado por uniones, intersecciones de ecuaciones polinomiales como vimos en el ejemplo, y puedes hacer que $latex V$ sea una curva elíptica o una parábola) entonces su anillo de coordenadas es $latex k[V]=k[x_1,...,xn]/I(V)$ , los elementos de este anillo se llaman funciones regulares

Recuerden que una variedad $latex X$ es irreducible si no es la unión de variedades, es decir que $latex X\neq Y\cup Z$ donde $latex Y,Z$ no son triviales, esto es fácil verlo algebraicamente ya que si te fijas en las ecuaciones que definen una variedad que no es irreducible, entonces es factorizable, por ejemplo si consideras $latex f(x,y)=x^3 y-x^2+x y^3-x y-y^2+1$, es fácil ver que no es irreducible, ya que es la unión de dos conjuntos algebraicos:

Es una parábola y un círculo en la misma ecuación... y si factorizamos tenemos que $latex f(x,y)=(xy-1)(x^2+y^2-1)$ , es decir, el polinomio no es irreducible porque lo podemos factorizar... y por lo tanto podemos intuir (hay que probarlo) que si $latex f,g\in k[x_1,...,x_n]$ entonces $latex V(fg)=V(f)\cup V(g)$, es decir, el producto de dos ecuaciones polinomiales, tiene como ceros, la unión de los ceros de cada una de las ecuaciones polinomiales por separado.

Regresando al anillo de coordenadas es el anillo de polinomios en $latex n$ variables módulo el ideal de polinomios que se anulan en los puntos de $latex V$ , los elementos de este anillo puedes verlos como funciones $latex f:V\rightarrow k$.

Una subvariedad $latex W$ de $latex V$ es aquella que está contenida en $latex V$ is $latex W$ es algebraica, por ejemplo $latex V(x)\subset V(xy)$ , geométricamente $latex x=0$ es una línea vertical y $latex x y = 0$ tiene como gráfica los dos ejes coordenados, y la linea está contenida en la "cruz" siendo ambos definidos por ecuaciones polinomiales (algebraicos).

Topología de Zariski

Ahora, la topología donde se trabaja esto inicialmente es la de Zariski, y definimos:

Definición: Sea $latex k$ un campo y $latex X\subset \mathbb{A}^n(k)$ , es un cerrado de Zariski si $latex X$ es algebraico (es decir, un conjunto de puntos definido por polinomios), de manera dual tenemos que un abierto de Zariski es de la forma $latex U=\mathbb{A}^n(k)\setminus X$ donde $latex X$ es algebraico.

Ejemplo 1: Considera $latex \mathbb{A}^1(k)$ , entonces un cerrado ahí está dado por cualquier subconjunto de la recta afín $latex \mathbb{A}^1(k)$ que pueda ser expresado por polinomios en una variable, como sabemos que todo polinomio tiene un número finito de raíces, entonces los cerrados corresponden a todos los subconjuntos de la recta que son finitos (los abiertos son conjuntos infinitos), aquí tenemos un ejemplo de topología cofinita.

Ejemplo 2:
Si te subes a dimensión dos, veremos que aquí es diferente, por ejemplo, un punto es un cerrado, ya que intuitivamente lo puedes ver como la intersección de dos rectas, un círculo también es cerrado ya que se puede expresar como el conjunto de ceros de $latex x^2+y^2-1$ , y los abiertos aquí pues son muy grandes, los complementos de estos ejemplos son super densos , de hecho esta topología no es Hausdorff (no puedes encontrar dos abiertos que no se intersecten).

Y para qué queremos esta topología tan rara? ,

Localización:

Un punto nos da un ideal, es decir si $latex p=(a_1,...,a_n)\in V\subset \mathbb{A}^n(k)$ entonces $latex I(\lbrace p\rbrace)=(x-a_1,...,x-a_n)$, estos ideales pueden probar que son máximos, y por cada punto corresponde un ideal máximo cuando el campo base es algebraicamente cerrado, cuando no, hay teoría de Galois de por medio que hablaremos después,

Definición: Sea $latex k[V]:=k[x_1,...,x_n]/I(V)$ un anillo de coordenadas , tenemos que su campo de fracciones asociado es:

$latex k(V):=\lbrace f/g: f,g\in k[V] , g\neq 0\rbrace/\sim$

Donde $latex \sim$ es la relación de equivalencia usual de fracciones, o sea $latex a/b \sim c/d$ si $latex a\cdot c-b\cdot d=0$, es decir que su diferencia sea 0 en $latex k[V]$ lo cual significa que $latex ac-bd\in I(V)$

Definición: Sea $latex k[V]:=k[x_1,...,x_n]/I(V)$ un anillo de coordenadas y $latex p\in V$ entonces la localización de $latex p$ en $latex k[V]$ es:

$latex k_{p}[V]:=\lbrace f/g \in k(V) : g(p)\neq 0 \rbrace$

Hasta aquí ya tenemos un anillo para cada punto de una variedad $latex V$ , ahora... este anillo localizado en $latex p$ tiene un sólo ideal máximo, el cual pueden demostrar que es $latex m_p=\lbrace f\in k_{p}[V] : f(p)=0\rbrace$

Toda esta estructura que le hemos dado a una variedad dada por polinomios se puede generalizar, y a partir de aquí está todo lo anterior para cualquier anillo, podemos ver a los elementos del anillo conmutativo que queramos como si fueran funciones sobre un nuevo espacio $latex S p e c R$ que será el tema principal de este post (esquema afín).

Definición: Sea $latex R$ un anillo conmutativo, definimos el espectro primo de $latex R$ como:

$latex Spec R:=\lbrace \mathfrak{p} : \mathfrak{p}\subset R$ es un ideal primo $latex \rbrace$

Observación-definición: Vamos a ver cómo ver los elementos de un anillo $latex R$ como funciones evaluadas en los puntos de nuestro nuevo espacio topológico $latex S p e c R$ , para que esto tenga sentido.

Sea $latex f\in R$ y $latex \mathfrak{p}\in Spec R$ (un ideal primo), entonces $latex f(\mathfrak{p})=\bar{f}\in R/\mathfrak{p}$ donde $latex \bar{f}$ es la reducción de $latex f$ módulo $latex \mathfrak{p}$.

Este espectro tan inocente que se ve, es un espacio localmente anillado (es decir, con una gavilla de anillos asociada, lo cual veremos más adelante), y de hecho, decimos que bajo la topología de Zariski $latex Y\subset Spec R$ es cerrado , si existe un ideal $latex \mathfrak{a}\subset R$ tal que:

$latex Y=V(\mathfrak{a}):=\lbrace \mathfrak{p}\in Spec R: \mathfrak{a}\subset \mathfrak{p}\rbrace$

Esto nos permite rápidamente comprender la definición de cerrado anterior ya que si $latex f\in R$ y $latex f(\mathfrak{p})=0$ para algún ideal primo $latex \mathfrak{p}\in Spec R$ es porque $latex f\in \mathfrak{p}$

Medítalo un poco, imagínate que otra vez $latex R=k[x_1,..,x_n]/I(V)$ , acuérdate de la acotación que hicimos, sobre los ideales asociados a puntos , estos son primos (máximos) i.e. pertenecen a $latex S p e c R$

Podemos redefinir a los cerrados (conjuntos algebraicos) de $latex S p e c R$ , sea $latex \mathfrak{a}\subset R$ un ideal cualquiera, entonces:

$latex Y=V(\mathfrak{a}):=\lbrace \mathfrak{p}\in Spec R: f(\mathfrak{p})=0$ $latex \forall f\in \mathfrak{a}\rbrace=\lbrace \mathfrak{p}\in Spec R : \mathfrak{a}\subset \mathfrak{p} $

Esto creo que ya tiene más lógica, para poder localizar en$latex S p e c R$ tomemos en cuenta que si $latex f \in R$

$latex V(f)=\lbrace \mathfrak{p}\in Spec R : f(\mathfrak{p})=0\rbrace$

y el abierto asociado a $latex f\in R$ es el complemento de $latex V(f)$ en $latex S p e c R$

$latex D(f)=\lbrace \mathfrak{p}\in Spec R: f(x)\neq 0 \rbrace$

A este último a veces le dicen dominio de f por eso la letra $latex D$ , pero nosotros le llamaremos abierto de $latex f$.

Asociandole a cada abierto $latex U \subset X$ un anillo

Regresemos al ejemplo donde $latex R=k[V]$ , donde $latex V$ es una variedad sobre $latex k$ , es decir, trabajamos en su anillo de coordenadas, sea $latex p=(a_1,...,x_n)\in V$, consideremos su ideal asociado que es $latex \mathfrak{p}=(x_1-a_1,...,x_n-a_n)$

$latex U_\mathfrak{p}:=D(\mathfrak{p})=\lbrace x\in V : f(x)\neq 0$ $latex \forall f\in \mathfrak{p}\rbrace$

Entonces tenemos que a $latex U$ le podemos asociar el siguiente anillo llamado anillo de funciones regulares en $latex U$

$latex k[U_\mathfrak{p}] := \lbrace f/g\in k(V) : g\notin \mathfrak{p} \rbrace$

Esto es justamente la localización en el punto $latex \mathfrak{p}\in Spec$ $latex k[V]$ , es decir:

$latex k[U_\mathfrak{p}] = k_\mathfrak{p}[V]$

Ejemplo:

Sea $latex R=\mathbb{Z}$ , entonces $latex Spec\mathbb{Z}=\lbrace p\mathbb{Z} : p$ es primo $latex \rbrace$, $latex V(5)$ consta de todos los ideales primos que tienen al 5 como elemento, o sea $latex 5\mathbb{Z}$, $latex V(6)$ constaría de $latex \lbrace 3\mathbb{Z}, 2\mathbb{Z}$, $latex V(1)$ es vacío que es cerrado y abierto, et cétera, si localizamos en el ideal $latex (p)\subset \mathbb{Z}$ tenemos que:

$latex \mathbb{Z}_{(p)}=\lbrace a/b \in \mathbb{Q} : b\notin (p) \rbrace$

Justamente la localización es crucial para toda la teoría de esquemas, ya que como acaban de notarlo, a cualquier anillo le dimos una topología, y a cada abierto le asociamos un anillo, por lo que decimos que $latex S p e c R$ es un espacio localmente anillado. , la formalidad de esto es con una cosa que se llama gavilla estructural asociada al anillo, y veremos como construir esto en general.

Gavillas, esquemas en general para cualquier espacio topológico (Segunda parte).

Despues de todo lo anterior ahora viene la parte formal de la construcción anterior que fue un poco un revoltijo.

Primero para poder empezar necesitamos comprender lo que es una gavilla (Sheaf en inglés) pero para entender una gavilla, debemos comenzar con lo que es una pre-gavilla la cual con propiedades adicionales nos dará la gavilla, las gavillas son interesantes porque podemos conservar datos de una espacio topológico de manera organizada y tener una estructura más rica en álgebra donde podemos explotar más las propiedades de un objeto para poder estudiarlo.

Definición: Sea $latex X$ un espacio topológico, una pregavilla $latex \mathcal{F}$ de anillos en $latex X$ consiste en los siguientes objetos

1) Para todo abierto $latex U\subseteq X$ le asociamos un anillo $latex \mathcal{F}(U)$
2) Para toda inclusión $latex V\subseteq U$ de subconjuntos abiertos de $latex X$, tenemos el morfismos restricció $latex \rho_{UV}:\mathcal{F}(U)\rightarrow \mathcal{F}(V)$

Este morfismo cumple:

i) $latex \mathcal{F}(\emptyset) = 0$
ii) $latex \rho_{UU}$ es el mapeo identidad de $latex \mathcal{F}(U)\rightarrow \mathcal{F}(U)$
iii) Si $latex W\subseteq V\subseteq U$ son tres abiertos de $latex X$ entonces $latex \rho_{UW}=\rho_{VW}\circ \rho_{UV}$ , es decir el diagrama triangular de los mapeos conmuta.

Estas pregavillas se pueden definir no sólo anillos sino a grupos abelianos, u objetos en cualquier categoría abeliana.

Vamos a decir que si $latex \mathcal{F}$ es una pregavilla en $latex X$ entonces $latex \mathcal{F}(U)$ serán las secciones de la pregavilla $latex \mathcal{F}$ en el abierto $latex U$, a veces estas secciones son denotadas como $latex \Gamma(U,\mathcal{F})$ que son los anillos $latex \mathcal{F}(U)$ , también es común en la literatura que se escriba $latex s\mid_v:=\rho_{UV}(s)$ si $latex s\in \mathcal{F}(U)$ que es la restricción usual de morfismos en la categoría en cuestión, en este caso la de anillos.

Ahora vamos a definir una gavilla (sheaf) la cual , es una pregavilla, pero le pediremos más cosas relacionadas con datos locales de las secciones para poder identificarlas

Definición: Una pregavilla $latex \mathcal{F}$ sobre un espacio topológico $latex X$ es una gavilla si satisface las siguiente condicion sobre sus secciones:

iv) Sea $latex U$ un abierto de $latex X$ y $latex \lbrace V_i \rbrace$ una cubeirta abiera de $latex U$, si $latex s\in\mathcal{F}(U)$ es un elemento tal que $latex s\mid_V=0$ $latex \forall i$ $latex \Rightarrow s=0$ , y si $latex s_i \in \mathcal{F}(V_i)$ $latex \forall i$ con la propiedad de que $latex \forall i,j$ $latex s_i|_{V_i\cap V_j}=s_j\mid_{V_i\cap V_j}$ entonces existe otro elemento $latex s\in \mathcal{F}(U)$ tal que $latex s\mid_{V_i}=s_i$ $latex \forall i$

Bueno, mucha abstracción, veamos un ejemplo de algo que hayamos usado en este blog, el cual ma ayuda mucho a aterrizar conceptos a la hora de no estar familiarizado con algo.

Ejemplo (repitiendo la primera parte): Sea $latex X$ una variedad sobre un campo $latex k$, recordemos que para cada abierto de la variedad usando la topología de Zariski, se cumple que estos no son puntos de algún polinomio restringido a $latex X$ y definimos $latex O(U)$ como el anillo de funciones regulares en $latex U$ , es decir son los cocientes de polinomios cuyo denominador está bien definido en el abierto $latex U$ y está identificado con todas las funciones regulares que van de $latex U\rightarrow k$ y definimos que para todo $latex V\subseteq U$ $latex \rho_{UV}:O(U)\rightarrow O(V)$ la restricción usual de morfismos , entonces decimos que $latex O$ es una gavilla de anillos en $latex X$ , con esto es claro que es una pregavilla, para verificar la condición iv sólo hay que notar que la función 0 también es localmente 0, y una función que es regular localmente en cada anillo, también es regular globalmente, y llamamos a $latex O$ la gavilla de funciones regulares en $latex X$
Para un mejor tratado de este ejemplo con lujo de detalle, ver otro post anterior aqui.

Ahora necesitamos comenzar a definir objetos locales en la gavilla.

Definición: Si $latex \mathcal{F}$ es una pregavilla en $latex X$ y $latex P$ es un punto de $latex X$ , decimos que el tallo (stalk en inglés) $latex \mathcal{F}_P$ de $latex \mathcal{F}$ en $latex P$ es el límite inverso de los anillos $latex \mathcal{F}(U)$ para todo abierto $latex U$ que contiene $latex P$ via los mapeos de restricción $latex \rho$, es decir:

$latex \mathcal{F}_P= \varinjlim_{P\in U} \mathcal{F}(U)$

Esta definición intuitivamente, lo que nos dice, es que vamos a encontrar el anillo de cierto modo más chico de todos los abiertos $latex U\subseteq X$ que contienen a $latex P$, esto les tiene que sonar a localización.

Definición: Una pregavilla $latex \mathcal{F}$ en un espacio topológico $latex X$ es una gavilla si para todo $latex U\subset X$ y toda cubierta $latex U=\bigcup_{\lambda\in \Lambda} U_\lambda$ de abiertos $latex U_\lambda\subset X$ sucede que:

1. Si $latex f,g\in \mathcal{F}(U)$ satisfacen $latex f\mid_{U_\lambda}=g\mid_{U_\lambda}$ para todo $latex \lambda\in\Lambda$ entonces $latex f=g$
2. Si $latex f_\lambda\in \mathcal{F}(U_\lambda)$ con $latex \lambda\in \Lambda$ satisface que $latex f_\lambda\mid_{U_\lambda\cap U_\sigma}=f_{\sigma}\mid_{U_\lambda\cap U_\sigma}$ para todo $latex \lambda,\sigma\in \Lambda$, entonces existe un $latex f\in \mathcal{U}$ tal que $latex f\mid_{U_\lambda}=f_\lambda$ para toda $latex \lambda\in\Lambda$ , la cual será única, por (1) , esta condición se llama de "pegado" (gluing condition), es decir, una función que coincide en los overlaps de los abiertos en toda la cubierta, puedes encontrar otra que pasa por allí y es única.

Definición: Un morfismo $latex \Phi$ entre dos gavillas $latex \mathcal{F},\mathcal{G}$ definidas sobre el espacio topológico $latex X$ , $latex \Phi:\mathcal{F}\rightarrow \mathcal{G}$ es un morfismo functorial en el sentido de morfismos entre la categoría de abiertos de $latex X$ a la categoría de anillos (de coordenadas si quieren aterrizar muy rapido, pero todo esto es en general) es decir, $latex \Phi$ consiste en una colección de morfismos

$latex \phi_U:\mathcal{F}(U)\rightarrow \mathcal{G}(U)$ con $latex U\subset X$ abierto. que son compatibles con los morfismos de restricción , es decir si $latex U\subset V\subset X$

$latex \mathcal{F}(V)\xrightarrow{\phi_V} \mathcal{G}(V)$ y $latex \mathcal{F}(U)\xrightarrow{\phi_U} \mathcal{G}(U)$ entonces, esto visto como un diagrama conmuta con los mapeos de restriccion , en este caso $latex \mathcal{F}(V)\xrightarrow{\rho_{U}^V} \mathcal{U}$ y $latex \mathcal{G}(V)\xrightarrow{\rho_U^{V}} \mathcal{G}(U)$
Añadir leyenda

Para terminar, ya con los esquemas, terminamos con la estructura global que guarda toda la información del espacio $latex X$, que es la de espacio localmente anillado y concluimos con la definición de esquema afín.

Definición: Un espacio localmente anillado es un par $latex (X,O_X)$ donde $latex X$ es el espacio topológico y $latex O_X$ es una gavilla de anillos en $latex X$, la cual le llamamos gavilla estructural de $latex X$, tal que los tallos $latex O_{X,x}$ para cada $latex x\in X$ son anillos locales (con un sólo ideal máximo, como los del ejemplo en la primera sección).

Un morfismos de espacios localmente anillados $latex (X,O_X)\rightarrow (Y,O_Y)$ es un par $latex (f,f^{\dagger})$ donde $latex f:X\rightarrow Y$ es un mapeo continuo entre los espacios topológicos, y $latex f^{\dagger}:O_Y\rightarrow f_{*}(O_X)$ es un morfismos de gavillas como lo definimos anteriormente en $latex Y$ , donde $latex f_{*}(O_X)$ es la gavilla en $latex Y$ que está dada por $latex V\mapsto O_X(f^{-1}(V))$ y con sus respectivos morfismos de restricción , por lo que $latex f^{\dagger}$ es el sistema de homomorfismos de anillos dado por:

$latex f^{\dagger}(V):O_Y(V)\rightarrow O_X(f^{-1}(V))$ tal que $latex V\subset Y$ es abierto.

Falta una condición para que un espacio sea localmente anillado.

Un mapeo $latex \psi:A\rightarrow B$ es un mapeo local si $latex A,B$ son anillos locales y si $latex m_A\subset A$ y $latex m_B\subset B$ son sus respectivos ideales máximos $latex \psi(m_A)\subset m_B$

Entonces para que $latex (X,O_X)$ sea localmente anillado, también tiene qAñadir leyendaue cumplir la condición de que el mapeo $latex f^{\dagger}$ sea local entre todos los tallos, es decir que $latex f^{\dagger}_x:O_{Y,f(x)}\rightarrow O_{X,x}$ para todo $latex x\in X$ sea local.

Definición final: Un esquema afín es un espacio localmente anillado $latex (X,O_X)$ tal que existe un isomorfismos de espacios localmente anillados entre $latex (X,O_X) \xrightarrow{\sim} (Spec A, O_{Spec A})$ , para algún anillo $latex A$, los morfismos entre esquemas afines son como los definimos anteriormente, morfismos de espacios localmente anillados.

Como vimos anteriormente, esto es muy abstracto, pero si quieres darle forma, comienza usando un álgebra afin conocida, como anillo, como un anillo de coordenadas, y de ahí comienza a darle la estructura de esquema , con todas las definiciones que vimos en la primera parte.

Todo esto fue muy rápido, lo siento, por la falta de rigor, pero no tengo tanto tiempo y realmente sí quería hacer esto, esto se lo debemos a Alexander Grothendieck

1928-2014

Eduardo Ruíz Duarte (beck)
Email: toorandom at g mail dot c om
twitter: toorandom
PGP: FEE7 F2A0

Tuesday, June 02, 2015

Sobre Campo de funciones de superficie de Kummer de una curva de género 2

Estoy estudiando un campo de funciones especial para mi investigación que es un subcampo del campo de funciones de la superficie de Kummer de la jacobiana de una curva hiperelíptica $latex C$ de género 2 sobre un campo finito $latex \mathbb{F}_q$.

Esto lo escribo meramente para poder saber si yo lo entiendo, pero cualquier duda escríbanme en los comentarios, ya que el tema es muy interesante.

Para poder construir este subcampo primero necesito conocer bien el campo de funciones de la superficie de Kummer asociada a la Jacobiana que realmente es sólamente considerar los puntos de la jacobiana módulo la involución en sus elementos, es decir estamos pegando los puntos opuestos en la Jacobiana, lo que ya no nos permitirá diferenciar $latex P$ de $latex -P$ con $latex P\in \mathbb{J}_{\mathbb{F}_q(C)}$.

La superficie de Kummer es cuártica en el espacio proyectivo de dimensión 3 $latex \mathbb{P}^3$ que tiene exactamente 16 singularidades nodales (es decir que si ese punto en una superficie en $latex \mathbb{P}^3$ es tal que si lo tomas como el origen de un sistema de coordenadas afín, la ecuación de esa superficie tiene la forma $latex 0=\alpha(x,y,z)+$ términos más grandes en grado con $latex \alpha$ una fórma cuadrática homogénea no degenerada.

Vamos a construir la superficie de Kummer $latex K(C)$ asociada a $latex P\in\mathbb{J}_{\mathbb{F}_q(C)}$.

Sea $latex C$ la curva hiperelíptica de género 2 con modelo no singular sobre $latex \mathbb{F}_q$ de característica diferente de 2 dada por

$latex y^2=f(x)=x^5+a_4x^4+a_3x^3+a_2x^2+a_1x+a_0$ donde $latex a_i \in \mathbb{F}_q$

donde $latex f$ no tiene raíces múltiples, entonces $latex C$ tiene un sólo punto al $latex \infty$ denotado por $latex P_\infty$ tal que si $latex \iota \in Aut_{\mathbb{F}_q}(C)$ es la involución hiperelíptica dada por el mapeo $latex (x,y)\mapsto (x,-y)$ y $latex \iota(P_\infty)=P_\infty$.

La clase de divisores canónicos $latex [\omega]\in Pic^0(C)\cong \mathbb{J}_{\mathbb{F}_q(C)}$. en $latex C$ está dada por líneas verticales cortando la curva por lo que $latex 2P_\infty$ junto con estos 5 puntos $latex 2W_i$ donde $latex W_i$ es uno de los 5 puntos de Weierstrass son divisores canónicos.

Tenemos ahora que como grupo abeliano $latex \mathbb{J}_{\mathbb{F}_q(C)}:= Div^0(C)/Pr(C)$, es decir los divisores de orden 0 (grupo abeliano libre de las sumas formales de puntos cuyos elementos cumplen que la suma de sus coeficientes sobre $latex \mathbb{Z}$ da 0) modulo los divisores principales que están formados por los divisores de orden cero nacidos de la intersección de funciones de la curva cuyos puntos tienen coeficiente el órden de intersección de ésta con la función.)

$latex \mathbb{J}_{\mathbb{F}_q(C)}$ se obtiene via $latex Sym^2(C)$, es decir es la variedad de pares de puntos no ordenados de $latex C$ (es decir, el producto cartesiano de $latex C$ con sigo misma olvidando el orden), es fácil demostrar que $latex \Phi:Sym^2(C)\rightarrow \mathbb{J}_{\mathbb{F}_q(C)}$ con $latex \lbrace P,Q\rbrace\mapsto [P+Q-2\infty]$ donde $latex P,Q\in C$ donde la fibra sobre $latex 0\in \mathbb{J}_{\mathbb{F}_q(C)}$ es $latex \Phi^{-1}(0)=\lbrace \lbrace P,Q \rbrace \in Sym^2(C) \mid P+Q\in [\omega]\rbrace$ y la fibra sobre otro punto es solo otro punto.

Ahora vamos a identificar el campo de funciones de $latex Sym^2(C)$ denotado por $latex \mathbb{F}_q(Sym^2(C))$ que es también el campo de funciones de $latex \mathbb{J}_{\mathbb{F}_q(C)}$ .

Comenzamos, considera el producto cartesiano de la curva con si misma $latex C\times C$ y entonces metiendo ot

Esto lo hice más para mi, pero pretendo complementar la construcción de esto mediante divisores de Mumford.
ra nueva variable $latex z$ donde $latex z^2=f(z)$ es la misma curva $latex C$ tenemos que :

$latex \mathbb{F}_q(C\times C)=\mathbb{F}_q(x,z,\sqrt{f(x)}, \sqrt{f(z)})$

Por otro lado el campo de funciones de $latex Sym^2(C)$ son las funciones que son invariantes bajo permutacion de variables $latex (x,\sqrt{f(x)}) \leftrightarrow (z,\sqrt{f(z))$ es decir

$latex \mathbb{F}_q(Sym^2(C))$ es el campo fijo de $latex \mathbb{F}_q(C\times C)$ bajo la acción del automorfismo $latex \tau\in Aut(C)$ dado por intercambiar $latex x$ por $latex z$ es decir $latex \tau(x)=z$ y $latex \tau(z)=x$ por lo que tenemos que
$latex \mathbb{F}_q(Sym^2(C))=\mathbb{F}_q(x+z,xz,z\sqrt{f(x)}, x\sqrt{f(z)})$

Puedes demostrar que $latex [\mathbb{F}_q(C\times C):\mathbb{F}_q(Sym^2(C))]=2$

Ahora, el punto base $latex P_\infty$ implica que la involución de divisores $latex \hat \iota(D)=-D\in \mathbb{J}_{\mathbb{F}_q(C)} $ está inducida por la involución hiperelíptica $latex \iota$, de tal manera que el automorfismo inducido de $latex \mathbb{F}_q(Sym^2(C))$ está dado por el cambio de signo de los radicales, por lo que el automorfismo cambia el signo de $latex x\sqrt{f(z)}+z\sqrt{f(x)}$ y deja a los otros generadores fijos, por lo que el campo fijo es finalmente es el campo de funciones de la superficie de Kummer que queríamos construir partiendo de la construcción de la jacobiana módulo involución:
$latex \mathbb{J}_{\mathbb{F}_q(C)}/(\hat\iota)=\mathcal{K}(\mathbb{J}_{\mathbb{F}_q(C)})=\mathbb{F}_q(x+z,xz,z\sqrt{f(x)}\cdot x\sqrt{f(z)})$

Y este es el campo de funciones de la superficie de Kummer asociada a la Jacobiana de una curva hiperelíptica de Género 2.

Puedes probar Más explícitamente con esto:

Corolario:
Sea $latex f(x)=\prod_{i=1}^5{(x-\alpha_i)}$
entonces $latex f(x)f(u)=\prod_{i=1}^5{(x-\alpha_i)(z-\alpha_i)}=\prod_{i=1}^5{(xz-(x+z)\alpha_i+\{\alpha_i}^2)}=\Delta(x,z)$

Entonces tenemos que la superficie de Kummer de la jacobiana de una curva hiperelíptica de género 2 dada por $latex y^2=f(x)$ tiene como campo de funciones:

$latex \mathbb{F}_q(x,z,t)$ tal que $latex t^2=\Delta(x,z)$

Esto lo hice más para mi, pero pretendo complementar la construcción de esto mediante divisores de Mumford.

Eduardo Ruíz Duarte
twitter @toorandom

Wednesday, December 11, 2013

Teorema de Riemann-Roch y divisores en criptografía (Parte 1: campos de funciones y gavillas sobre variedades)

En criptografía muchos han visto que se estudian las curvas elípticas y menos frecuentemente las curvas hiperelípticas, algunos recordarán la estructura de grupo que se le da a una curva elíptica $latex C$ con la usual regla de intersección de una recta con la curva haciendo uso abusivo del teorema de Bézout para fundamentar la estructura de grupo que hay en sus puntos, que más formalmente, es la estructura de grupo que hay en las clases de divisores formados por las sumas formales de ideales máximos de todos los subanillos del campo de funciones de $latex \mathbb{K}(C)$, este grupo es el grupo de Picard de orden 0 de la curva $latex C$ que es:

$latex Pic^0(C) = Div^0(C)/Prin(C) \cong \mathbb{J}(C)$.

Esta manera de ver las cosas NO es para complicar lo ya existente, sino es con propósitos de poder exprimir más la teoría que lo respalda para poder investigarlo mejor y generalizarlo a otras curvas no elípticas.

La estructura de grupo de manera inocente o usual se puede ver en muchos textos pobres en matemáticas pero tal vez ricos en aplicaciones criptográficas como esto:

El propósito de este post será el poder resumirte la teoría que hay detrás.

Comencemos con unas definiciones, voy a suponer que quien me lee está familiarizado con la topología de Zariski la cual está definida por los conjuntos algebraicos como cerrados, de hecho estas definiciones son las interesantes para la topología de Zariski, y con esto pueden demostrar fácilmente las propiedades de espacio topológico.

Definición (ceros):
Sea $latex A:= \mathbb{K}[x_1,...,x_n]$ el anillo de polinomios en $latex n$ variables sobre el campo algebraicamente cerrado $latex \mathbb{K}$ y $latex J \subset \mathbb{K}[x_1,...,x_n]$ un ideal, entonces definimos el conjunto de ceros del ideal $latex J$ como:

$latex V(J):=\lbrace P\in \mathbb{A}^{n}_{\mathbb{K}} \mid f(P)=0$ $latex \forall f\in J\rbrace$

Definición (variedad afín): Un subconjunto $latex X\subset \mathbb{A}^n_{\mathbb{K}}$ es un conjunto algebraico (variedad afín) en el espacio afín $latex \mathbb{A}^n_{\mathbb{K}}$ si existe un $latex T\subset \mathbb{K}[x_1,...,x_n]$ tal que:

$latex X=V(T)$

Decimos que $latex X$ es un cerrado de Zariski, en la topología dada a $latex \mathbb{A}^n_{\mathbb{K}}$.

Veámos primero lo que es el anillo de coordenadas de una variedad.

Definición (función polinomial en la variedad V): Una función polinomial es un mapeo $latex f:V \rightarrow \mathbb{K}$ tal que existe un $latex F\in \mathbb{K}[x_1,...,x_n]$ con $latex f(P)=F(P)$ $latex \forall P\in V$

Este polinomio $latex F$ no está únicamente determinado por los valores que toma en $latex V$ o sea si tenemos $latex F,G\in \mathbb{K}[x_1,...,x_n]$:

$latex F\mid_{V}=G\mid_{V} \Leftrightarrow (F-G)\mid_{V}=0 \Leftrightarrow F-G\in I(V)$

Donde:

$latex I(V):=\lbrace f\in \mathbb{K}[x_1,...,x_n] \mid f(P)=0$ $latex \forall P\in V\rbrace$

Esta definición de función polinomial y su relación de igualdad con otros polinomios, huele a una relación de equivalencia, por lo que vamos a suponer que lo es y se deja a quien lee para que lo demuestre y tenemos que:

Denotaremos ahora a $latex V$ como el conjunto algebraico $latex V(I)$ donde $latex I$ es ideal de $latex \mathbb{K}[x_1,...,x_n]$

Definición (anillo de coordenadas de una variedad): Un anillo de coordenadas de una variedad $latex V$ es:

$latex \mathbb{K}[V]:=\mathbb{K}[x_1,...,x_n]/I(V)$

Este anillo sabemos que es un dominio entero si $latex I(V)$ es un ideal primo, y esto naturalmente sucede si $latex V$ es irreducible , es decir no es union de otros cerrados de zariski

De lo anterior sobre funciones polinomiales y la última definición se puede demostrar que:

$latex K[V]=\lbrace f \mid f:V\rightarrow \mathbb{K}$ es una función polinomial $latex \rbrace$

Cabe notar que se le llama anillo de coordenadas porque las funciones que te dan la i-ésima coordenada de los elementos de $latex V$, $latex x_i$ son las generadoras de $latex \mathbb{K}[V]$

Es fácil ver que $latex \mathbb{K}[ \mathbb{A}^n_{\mathbb{K}}]=\mathbb{K}[x_1,...,x_n]$ y que el anillo $latex \mathbb{K}[V]$ juega el papel para $latex V$ como $latex \mathbb{K}[x_1,...,x_n]$ para $latex \mathbb{A}^n_{\mathbb{K}}$

Observaciónes sobre lo anterior con respecto a la topología de Zariski en $latex \mathbb{A}^n_{\mathbb{K}}$.

Los ideales primos de $latex \mathbb{K}[V]$ están en correspondencia 1:1 con irreducibles $latex W\subset V$
Los ideales máximos de $latex \mathbb{K}[V]$ están en correspondencia 1:1 con los puntos de $latex V$
Los ideales radicales de $latex \mathbb{K}[V]$ están en correspondencia 1:1 con los cerrados $latex W\subset V$

Definición (campo de funciones de V): El campo de funciones de $latex V$ es el campo de fracciones de $latex \mathbb{K}[V]$ y es denotado por $latex \mathbb{K}(V)$, las $latex f\in \mathbb{K}(V)$ se llaman funciones racionales sobre $latex V$

Definición (función regular en P): Una función $latex f\in \mathbb{K}(V)$ y $latex P\in V$ se dice que es regular en $latex P$ si $latex f=\frac{g}{h}$ con $latex h(P)\neq 0$, y definimos:

$latex dom(f):=\lbrace P\in V \mid f$ es regular en $latex P\rbrace$

Proposición: El conjunto:

$latex V_f:=\lbrace P\in V\mid f(P)\neq 0\rbrace$

es un abierto de $latex V$

Teorema:

$latex dom(f)$ es abierto y denso en $latex V$
$latex dom(f)=V\Leftrightarrow f\in \mathbb{K}[V]$
$latex V_g\subset dom(f) \Leftrightarrow f\in \mathbb{K}[V][1/g]$

Ahora, entraremos a un concepto central, para poder analizar una variedad localmente... para esto sabemos que un anillo local sólo tienen un ideal máximo, y tenemos que la siguiente definición

Definición (anillo de funciones regulares): El anillo de funciones regulares de $latex V$ localizado en el punto $latex P\in V$ es:

$latex O_{V,P}:=\lbrace f\in \mathbb{K}(V)\mid f$ es regular en $latex P\rbrace$

Es fácil demostrar que esto es en efecto un subanillo de $latex \mathbb{K}(V)$ y que su único ideal máximo no deberá tener unidades por lo que su ideal máximo es:

$latex m_{P}:=\lbrace f/g \in \mathbb{K}(V)\mid f(P)=0, g(P)\neq 0 \rbrace$

Ahora vamos a la últma parte de este blog donde discutiremos la estructura de gavilla de una variedad

Estructura de gavilla de una variedad

Tenemos que el anillo $latex O_{V,P}$ es local y es un subanillo de $latex \mathbb{K}(V)$ y su ideal máximo es $latex m_{P}$, es fácil relacionar a $latex O_{V,P}$ con $latex \mathbb{K}[V]$ ya que con localización puedes demostrar que:

$latex \hat{m}_P=\lbrace f\in \mathbb{K}[V]\mid f(P)=0\rbrace=I(\lbrace P \rbrace)+I(V)\subset \mathbb{K}[V]$

Es máximo y:

$latex O_{V,P}=\mathbb{K}[V]_{\hat{m}_P}$

Es decir que $latex O_{V,P}$ es la localización del anillo de coordenadas de $latex V$ en el ideal máximo $latex \hat{m}_P$

Ahora vamos a definir el concepto final:

Definición-Teorema (estructura de gavilla en $latex O_{V}(U)$, germen y fibra ): Para todo abierto $latex U \subset V$ tenemos:

$latex O(U):=O_{V}(U):=\lbrace f\in \mathbb{K}(V) \mid f$ es regular en $latex U \rbrace$

Es una $latex \mathbb{K}-$álgebra con $latex O_{V}(\emptyset):=\lbrace 0 \rbrace$

Todos los $latex O_{V}(U)$ con $latex U\subset V$ forman una gavilla $latex O_V$ bajo la restricción de homomorfismos usual y el anillo $latex O_{V,P}$ es una fibra de la gavilla $latex O_V$ y los elementos $latex f\in O_{V,P}$ se les llama gérmenes de funciones y:

$latex O(V)=\mathbb{K}[V]$

La teoría de gavillas da una estructura rica a una variedad, en este caso , puede ser el de una curva elíptica o hiperelíptica

Saludos

Eduardo Ruiz Duarte (beck)
Twitter: @toorandom

Beck's blog

Wednesday, April 19, 2017

Why finding big prime numbers? why study weird arithmetic sequences?

Sunday, July 17, 2016

Algebras de endomorfismos en curvas elípticas (Parte 1 Anillos de Endomorfismos)

Wednesday, November 18, 2015

Motivación en esquemas, gavillas, espacios localmente anillados, topología de Zariski

Tuesday, June 02, 2015

Sobre Campo de funciones de superficie de Kummer de una curva de género 2

Wednesday, December 11, 2013

Teorema de Riemann-Roch y divisores en criptografía (Parte 1: campos de funciones y gavillas sobre variedades)

About Me

Links

Last Comments

Popular Posts

Total Pageviews