Monday, April 28, 2014

Dos teoremas básicos que debes comprender de cálculo si quieres hacer investigación aunque creas que "no los vas a usar" (creeme que sí) (Teorema de la función inversa)


Si estás desde un smartphone o tablet, no verás los símbolos bien, por lo que te recomiendo dar click aquí para poder visualizar correctamente este post.

Vamos a explorar hoy 1 de 2 teoremas muy importantes en cálculo/análisis ya más serio a nivel universitario que todo matemático (físico, ingeniero o cualquier científico) debe comprender (y demostrar preferentemente) estos teoremas aparecerán muy frecuentemente en análisis, geometría algebraica, topología algebraica y diferencial, incluso en álgebra también (Teoría de Lie), geometría cuántica y algunas cosas que utilicen geometrías que incluyan de alguna manera a los números reales (como los complejos) por lo que considero (y no sólo yo) son fundamentales.

Hoy veremos el teorema de la función inversa e intentaré dar las herramientas para poder comprenderlo, en el siguiente post veremos el teorema de la función implícita


Este teorema vagamente relaciona directamente la inversa de la derivada de una función vectorial con la derivada de la inversa de esa misma función vectorial, veremos como comprender intuitivamente TODA la construcción de esto, así que empecemos con la derivada en una variable para poder comprender la derivada en varias variables.


Recordemos la derivada usual univariable que hemos visto en posts anteriores para una función $latex f:\mathbb{R} \rightarrow \mathbb{R}$ donde $latex f^{\prime}(a)$ recordemos que era:


$latex f^{\prime} (a):= \lim_{x\to a} \frac{f(x)-f(a)}{x-a}$



Esto existe si y sólo sí :

 $latex \lim_{x\to a} \frac{f(x)-f(a)}{x-a}-f^{\prime}(a)=0$

El cual es equivalente a:



 $latex \lim_{x\to a} \frac{f(x)-f(a)-f^{\prime}(a)(x-a)}{x-a}=0$


y también es equivalente a lo que le da más sentido a funciones $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ :


 $latex \lim_{x\to a} \frac{\mid f(x)-f(a)-f^{\prime}(a)(x-a)\mid}{\mid x-a\mid }=0$




Donde $latex f^{\prime}(a)$ es una matriz de $latex 1\times 1$




Ahora, después de ver la derivada de esta forma, veamos la definición para funciones más en general.


Definición: Una función $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ es diferenciable en $latex a\in \mathbb{R}^n$ si existe una matriz $latex A:\mathbb{R}^n \rightarrow \mathbb{R}^m$ de $latex m\times n$  tal que:


$latex \lim_{x \to a}\frac{\mid f(x)-f(a)-A\cdot (x-a)\mid} {\mid x-a \mid }=0$

Si este $latex a$ existe, denotamos a esta matriz $latex A$ por $latex Df(a)$ que es la derivada de $latex f$ en $latex a$ y le llamamos Jacobiana.


Nota que $latex f(x),f(a)$ y $latex A\cdot (x-a)$ están todos en $latex \mathbb{R}^m$ por lo que:

$latex \mid f(x)-f(a)-A\cdot (x-a)\mid$ es la norma de un vector en $latex \mathbb{R}^m$.

También toma en cuenta que $latex \mid x-a\mid $ es la norma de un vector en $latex \mathbb{R}^n$ .

Aquí podemos ver que $latex Df(a)$ juega el papel de $latex f^{\prime}(a)$ en funciones de $latex \mathbb{R}$ en $latex \mathbb{R}$


La manera más eficiente de calcular esta matriz Jacobiana se puede demostrar con el limite anterior definido y un poco de talacha que está dada por el siguiente teorema.



Teorema 1. Sea $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ dada explícitamente por $latex m$ funciones


$latex f(x_1,...,x_n)=\begin{pmatrix} f_{1}(x_1,...,x_n)\\ \vdots \\ f_{m}(x_1,...,x_m)\end{pmatrix}$


Si las $latex f_i$ son diferenciables entonces la Jacobiana está dada por:


$latex Df(x)=\begin{pmatrix} \frac{\partial f_1}{\partial x_1}&\hdots & \frac{\partial f_1}{x_n}\\ \vdots & \space & \vdots \\ \frac{\partial f_m}{x_1}&\hdots&\frac{\partial f_m}{x_n} \end{pmatrix}$



Es fácil ver que esta matriz cumple la definición de diferenciabilidad para una $latex a\in \mathbb{R}^n$ sustituyéndola en la definición de diferenciabilidad entre funciones vectoriales que mencionamos previamente.
 

Ahora veamos otro teorema importante.


Teorema 2. Sea $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ y Sea $latex g:\mathbb{R}^m \rightarrow \mathbb{R}^l$ diferenciables.

Entonces la composición:


$latex g \circ f:\mathbb{R}^n \rightarrow \mathbb{R}^l$

También es diferenciable y si suponemos que $latex f(a)=b$ su derivada está dada por:


$latex D(g\circ f)(a)=D(g)(b)\cdot D(f)(a)$

Esta regla de la cadena dice que para encontrar la derivada de la composición $latex g\circ f$ se multiplica la Jacobiana de $latex g$ evaluada en b por la Jacobiana de $latex f$ evaluada en $latex a$

La intuición de esto es regresandonos a la derivada en una variable, tenemos que $latex f^{\prime}(a)$ es la pendiente de la linea que pasa tangente a la función $latex y=f(x)$ en el punto $latex (a,f(a))$ en $latex \mathbb{R}^2$.

Si construimos la ecuación de tal tangente tenemos que está dada por.


$latex y=f(a)+f^{\prime}(a)(x-a)$

La cual como ya hemos oído es la "mejor aproximación lineal" a la función $latex f(x)$ cerca de $latex x=a$


Pues aquí un criterio razonable para la derivada de $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ es que sea la mejor aproximación lineal al objeto $latex y=f(x)$ que vive en $latex \mathbb{R}^{n+m}$, pero pues esta es precisamente la definición, la cual construimos intuitivamente en el principio en analogía con el plano $latex \mathbb{R}^2$:

$latex \lim_{x \to a}\frac{\mid f(x)-f(a)-Df(a)\cdot (x-a)\mid} {\mid x-a \mid }=0$

Aquí lo que estamos viendo análogamente con $latex \mathbb{R}^2$ es que $latex y=f(x)$ lo podemos aproximar con la función lineal:


$latex y\approx f(a)+Df(x)\cdot (x-a)$


Ahora veamos el teorema final, ya entendido esto.


Teorema 3 (Teorema de la función inversa): 

Sea $latex f:\mathbb{R}^n \rightarrow \mathbb{R}^m$ continua diferenciable y supón que el $latex Det(Df(a))\neq 0$ para algún punto $latex a\in \mathbb{R}^n$ entonces existe una vecindad abierta de $latex a\in U\subset \mathbb{R}^n$ y una vecindad abierta de $latex f(a)\in V \subset \mathbb{R}^m$ tal que $latex f:U\rightarrow V$ es biyectiva con inversa diferenciable $latex g:V\rightarrow U$

Vamos a analizar este teorema... y esbozar su demostración.


Demostración (informal)

¿Cuándo una función $latex f$ tiene inversa?

Como vimos anteriormente tenemos que la aproximación lineal en $latex x=a$ es: 

$latex f(x)\approx f(a)+Df(x)\cdot (x-a)$


Sabemos por álgebra lineal que $latex Df(a)$ es invertible si y sólo sí $latex Det(Df(a))\neq 0$ , por lo que $latex f(x)$ debería ser invertible (localmente, en su aproximación) si $latex f(a)+Df(a)\cdot (x-a)$ es invertible, lo cual sucede precisamente cuando $latex Det(Df(a))\neq 0$


Considera

$latex y = f(a)+Df(x)\cdot (x-a)$   


Aquí el vector $latex y$ es escrito explícitamente en función del vector variable $latex x$.

Pero si la inversa de $latex Df(a)$ existe , podemos escribir $latex x$ explícitamente en función de $latex y$ , es decir... despejarla para obtener la función inversa multiplicando por la izquierda por la jacobiana inversa y despejando $latex x$ (con cuidado porque la matriz no es necesariamente cuadrada y no es conmutativo el producto de matrices o puede no estar definido), y esto se ve así:


$latex x=a+Df(a)^{-1} \cdot (y-f(a))$

Es decir ya despejamos a $latex x$ en función de $latex y$ utilizando la invertibilidad de la Jacobiana, y observamos que $latex y$ y $latex x$ se ven similares.

Esto se ve claramente sabiendo que invertimos" una ecuación lineal (la mejor aproximación lineal en $latex (a,b=f(a))\in \mathbb{R}^{n+m}$) como $latex x(y)$ es la inversa de $latex y(x)=f(x)$ podemos ver que la derivada de $latex x(y)$ es justamente su pendiente vista como ecuación lineal que es $latex Df(a)^{-1}$ .

Es decir, la derivada de la inversa en $latex f(a)=b$ ($latex x^{\prime}$) es la pendiente de la inversa de la aproximación lineal de $latex f$ en $latex x=a$ que coincide con la jacobiana inversa de $latex f$ en $latex x=a$. 

En otras palabras con esto tenemos que si $latex f^{-1}$ es la inversa de $latex f$ , entonces lo que en símbolos dijimos es precisamente que la derivada de $latex f^{-1}$ es simplemente la inversa de la derivada de la función $latex f$ original.

 de hecho si $latex b=f(a)$ en símbolos esto es que:

$latex Df^{-1}(b)=Df(a)^{-1}$

Esto también se puede demostrar utilizando el teorema 2 sin tanto choro como el que puse que es con la regla de la cadena aplicandola a $latex f^-1 \circ f = I$


Con esto habremos encontrado la función $latex g$ que dice el teorema justo en la aproximación alrededor de $latex a$ y $latex b$ que nos dan las vecindades $latex U $ y $latex V$ del teorema.


Si hay dudas y comentarios


Eduardo Ruíz Duarte (beck)
twitter: @toorandom
















Wednesday, April 16, 2014

Existencia de dios a priori y lógica de Gödel, explicación de demostración y fundamentos de lógica modal


Nota. Este post no pretende establecer una posición sobre la existencia de dios o no, sino sólo tratar de comprender el argumento ontológico de Gödel de manera quasi-formal. Este es el argumento a priori mejor desarrollado sobre la existencia de dios a través de lógica modal. Exploraremos esta lógica de manera reducida en este post, errores deberán existir los cuales agradecería me los hicieran ver a través de los comentarios.

Este post lo re-escribo con el propósito de conmemorar el 40 aniversario luctuoso de uno de mis personajes preferidos. Kurt F. Gödel.

Desde muy temprana edad he sido ateo por razones que luego platicaré en mi blog que fueron divertidas en mi infancia. Este ateísmo últimamente me ha hecho querer profundizar un poco en el por qué de mi decisión ideológica. Acabo de leer el excelente libro de Richard Dawkins The God Delusion, ya que aparte de las matemáticas, siempre he sido muy entusiasta de la teología y el pensamiento racional. Las religiones son la razón de lo que somos hoy en día, ya que por más ateos que seamos, muchas de las costumbres, moralidad y ética; fueron heredadas de las religiones (ej. monogamia, tabú sexual, et cétera). Por esto, el entendimiento de la teología garantiza un mejor estudio antropológico e histórico de las sociedades tempranas e incluso futuras (¿será?).

Al leer el libro de Richard Dawkins me topé con que él discute argumentos ontológicos como el de la existencia de dios según Anselmo de Canterbury (sacerdote en el año 1093), así como otros autores cn otras situaciones similares. Sin embargo,  no discute uno de los argumentos de un gran personaje que para los adoradores de Einstein debería ser superior en su pensamiento deductivo y racional, Kurt Gödel.

Kurt fue un lógico alemán que fundamentó lo que David Hilbert no terminó relacionado con la meta-matemática. Esto es el estudio de la maquinaria que gobierna a las matemáticas (lenguaje, símbolos, reglas de inferencia, sistemas formales, demostraciones, axiomas). El trabajo de Gödel es respetado por todos los matemáticos debido a que sin éste el pensamiento matemático sería diferente en función a la teoría de la demostración en cualquier sistema formal.

Hoy daré mi punto de vista sobre dios y lo que he leído, así como su relación con la matemática. No soy experto en el área, pero la he estudiado, así que demostraré los teoremas que plantea Gödel con palabras para todos los oídos (¿ojos?).  Si los expertos en lógica que lean esto notan alguna equivocación favor de corregirme, lo agradeceré.

Primero que todo, si tú quieres demostrar que algo existe necesitas definirlo. Anselmo de Canterbury define a dios cómo:

Dios es lo que nada podría concebirse mayor a éste en términos de perfección

Kurt quiere formalizar el siguiente planteamiento de Anselmo de Canterbury. Éste es una demostración por reducción al absurdo de la existencia de dios:

Dios, es por definición lo más grande y perfecto que se puede concebir, dios existe en el entendimiento, en la mente, y si dios existe en el entendimiento, podríamos imaginarlo más grande y perfecto al existir en la realidad por lo tanto dios existe.

Este último párrafo por Anselmo de Canterbury fue diseñado a modo de dirigirlo no a los humanos sino al mismísimo dios a través de la oración. En mi opinión es absurdo, ya que si dios existiera, por qué éste necesitaría convencerse de su propia existencia. 

¿Cuál es la disyuntiva del argumento de Anselmo con una verdadera demostración?

Tú puedes concebir aunque seas ateo a un ser tan superlativo como quieras, aunque niegues que realmente pueda existir, después, el argumento afirma que si un ser no existe en el mundo real significa que es imperfecto, pero como dios es perfecto por lo tanto voilá dios existe

El problema aquí está en una premisa de Anselmo que es muy fuerte. Aquí la expongo con la regla de inferencia modus tollendo tollens $latex ((P\Rightarrow Q)\wedge \neg Q)\Rightarrow \neg P$. Tollendo Tollens hace "más digerible el sentido del problema del argumento de Anselmo". De ser "verdadero" lo siguiente, la lógica de Anselmo de Cantenbury deberá ser correcta y dios existe.

"X no existe ergo X es imperfecto"


El problema aquí de Anselmo, es que utiliza artificios dialécticos para obtener conclusiones universales a través de la retórica en la definición de dios. Eso desde el punto de vista racional no sirve para nada.

Para que la lógica funcione, la deducción de una proposición en un sistema formal con ciertas reglas de inferencia se basa en las propiedades de los objetos a evaluar. Y aquí Anselmo no está analizando el objeto "dios" lógicamente. Por otro lado, Gödel encontró el problema raíz, del argumento ontológico de Anselmo. Este problema fue mencionado antes por Immanuel Kant y es que: 

Existencia NO es una propiedad”.


, Anselmo utiliza la existencia como una propiedad intrínseca de un objeto, pero, ¿cómo puede haber un objeto que tenga la propiedad de "no existir"? Bueno, no todo está perdido, y es donde entra la lógica modal. En ésta lógica, se utilizan diferentes situaciones en las cuales una proposición puede ser verdadera o falsa, o SIEMPRE verdadera como la proposición "Llueve o no llueve" la cual nunca es falsa en cualquier circunstancia.
 Gödel sustituye este concepto por la propiedad de que sea “necesaria su existencia en X situación”, es decir agrega un operador simbólico que es distinto a la existencia clásica y es muy importante desde el punto de vista formal, semántico e interpretativo en lógica modal la cual resumiremos pronto.
Anselmo estaba usando sin querer lógica modal. Digo "sin querer" ya que en su época no existía aún de manera formal, Gödel la define como veremos abajo.

Lógica modal

Antes de llegar a la parte simbólica que es la que te podrá hacer leer el argumento ontológico de Gödel, veremos lo que es la lógica modal. Primero imagina cómo tú haces deducciones de tu entorno de ciertas situaciones. O sea, tu lógica sin saberlo funciona usando miles de premisas y miles de situaciones comparables. Es decir tu lógica no está acotada a un simple $latex P \rightarrow Q$ (P entonces Q).

En la lógica modal, imagina que la realidad es el que vives hoy y ahora.  Por otro lado, también sabes que la realidad podría ser distinta dependiendo de factores que la pudieran haber alterado o factores los cuales alterarían el futuro. Todo esto con distintas posibilidades de mundos según los posibles factores de desarrollo de éste. Es decir existen otras posibles realidades.

En la lógica modal todas las realidades posibles son denotadas por $latex \Diamond$ y las necesarias denotadas por $latex \Box$. Es decir, hay situaciones que pueden suceder, y hay situaciones que siempre suceden respectivamente. Veámoslo con más detalle.

¿Qué significa $latex \Diamond P$ ? 

Esto es que $latex P$ es posiblemente verdadero, es decir existe una posible realidad en la que $latex P$ podría ser verdadero. Esto es equivalente a que en algún mundo, y en el desarrollo de sus condiciones y premisas podrían hacer que $latex P$ fuera verdadero. 
A manera de ejemplo, existe un mundo, una realidad en la que tú no hubieras existido, (si hubieran atropellado a tus padres, o si hubieran abortado, o si tu bisabuelo hubiera muerto en una guerrilla).

¿Qué significa $latex \Box P$ ? 

Esta es "más fuerte" ya que dice que $latex P$ es verdadero en todos los mundos/realidades posibles , es fácil mostrar que existen proposiciones que son verdaderas en todos los mundos por ejemplo 
$latex \Box (\neg P \lor P)$

 En particular esto dice con palabras: "en todos los mundos o llueve o no llueve". Esa proposición es verdadera en todos los mundos para cualquier $latex P$, esto se le llama el principio del tercero excluido. Es decir, para que esta proposición sea falsa tendría que suceder algo diferente a "llover" o "no llover". Lo cual clásicamente es imposible. 

Entonces tenemos aquí que con lógica simbólica a manera de resumen el significado de los símbolos:
  • $latex P$:     $latex P$ es una proposición que es verdadera en la realidad actual, en el mundo real.
  • $latex \Diamond P$:   $latex P$ es posiblemente verdadero, es decir es verdadero en algún/os mundos posibles.
  • $latex \Box P$:  $latex P$ es necesariamente verdadero, es decir no hay ninguna situación/mundo/realidad en donde $latex P$ pudiese ser falso.
Para profundizar un poco en este tipo de pensamiento lógico, recomiendo vean literatura la cual es vasta en internet sobre lógica modal. Pero creo que con esto podemos avanzar un poco. 

Gödel, al poder corregir a Anselmo y convertir en propiedad la existencia de dios a través de esta lógica, demuestra que el objeto dios necesariamente existe, (noten que no es el dios cotidiano, es el de la definición de perfección. Esta lógica modal,  nosotros usamos diariamente para hacer deducciones, así que no es tan misteriosa o rara.

Ahora vamos a analizar la demostración de Gödel. 
Recuerden que las matemáticas se crean a partir de axiomas (Ax) , que son las reglas del juego. Dentro del juego hay objetos los cuales se deben definir (Df) para poder establecer equivalencias entre ellos. Cuando se juega con los axiomas, se crean proposiciones (Pr) universales dentro del sistema. Después con estas proposiciones, se crean teoremas (Th) que generalizan situaciones. Estos teoremas se pueden deducir corolarios (Cr) que son consecuencias particulares importantes del teorema. 
Tenemos que si $latex P$ es una proposición, por ejemplo "N es primo si y solo si N no tiene factores distintos a 1 y N", denotaremos como $latex P(N)$ a la fórmula que evalúa a $latex N$ la cuál puede ser verdadera (1) o falsa (0). En particular con este ejemplo, $latex P(3)=1$, $latex P(10)=0$.  

Aquí tenemos la demostración de Gödel que en 1970 en su lecho de muerte se la mostró a su alumna Dana Scott. Ella la publico sin su permiso después de morir (me parece, chéquenlo). Trataré de dar una explicación a cada renglón abajo.


Esta demostración de Gödel, más que demostrar la existencia de dios, yo lo veo como una construcción axiomática mínima. Ésta construcción, es suficiente para que se pueda inferir la existencia de dios a priori. Si tú no crees en estos axiomas, esto no implicará la existencia de dios en tu contexto.

Por esto anterior,  hay que suponer ciertos principios axiomáticos donde vivirá nuestro argumento, los cuales Gödel consideraba universales. Uno de estos es el Principio de plenitud el cual fue estudiado desde Aristóteles hasta Immanuel Kant, el cual dice que:

Cualquier cosa que pueda suceder, eventualmente sucederá

Esto no lo veo descabellado y suena modal ¿no?, lo explico desde mi punto de vista ya que esto ya entra en los límites de la matemática con filosofía.
La idea anterior se basa en todas las posibles situaciones en las que algo pueda existir. Desde mi punto de vista, suponiendo la infinitud del universo y el tiempo, si ese algo tiene la posibilidad de ser verdadero, y existen una infinidad de variables en una infinidad de tiempo, eventualmente ese algo podrá ser verdadero. Esto recuerda a la analogía de los chimpancés tecleando al azar en máquinas de escribir. En algún momento finito del tiempo, podrán haber escrito todo Hamlet de W. Shakespeare.

Gödel argumenta que dios existe en algún mundo posible usando este principio de plenitud y un conjunto de otros axiomas. Esto es argumentando la consistencia lógica ciertos objetos al tener la propiedad "de dios" o más informalmente, de ser " buenos o positivos o divinos".
Otra cosa que define Gödel en su demostración son las esencias:

Si $latex x$ es un objeto en algún mundo posible, entonces la propiedad $latex P$ se dice ser una esencia de $latex x$ si la formula $latex P(x)$ es verdadera en ese mundo y si $latex P$ conlleva todas las propiedades que $latex x$ tiene en ese mundo

Otra definición importante es de la existencia necesaria:

 $latex x$ necesariamente existe si para toda esencia $latex P$ lo siguiente es verdadero:
En todo mundo posible, existe un elemento $latex y$ donde $latex P(y)$ es verdadero 

Entonces tenemos ahora que la propiedad $latex P$ significa que $latex P(x)=1$ si y sólo sí $latex x$ tiene la propiedad de ser algo positivo. Es decir todas las cosas que en su totalidad puedan hacer llegar a la definición de dios. En otras palabras, podemos definir al objeto dios como aquel que tiene todas las propiedades positivas o buenas. Un objeto con la característica de tener todas las propiedades positivas, lo llamaremos divino.

Vamos ahora a explicar cada línea de manera coloquial  y de manera más coloquial en negritas.

  • Axioma 1. Si $latex \phi$ tiene la propiedad de ser positivoy es necesariamente verdadero que todo lo que tenga la propiedad $latex \phi$ implica que también tiene la propiedad $latex \psi$ entonces $latex \psi$ también es bueno o positivo o divino. Esto quiere decir que si $latex X$ es bueno y ese $latex X$ tiene la propiedad $latex Y$ en todos los mundos entonces $latex Y$ tiene que ser positivo.

  • Axioma 2. Para toda propiedad $latex \phi$ tenemos que sólamente una $latex \phi$ o $latex \neg \phi$ es positivo. O sea que si $latex \neg X$ es positivo tenemos que $latex X$ es malo, esto es análogo al principio del tercero excluido.

  • Teorema 1. Aquí es donde se usa el principio de plenitud. Si $latex \phi$ es bueno es posible que exista un objeto con la propiedad $latex \phi$. Es decir, existe un mundo en el que puede existir algo bueno. 
Demostración (con mucho choro por contradicción pero es necesario):

Supongamos que existe un $latex \phi$ bueno, PERO que necesariamente nada tiene la propiedad $latex \phi$ (recuerden que necesariamente es algo que sucede o no en todos los mundos). Buscamos contradicción ya que estamos usando las reglas de inferencia usuales, en este caso el principio del tercero excluido para reducción al absurdo.

Si suponemos lo anterior entonces la propiedad $latex \phi$ implicaría por vacuidad TODAS las propiedades. En particular, tendríamos que $latex \phi \Rightarrow \neg \phi$, que por el axioma 1 implicaría que $latex \neg \phi$ es bueno. Por o tanto $latex \phi$ y $latex \neg \phi$ tienen la propiedad de ser positivos, lo que contradice el axioma 2 y por lo tanto la suposición es falsa.  Por el tercero excluido tenemos que entonces la negación de la suposición es verdadera y esto implica que si $latex X$ es bueno, debe existir una realidad donde haya algún objeto con la propiedad $latex X$.

  • Definición 1. Llamamos a algo $latex x$ divino cuando tiene todas las propiedades positivas. Se usa la letra G porque en inglés es "God-like" o "similar a dios" pero con fines prácticos le llamaré "divino"
  • Axioma 3. Tener la propiedad de divino implica que también tiene la propiedad de positivo
  • Teorema 2. Es posible (en el sentido de lógica modal, es decir existe un mundo en el cual...) que exista algo divino este teorema se explica por si solo.
Demostración:

Sabemos por el teorema 1 que si $latex \phi$ es bueno debe existir algún objeto en un posible mundo que tenga la propiedad $latex \phi$. Si cambiamos a $latex \phi$ por el la propiedad "ser divino" proveniente del axioma 3, tenemos la demostración del teorema 2 $latex \blacksquare$.  
Realmente no sé por que Gödel le llama Teorema... yo le llamaría Corolario... pero tal vez es por el hecho de que el objeto al que se aplica es directamente un axioma y no una proposición
  • Definición 2. Aquí define lo que anteriormente ya habíamos mencionado sobre esencia, que de nuevo resumidamente tenemos que $latex \phi$ es la esencia de un objeto $latex x$ cuando:
  1. $latex x$ tiene la propiedad $latex \phi$
  2. La propiedad $latex \phi$ fuerza a todas las propiedades de $latex x$ a ser verdaderas.
  • Axioma 4. Si $latex \phi$ es positivo entonces $latex \phi$ es necesariamente positivo. Es decir en el sentido modal, $latex \phi$ en todas las realidades y mundos deberá ser positivo. (aquí es donde comienza la onda complicada filosófica desde mi punto de vista)
  • Teorema 3. Si un objeto es divino entonces ser divino es su esencia
Demostración:

Recordemos que si $latex x$ es divino entonces tenemos que este $latex x$ tiene TODAS las propiedades positivas  por el axioma 2.  Esto quiere decir que TODAS las propiedades de algún objeto divino son buenas/positivas. Por lo tanto son necesariamente positivas (recuerden que en el sentido modal la palabra "necesario") por el axioma 4.  qed. $latex \blacksquare$
  • Definición 3: Decimos que $latex x$ es indispensable, denotado por $latex E(x)$ cuando algo que tenga esencia DEBE existir.
  • Axioma 5: Ser indispensable es bueno
  • Teorema 4. Lo divino necesariamente existe  (es decir en todas las realidades y mundos existe el objeto con la propiedad  divino definido aquí previamente teniendo todas las propiedades buenas)
Demostración:

Si algo es divino, entonces tiene por definición todas las propiedades buenas, vemos por el axioma 5 que esto es indispensable ya que es una propiedad buena.

Por definición un objeto con esencia que es divino, por el teorema 3, debe existir.  

Esto significa que si algo divino existe, entonces necesariamente existe para que algo divino exista.

Por otro lado ya probamos el teorema 2, y tenemos que es posible que algo divino exista (en el sentido modal hay un mundo en el que algo divino existe).

Por lo tanto es posible que sea necesario que algo divino exista. Esto implica que necesariamente existe algo divino. Es decir existe una realidad donde se deduce que en todas las realidades existe algo divino, por lo que sí existe en una realidad, existe en todas las realidades. Por lo tanto lo divino existe en todas las realidades)  QED. 

Cómo ven esta demostración no tiene error en la lógica, es decir es deductiva, y representa un conocimiento a priori sobre la existencia de dios

¿Pero entonces por qué SOY ateo?

Los axiomas son demasiado fuertes para mí como para poder ser aceptados por mi mente.
recuerden que los axiomas no se demuestran, sino representan las reglas con las que vamos a poder razonar dentro de un sistema. El axioma 5 por ejemplo es muy duro para mí. El decir que lo indispensable es bueno... creo que es algo muy filosófico. El axioma 1 no me gusta tampoco, es decir, algo bueno en todas las realidades está compuesto de implicaciones a él mismo que son buenas. El axioma 4 también implica que lo que es positivo, siempre es positivo en todos los contextos. Hay realmente que ser muy claro en qué es ser positivo para que esto sea menos filosófico.

Si los axiomas te gustan, existe algo divino.  Pero olviden a sus dioses con nombre e identidad, esos no son de los que Gödel hablaba. El sólo hablaba de un ser máximo en perfección repleto de todas las propiedades buenas o positivas. 

Esto lo intenté explicar ayudado de mi libro de lógica A new introduction to Modal Logic y de lo que recordé de mi curso y notas de Lógica II de hace algunos años. Aquí lo que usé para lógica modal realmente debería de estudiarse si les interesa como Lógica Modal S5 que es la que Gödel utilizó.

¿Tú qué opinas? , ¿dios existe?


                                  Kurt Friedrich Gödel, Abril 28 de 1906 - Enero 14 de 1978 

Eduardo Ruíz Duarte (PGP:FEE7 F2A0)
Twitter: @toorandom


Thursday, April 03, 2014

Sobre falacias y mál pensamiento deductivo/inductivo en medios de comunicación y contaminación intelectual



Pongo aquí extractos de comentarios que puse en un post en facebook que se tornó interesante, tal vez le falte estructura gramatical, luego lo acomodo mejor, son copy paste de una red social, acomodados muy rápidamente.


¿Ya leyeron este mini libro en linea? , se lo echan en 15 minutos y puede que les cambie la vida, este libro discute algo de lo que me he quejado muy seguido a lo largo de mi vida sobre la argumentación de los mexicanos (y otros) así como el mal uso del lenguaje, es decir, muchos argumentan con falacias (razonamientos circulares, ad-hominem, etcétera) y aún así aceptan las proposiciones de los demás las cuales después se convertirán en premisas de futuras argumentaciones y cambian su manera de pensar por tener un mal razonamiento inductivo o deductivo y viven la vida sin encontrar la verdad.

Estas personas 'creen' que algo es 'verdad' aunque sus premisas fueron nacidas de falsas argumentaciones generadas por falacias, y con esto se genera una cadena.

https://bookofbadarguments.com/es/


También en facebook que es de donde nace este post, Roberto Andrade Fonseca mencionó un gran libro que se llama "How to Lie with statistics" el cual puse lo que sigue:




Jejé pa los que leyeron el libro que comenta Roberto, ya ven que el autor inventó una palabra al final para denotar este tipo de prácticas estadísticas, creo que en México hay un expertise amplio del gobierno en “satisticulation”

Otro tipo de falacia que no habla en el libro es la mencionada en el de Huff, que es más técnica pero que va ligada con la semántica y presentación de los datos crudos para hacer creer que la realidad es distinta o la "post hoc" eso es muy de los medios de comunicación en México, que como algo ocurrio antes entonces si algo ocurre bajo las mismas premisas tiempo después la argumentación deberá ser la misma.




Ese libro lo debería leer Omar Chito recuerdo cuando hace poco comenzamos a discutir mucho este tipo de argumentaciones y tratar de ser tajantes a la hora de detectarlo en un debate entre amigos, empresarios, conferencistas o lo que sea con el fin de no hacer evolucionar una proposición falsa hasta que se convierta en una premisa generalizada no comprobada para la opinión pública lo cual genera ignorancia generalizada por culpa del mal razonamiento




Y aquí puse otro post relacionado con una hipótesis que tengo sobre el mal uso del lenguaje


Otro comentario sobre las falacias es que me parece que cada día hay más tipos de falacias ya que creo que éstas dependen de la sociedad.




Por ejemplo, algunas veces he visto que comentarios de personas o argumentos son tachados por la manera de imponerlos, entonces para evitar caer en una falacia Ad-hominem o a la autoridad los que defienden la proposición comienzan a meter cosas en sus argumentos como:

IMHO (In my humble opinion, En mi humilde opinion)
AFAIK (As far as I know, hasta donde yo sé)
YO CREO (enfatizando las mayúsculas del lenguaje u otros símbolos)

Et cétera...

Esto desde mi punto de vista provoca 2 falacias.

1. Hacer creer a la contraparte que la persona por estar siendo humilde su proposición deberá ser verdadera.

2. El hacer creer que como su punto de vista se localiza supuestamente en un estado neutral de pensamiento, la argumentación debe ser libre de prejucios

Yo llamaría a esta falacia de humildad recursiva.

No sé qué opinen Omar Chito Lara Carlos López Roberto Andrade Fonseca
O todos los demás que no se han integrado al tema como Octavio Ruiz Cervera

Esto nació por el post anterior del mini libro de falacias y mi odio por los debates inundados de premisas nacidas de argumentación falaz que evolucionan a través del mal pensamiento inductivo/deductivo



También a la idea anterior que planteo Roberto Fonseca añade un comentario interesante aunque a mi gusto erróneo diciendo que eso más que falacia es retórica, donde yo creo lo siguiente:


La retórica en estricto sentido de la palabra es una fábrica de falacias

¿Por qué?

Simplemente porque haces un gran uso del lenguaje con el FIN de convencer a tu contraparte con esa cualidad, es decir, la veracidad del argumento no sólo depende de las premisas sino también de algo más superficial en ese contexto que es el adornado de la semántica.

Otra falacia con respecto a la retórica es que provoca otras falacias como ad-hominem ya que la gente con bastante capacidad retórica automáticamente es considerada un intelectual en su área (no todas las personas para no caer en otra falacia, y es claro que no todas porque yo estoy argumentando esto, no hay paradoja)

Entonces como su retórica es impecable => es intelectual por lo tanto ad-hominem



(En mi humilde opinión) (ja)







Me gusta · · Promocionar · Compartir

Friday, January 24, 2014

Teorema de Riemann-Roch y divisores en criptografía, (Parte 3: valuaciones, espacios de Riemann, su dimensión, género y curvas elípticas sin Bézout)

Vimos en la parte 1 el anillo de funciones regulares en una variedad y su localización en un punto, así como las funciones en un abierto de la variedad bajo la topología de Zariski, en la parte 1 de estos posts.

Ahora lo que queremos es justificar la estructura de grupo de una curva elíptica y si nos da tiempo de una hiperelíptica de género 2, pero para eso debemos introducir el concepto de divisores sobre la variedad y "género" el cual estará estrechamente relacionado con la dimensión de un espacio vectorial de funciones generado con un divisor.


Valuaciones


Vamos a suponer que $latex \mathbb{K}$ es un campo arbitrario el cual será un campo de constantes de algo más grande... el campo de funciones.

Definición 1: Una extensión $latex \mathbb{F}$ de $latex \mathbb{K}$ es un campo de funciones algebraico en una variable sobre $latex \mathbb{K}$ si existe un $latex z\in \mathbb{F}$  trascendente sobre $latex \mathbb{K}$ de tal manera que $latex [\mathbb{F}:\mathbb{K}(z)]$ es finita.


Los objetos centrales en esto serán los lugares, denotados por $latex P$ que de manera resumida serán los ideales máximos de todos los anillos de valuación que existan en $latex \mathbb{F}$ recuerden que los anillos de valuación son locales por lo que sólo tienen un ideal máximo, este anillo como en la parte uno lo denotaremos por $latex O_p$ y su ideal máximo como $latex M_p$


Recuerden como eran las funciones regulares de una variedad $latex V$ en un punto de la parte 1 de este blog la cual habíamos denotado como $latex O_p(V)=\lbrace f/g \in \mathbb{K}(V) : g(p)\neq 0 \rbrace$

Nota 1:
Aquí tenemos que $latex \mathbb{F}$ tiene un elemento trascendente y es campo por lo que podemos imaginarlo como que es on cociente de funciones polinomiales en una variable, pero podría ser que $latex \mathbb{K}$ sea ya un campo de funciones y $latex z\in \mathbb{F}$ otro elemento trascendente, haciendo que el campo de constantes no sea tan trivial.

Definición 2: Una valuación discreta normalizada de un campo de funciones algebraico $latex \mathbb{F}$ sobre $latex \mathbb{K}$ es un mapeo suprayectivo:


$latex \nu:\mathbb{F}\rightarrow \mathbb{Z}\cup \lbrace \infty \rbrace$

que satisface:

  1. $latex \nu(f)=\infty \Leftrightarrow f=0$
  2. $latex \nu(fg)=\nu(f)+\nu(g)$      $latex \forall f,g\in\mathbb{F}$
  3. $latex \nu(f+g) \geq min(\nu(f),\nu(g))\Rightarrow\nu(f+g)=min(\nu(f),\nu(g))$     $latex \forall f,g\in \mathbb{F}$
  4. $latex \nu(a)=0$       $latex \forall a\in \mathbb{K}^{*}$
Estos mapeos están en correspondencia biunívoca con los lugares de $latex \mathbb{F}$ por lo que si $latex P$ es un lugar de $latex \mathbb{F}$ definiremos como $latex \nu_P$ a su valuación correspondiente y denotaremos por $latex \mathbb{P}_\mathbb{F}$ a el conjunto de todos los lugares de $latex \mathbb{F}$ 


Nota 2: Recordemos que cuando vimos en la parte 1 el anillo de funciones regulares en una variedad, tenemos que los puntos están en correspondencia con los ideales máximos, aquí estámos usando por eso los lugares que son los ideales máximos pero lo estamos generalizando un poquito más con estas estructuras, que en vez de considerar los puntos , consideramos los ideales máximos de la localización.

Ahora vamos a definir los anillos locales en términos de valuaciones y lo ilustraremos con un ejemplo sencillo, estos anillos serán llamados anillos de valuación discreta de $latex \mathbb{F}$ correspondientes al lugar $latex P\in \mathbb{P}_\mathbb{F}$

$latex O_P=\lbrace f\in \mathbb{F} : \nu_P(f) \geq 0\rbrace$

Es fácil demostrar que es un anillo local, basta considerar quiénes son los elementos invertibles para saber que su ideal máximo (que obviamente no tiene elementos invertibles) es:

$latex M_P = \lbrace f\in O_P : \nu_P(f)>0 \rbrace$

Como $latex M_P$ es máximo definiremos el campo residual 

$latex \hat{\mathbb{F}}_P:=O_P/M_P$ 

y definiremos el grado de $latex P$ como el grado de la extensión $latex grad(P):= [\hat{\mathbb{F}}_P:\mathbb{K}]$ , cuando $latex grad(P)=1$ diremos que $latex P$ es racional



Bueno, yo recuerdo que cuando leí esto por primera vez se me hacía muy mágico el mapeo $latex \nu_P$ 
por lo que creo que es conveniente ilustrarlo con un ejemplo.

Ejemplo:

Sea $latex \mathbb{F}=\mathbb{K}(x)$ con $latex x$ trascendente sobre $latex \mathbb{K}$ es decir estamos considerando todos los cocientes de polinomios en una variable sobre el campo $latex \mathbb{K}$ aquí tenemos que los mónicos irreducibles $latex P(x)\in \mathbb{K}[x]$  nos inducen una valuación discreta única $latex \nu_P$

$latex \nu_P(f(x)) = r$ si $latex f(x)\in \mathbb{K}[x]-\lbrace 0 \rbrace$ y $latex P(x)^r \mid f(x)$


$latex O_P = \Bigg \lbrace \frac{f(x)}{g(x)} \in \mathbb{F} : P(x)\nmid g(x) \Bigg \rbrace$

Es clara esta definición ya que si $latex P(x)\mid g(x)$ es decir no se cancela en $latex f(x)$ la valuación sería negativa y tenemos que el anillo está formado por los elementos que tienen valuación mayor o igual que cero


Ahora, su ideal máximo ¿quién es?, tenemos que no tiene que tener elementos invertibles en $latex O_P$ y que su valuación sea estrictamente mayor que 0, eso significa que $latex P(x) \mid f(x)$ y como es subconjunto de $latex O_P$ también tiene que suceder que $latex P(x) \nmid g(x)$  por lo que en símbolos.



$latex M_P=\Bigg \lbrace \frac{f(x)}{g(x)} \in \mathbb{F} : P(x)\mid f(x), P(x)\nmid g(x) \Bigg \rbrace$



Entonces a qué huelen los elementos invertibles de $latex O_P$ ?  pues son todos los que NO tienen a $latex P(x)$ involucrado en el cociente $latex \frac{f(x)}{g(x)}$ es decir , los que tienen su valoración exactamente 0.


Entonces en este ejemplo cuando $latex P$ es linealtenemos que 

$latex \mathbb{F}/(P(x)) \cong \mathbb{K}$ 

Es decir, los lugares $latex P$ RACIONALES son aquellos generados con polinomios mónicos lineales.

Aquí en este ejemplo y en todos los interesantes, es decir cuando consideremos curvas elípticas o hiperelípticas hay otro  anillo de valuación que no está asociado a un polinomio pero pueden demostrar que es anillo y que tiene un sólo ideal máximo

$latex O_\infty = \Bigg \lbrace \frac{f(x)}{g(x)} \in \mathbb{F}, g(x)\neq 0, grad(f(x)) \leq grad(g(x)) \Bigg \rbrace $

y su ideal máximo

$latex M_\infty =\Bigg \lbrace \frac{f(x)}{g(x)} \in \mathbb{F}, g(x)\neq 0, grad(f(x)) < grad(g(x)) \Bigg \rbrace $

Es fácil ver esto , y que los invertibles tienen el mismo grado tanto en el numerador como denonimador.

Esto le llamaremos el lugar infinito de $latex \mathbb{F}$ y como ejercicio podrían demostrar que $latex O_\infty/M_\infty \cong \mathbb{K}$  por lo que otra vez tenemos un lugar RACIONAL es decir, el lugar infinito es racional, si el lugar tiene relacionado un polinomio diremos que es finito.

Observación:

Si $latex \mathbb{K}=\mathbb{F}_q$ es finito entonces hay $latex q+1$ lugares racionales, el +1 es por el lugar infinito

Divisores

Los divisores son esencialmente sumas formales de lugares junto con un coeficiente, esto será intuitivamente una expresión que nos ayudará a juntar ciertas características de elementos del campo de funciones

Definición 3: Un divisor $latex D$ de un campo de funciones algebraico $latex \mathbb{F}$ es una suma formal:

$latex D=\sum_{P\in \mathbb{P}_\mathbb{F}}m_P P$

Donde un número finito de $latex m_P$ es distinto de cero, este conjunto de divisores los denotamos por $latex Div(F)$

El soporte de un divisor es:

$latex sop(D):= \lbrace P\in \mathbb{P}_\mathbb{F} : m_P \neq 0\rbrace$

El grado de un divisor es:

$latex \partial(D):=\sum_{P \in sop(D)} (m_P)grad(P)$

Se dice que un divisor $latex D$ es positivo/efectivo si todos sus $latex m_P$ son mayores o iguales que 0, y escribimos $latex \nu_P(D) \geq 0$ .

Si dos divisores $latex D_1,D_2 \in Div(\mathbb{F})$ los comparamos como $latex D_1 \leq D_2$ si $latex \nu_P(D_1) \leq \nu_P(D_2)$ para todo $latex P \in \mathbb{P}_\mathbb{F}$, es decir que todos los coeficientes de los sumandos de los divisores son menores o iguales.  

Es claro que $latex Div(\mathbb{F})$ forma un grupo abeliano con suma definida componente a componente y es un grupo libre, y que un subgrupo de éste son los divisores de grado 0, que lo denotaremos por $latex Div^0(\mathbb{F})$


Definición 4: Decimos que si $latex \nu_P(f)$ > $latex 0$  entonces $latex P$ es un cero de multiplicidad  $latex \nu_P(f)$ y si $latex \nu_P(f)$ < $latex 0$ decimos que es un polo

Es claro que las constantes no tienen ceros ni polos, pero los demas elementos $latex f\in \mathbb{F}$
tienen al menos un cero y un polo.

Definición 5: Sea $latex f\in \mathbb{F}^{*}$ y $latex Z(f),N(f)$ los ceros y los polos de $latex f$ respectivamente, entonces definimos:

divisor de ceros de $latex f$:

$latex (f)_0 = \sum_{P\in Z(f)}\nu_P(f)P$

divisor de polos de $latex f$:

$latex (f)_\infty = \sum_{P\in N(f)}-\nu_P(f)P$

divisor principal de $latex f$:

$latex div(f):=(f)_0 - (f)_\infty$



Aquí sucede algo que habría que demostrar y no es tan directo pero si es lógico.

Que todos los divisores principales tienen grado 0, es decir, $latex \partial(div(f))=0$ para todo $latex f\in \mathbb{F}^{*}$, o sea existe el mismo número de ceros y de polos  en los elementos de $latex \mathbb{F}$, esto lo pueden ver en el libro de Algebraic function fields and codes  de Henning Stichtenoth.

Definición 5: El espacio de Riemann-Roch para un divisor $latex D$ de $latex \mathbb{F}$ está definido como:

$latex \mathfrak{L}(D):= \lbrace f\in \mathbb{F}^{*} : div(f)+D \geq 0 \rbrace \cup \lbrace 0 \rbrace $


Este espacio es un espacio vectorial sobre $latex \mathbb{K}$ y su dimensión será denotada por $latex l(D)$


Hay cosas que podrían demostrarse por ejercicio que son muy directas como que $latex l(0)=1$ o que $latex l(D)=0$ si $latex \partial(D)$ < $latex 0$


Teorema (Riemann-Roch): Sea $latex \mathbb{F}$ un campo de funciones algebraico de género $latex g$ , entonces para cada divisor $latex D$ de $latex \mathbb{F}$ tenemos que:

$latex l(D)\geq \partial(D)+1-g$

donde la igualdad se da si $latex \partial(D)\geq 2g-1$


Este teorema es muy potente y sirve de clasificación para campos de funciones con respecto al género

Definición 6:
El género $latex g$ de un campo de funciones $latex \mathbb{F}$ se define como:

$latex g:= g(\mathbb{F}):=max_D(\partial(D)-l(D)+1)$

O sea el máximo de todos los divisores de $latex \mathbb{F}$, tenemos que el género del ejemplo $latex \mathbb{K}(x)$ es 0 y decimos que el campo de funciones $latex \mathbb{F}$ es elíptico si su género es 1

Definición 7:
Sea $latex P\in \mathbb{P}_\mathbb{F}$ , $latex \forall$ $latex n \geq 1$ es número de polo para $latex P$ si existe un elemento $latex f\in \mathbb{F}^{*}$ tal que $latex (f)_\infty = nP$, si no existe esto decimos que $latex n$ es número de salto para $latex P$

Corolario (Saltos de Weierstrass): 
Sea $latex \mathbb{F}$ de género $latex g\geq 1$ y sea $latex P$ un lugar racional de $latex \mathbb{F}$, entonces existen exactamente $latex g$ número de salto $latex i_j$ que satisfacen:

$latex 1=i_1$ < ... < $latex i_g \leq 2g-1$


Esto se sigue inmediatamente de que:


  • $latex \forall i\geq 1$ tenemos que $latex \mathfrak{L}((i-1)P)\subseteq \mathfrak{L}(iP)$ y $latex \mathfrak{L}((i-1)P)=\mathfrak{L}(iP) \Leftrightarrow i$ es número de salto
  • $latex l(iP)\leq l((i-1)P)+1$
  • $latex l(0P)=1$ y $latex l((2g-1)P)=g$
Criptografía

Ya habíamos mencionado que todos los divisores de funciones tienen grado 0 es decir tienen el mismo número de ceros y de polos. por lo que estos serían un subgrupo de $latex Div^{0}(\mathbb{F})$

entonces el subgrupo de divisores principales lo denotamos como:

$latex Prin(\mathbb{F}):= \lbrace div(f) : f\in \mathbb{F}^{*}\rbrace \subset Div^{0}(\mathbb{F})$



Como estos grupos son libres, abelianos, podemos hablar de su cociente, por lo que el grupo que necesitamos para criptografía y el que se usa actualmente es el grupo de Picard de orden 0 el cual es isomorfo a:

$latex Pic^{0}(\mathbb{F}):= Div^0(\mathbb{F})/Prin(\mathbb{F})$


Si el género del campo de funciones $latex \mathbb{F}$ es 1 este grupo es isomorfo al grupo usual que conocemos de las curvas elípticas  y si es 2 se dice que es hiperelíptico.

De hecho, para culminar este post, vemos que no necesitamos el teorema de bézout para demostrar que una recta intersecta en 3 puntos a una curva proyectiva ya que:


Ya conocemos estas propiedades de los divisores de funciones por el hecho de que sabemos que tienen el mismo número de ceros que de polos por lo que:

Tenemos que si $latex f,g \in \mathbb{F}=\overline{\mathbb{K}}(C)$ es el campo de funciones de una curva elíptica (i.e. cúbica)

$latex div(f/g)=div(f)-div(g)$
$latex div(fg)=div(f)+div(g)$
$latex div(f^n)=n\cdot div(f)$


Nota sobre funciones en la curva: 
 Es importante considerar que para entender un objeto algebraico, hay que entender las funciones en éste, y si son proyectivos, cosas interesantes pasan, por ejemplo si tenemos la curva elíptica $latex C(x,y)=y^2 - x^3 + x$

Considera la función racional $latex q(x,y)= x/y \in \mathbb{F}=\hat{\mathbb{K}}(C)$ , podemos ver que $latex q(1,0)=\infty$ pero $latex q(0,0)=??$ , pero si usamos que esta función pertenece a la curva elíptica $latex C$ por lo que bajo la relación algebraica $latex y^2 = x^3 - x$ tenemos que $latex x/y = y/(x^2+1)$ por lo que en la curva, es decir en su campo de funciones $latex q(0,0)=0$.



Criptografía con campos de funciones elípticos vía teorema de Riemann-Roch.

Si consideramos la curva proyectiva elíptica $latex C$ homogeneizada con la variable $latex z$
aquí los ideales máximos son los puntos de la curva, y los anillos locales son las funciones racionales definidas en cada punto.

Si tomamos la linea $latex l_PQ$ que pasa por los puntos $latex P,Q \in \mathbb{P}_\mathbb{F}$

tal que la linea tiene pendiente finita, como demostramos en la parte 2, esta linea choca con otro punto al infinito que es el que corresponde al lugar infinito , veamos que multiplicidad tiene,

y sin usar bezout y con todos los teoremas anteriores, tenemos que si la multiplicidad es n entonces debe de haber n lugares en el divisor correspondiente a la linea porque $latex \partial(div(l_{PQ}))=0$


Tenemos que una curva elíptica es de la forma $latex y^2 = x^3 + \alpha x + \beta$

y $latex l_{PQ}$ es $latex y=mx+b$ por lo que si elevamos al cuadrado la linea e intersectamos con la curva

$latex (mx+b)^2 = x^3 + \alpha x + \beta$  es una cúbica en $latex x$ y en la homogenización tiene un cero de orden 3 en el punto al infinito $latex [1:0:1]$ el cual es el polo.

Eso quiere decir que si tenemos un polo de orden 3 , deben de haber 3 puntos donde choca la linea.
En símbolos:

La recta con pendiente distinta de 0 en la curva que pasa por P y Q:

$latex div(l_{PQ}/z) = (P)+(Q)+(R)-3\infty $

La recta que proyecta con el lugar infinito y R

$latex div(l_{R,\infty}/z)= R+(P+Q) -2\infty$

Por lo que:

$latex div(l_{PQ}/l_{R,\infty})=$ $latex div(l_{PQ}/z)-div(l_{R,\infty}/z)=(P)+(Q)-(P+Q)-\infty$

Por lo que de aquí sale la razón por la que está definida

Aquí vemos como se ven los divisores



Y de hecho, el grupo de Picard en este caso es isomorfo a los puntos de la curva bajo el mapeo:


$latex \Psi:C\rightarrow Pic^0(C)$
$latex P \mapsto P-\infty + Prin(\mathbb{F})$

Esto es inyectivo porque en género 1 con Riemann-Roch , ningún divisor $latex (P)-\infty$ es principal a menos que $latex P=\infty$


Espero les haya gustado

Eduardo Ruíz Duarte (beck)
twitter: @toorandom




Thursday, January 23, 2014

Cohomología de de-Rham (parte 1 motivación desde análisis básico)

Aquí en mi blog he publicado cosas relacionadas con formas diferenciales, funciones alternantes, rotacionales, espacios tangentes, productos tensoriales de k-álgebras, de hecho construimos todas las funciones diferenciales en una variedad y vimos la derivada direccional como un funcional lineal y todo esto fue con álgebra, de hecho construimos un anillo en posts anteriores, por lo que ya estamos listos para poder definir un tema un poco más profundo, lo que haremos es examinar la cohomología de formas diferenciales.


Sabemos que una función continua real que está definida en un abierto de $latex \mathbb{R}$ tiene una función primitiva, es decir, se integra. Pero... ¿qué pasa con funciones multivariables? .

Para empezar vamos a restringirnos a funciones $latex C^{\infty}$ , es decir que tienen derivadas parciales continuas de todos los ordenes.

Con el propósito de saber por qué estamos examinando esta teoría , pongamos un ejemplo.


Sea $latex f:U\rightarrow \mathbb{R}^2$ diferenciable definida en un abierto de $latex \mathbb{R}^2$

Pregunta $latex \star$
¿Existe una función $latex F:U\rightarrow \mathbb{R}$ tal que:

* $latex \frac{\partial F}{\partial x_1}=f_1$  y   $latex \frac{\partial F}{\partial x_2}=f_2$  con $latex f=(f_1,f_2)$?

Sabemos que


$latex \frac{\partial^2 F}{\partial x_2 \partial x_1} = \frac{\partial^2 F}{\partial x_1\partial x_2}$

Por lo que deberíamos tener que

** $latex \frac{\partial f_1}{x_2}=\frac{\partial f_2}{x_1}$


Ahora, ¿existe $latex F$ suponiendo que $latex f=(f_1,f_2)$ satisface ** , ¿es esa condición de la igualdad suficiente?


Ejemplo:

Considera la función $latex f:\mathbb{R}^2 \rightarrow \mathbb{R}^2$ dada por:

$latex f(x_1,x_2) = \Big ( \frac{-x_2}{x_1^2+x_2^2} , \frac{x_1}{x_1^2+x_2^2} \Big )$


Como ejercicio puedes calcular las parciales de esa función y verás que en efecto se satisfacen las ecuaciones de ** , sin embargo no existe una función $latex F:\mathbb{R}^2-\lbrace 0 \rbrace \rightarrow \mathbb{R}$ que satisface *, y esto es fácil verlo, supongamos que sí existe, entonces:


$latex \int_{0}^{2\pi} \frac{d}{d\theta}F(cos\theta, sen\theta)d\theta = F(1,0)-F(1,0)=0$


Por otro lado, si desarrollamos el término de la integral con la regla de la cadena:

$latex \frac{d}{d\theta}F(cos\theta, sen\theta)$

$latex = \frac{\partial F}{\partial x}\cdot (-sen\theta) +\frac{\partial F}{\partial y}\cdot cos\theta$
$latex = -f_1(cos\theta,sen\theta)\cdot sen\theta + f_2(cos\theta, sen\theta)\cdot cos\theta = 1$

Esto es claro 1, sustituye y usa la $latex f$ original , por lo que la integral no puede ser 0 y esta contradicción significa que tal $latex F$ no existe.

Definición: Un subconjunto $latex X\subset \mathbb{R}^n$ se dice que es estrellado con respecto a un punto $latex x_0 \in X$ si el segmento $latex \lbrace tx_0 + (1-t)x \mid t\in [0,1]\rbrace$ está contenido en $latex X$ para todo $latex x\in X$

Teorema 1: Sea $latex U \subset \mathbb{R}^2$ un abierto estrellado, entonces para toda función diferenciable $latex (f_1,f_2):U\rightarrow \mathbb{R}^2$ que satisface **, tenemos que la pregunta $latex \star$ tiene solución.

La demostración es un poco de talacha, ya la hice y no es difícil, pero el punto es ver que el que se pueda definir la primitiva de una función depende de la topología del abierto $latex U$, esto no es coincidencia, podemos definir un invariante.


Por simplicidad y como esto es motivación para lo fuerte, seguiremos en $latex \mathbb{R}^2$.

Dado el abierto $latex U\subset \mathbb{R}^2$ y sea $latex C^{\infty}(U,\mathbb{R}^2)$ todas las funciones diferenciables $latex \phi:U\rightarrow \mathbb{R}^2$ , esto es uno de los primero ejemplos de espacios vectoriales de funciones, puedes demostrar que lo son bajo la suma usual y producto por escalares, puedes ver a la $latex \phi$ como un campo vectorial sobre $latex U$ (dibujando $latex \phi(u)$ con el punto $latex u\in U$.

Como lo habíamos definido antes en otro post, pero aquí en dimensión 2, tenemos el gradiente y rotacional:

$latex grad:C^{\infty}(U.\mathbb{R})\rightarrow C^{\infty}(U,\mathbb{R}^2)$
$latex grad(\phi)=\Big( \frac{\partial \phi}{\partial x_1},\frac{\partial \phi}{\partial x_2}\Big)$

 $latex rot:C^{\infty}(U.\mathbb{R}^{2})\rightarrow C^{\infty}(U,\mathbb{R})$
$latex rot(\phi_1,\phi_2)=\frac{\partial \phi_1}{\partial x_2} - \frac{\partial \phi_2}{\partial x_1}$

Aquí empieza lo interesante:


Nota que $latex rot \circ grad=0$, eso significa que el kernel del rotacional contiene a la imagen del gradiente .

Tenemos que el rotacional y gradiente son operadores lineales esto es que $latex Im(grad)$ es un subespacio de $latex Ker(rot)$, por lo que podemos hablar de el cociente de espacios vectoriales, es decir el espacio de clases $latex \alpha + Im(grad)$ donde $latex \alpha \in Ker(rot)$

***

$latex H^1(U)= Ker(rot)/Im(grad)$

Con esta definición podemos reformular el teorema 1

Teorema 1a: $latex U\subset \mathbb{R}^2 estrellado \Rightarrow H^1(U)=0$

Por otro lado , tenemos que el Ejemplo que desarrollamos $latex H^1(\mathbb{R}-\lbrace 0 \rbrace)\neq 0$.

De hecho se puede demostrar con un poco de cuidado que:

$latex H^1(\mathbb{R}^2 - \displaystyle \cup_{i=1}^k \lbrace x_i \rbrace) \cong \mathbb{R}^k$

De hecho... $latex k$ será el número de componentes conexas del espacio en cuestión, por lo que podemos decir que la dimensión de $latex H^1(U)$ es el número de hoyos en $latex U$

Podemos definir en analogía con *** a $latex H^0(U)=Ker(grad)$.

Lo anterior de los hoyos y eso es algo que suena muy importante por lo que realmente creo que debemos demostrarlo, y no es difícil, por lo que vamos a definir un criterio de conexidad para $latex U$

Teorema 2: Un abierto $latex U\subset \mathbb{R}^k$ es conexo $latex \Leftrightarrow$ $latex H^0(U)=\mathbb{R}$

Demostración:

Tenemos que $latex H^0(U)=Ker(grad)$. por lo que supón que tienes que $latex grad(f)=0$, esto implica que $latex f$ es localmente constante, o sea que todo $latex x_0 \in U$ tiene una vecindad $latex V(x_0)$ con $latex f(x)=f(x_0)$ cuando $latex x \in V(x_0)$ , si $latex U$ es conexo, entonces toda función localmente constante es constante, de hecho , si $latex x_0 \in U$ el conjunto:

$latex \lbrace x\in U\mid f(x)=f(x_0)\rbrace = f^{-1}(f(x_0))$

Es cerrado porque recuerden que $latex f$ es continuo, diferenciable, etcétera, también es abierto ya que $latex f$ es localmente constante, por lo que es igual a $latex U$ y $latex H^0(U)=\mathbb{R}$.

Para el regreso es más fácil ya que si $latex U$ no es conexo, entonces existe una función sobre
$latex f:U\rightarrow \lbrace 0,1 \rbrace$ tal que es localmente constante, entonces $latex grad(f)=0$ por lo que $latex dim H^0(U)>1$   $latex \blacksquare$

De hecho con lo que vimos anteriormente con el número de hoyos podrías extender esta demostración para decir que la dimensión es el número de componentes conexos.

En $latex \mathbb{R}^3$ las cosas son más interesantes.


En tres dimensiones tenemos el operador de divergencia que también lo habíamos construido en un post anterior, si extendemos $latex grad$ y $latex rot$ a $latex \mathbb{R}^3$ de manera natural y definimos

$latex div(f_1,f_2,f_3)=\frac{\partial f_1}{\partial x_1} + \frac{\partial f_2}{\partial x_2} + \frac{\partial f_3}{x_3}$

Podemos notar que aquí también sucede que $latex rot \circ grad = 0$ y adicionalmente que $latex div \circ rot=0$

Construimos de manera similar a $latex H^0(U)$ y $latex H^1(U)$ y definimos:

$latex H^2(U)=Ker(div)/Im(rot)$


Ya se imaginarán por donde voy los que han llevado un poco de topología algebraica,
el siguiente post será ya con complejos CW para ir aterrizando la idea.

saludos

Eduardo Ruíz Duarte (beck)
Twitter: @toorandom








Saturday, December 14, 2013

Teorema de Riemann-Roch y divisores en criptografía, (Parte 2: Espacio proyectivo)

Como vimos anteriormente, lo que queremos es exprimir las propiedades de una curva algebraica a través de la geometría algebraica, en este caso de una curva elíptica o hiperelíptica.

Como lo mencioné al principio del post anterior, el grupo de una curva elíptica está fundamentado de manera "cochina" por (algunos) computólogos que implementan criptografía por el teorema de Bézout.

Siempre al definir una curva elíptica se define en su propiedad de grupo que un punto $latex (x,y)$ en la curva elíptica o hiperelíptica tiene como inverso a el punto $latex (x,-y)$ lo cual sucede al proyectarlo con un punto mágico que está en el infinito, esto es porque la curva elíptica realmente no vive en $latex \mathbb{R}^2$ como todos creen, realmente vive en otro espacio que es el que trataremos de explicar aquí, vive realmente en $latex \mathbb{P}^2_{\mathbb{C}}$, pronto veremos el por qué se les llama elípticas a través de otro nuevo espacio $latex \mathbb{C}/\Lambda$ y una función llamada $latex \wp$ de Weierstrass, pero eso aún está lejos de este post.

La respuesta elegante y limpia en vez de usar Bézout para justificar la estructura de grupo de una curva elíptica o hiperelíptica está a través del teorema de Riemann-Roch el cual trataremos de comprender a grandes rasgos, no olvides checar tu literatura

El teorema de Riemann-Roch une las propiedades algebraicas y topológicas de una curva, vamos a explorarlo un poco, aunque en esta primera parte del post definiremos primero lo que es el espacio proyectivo y algunas propiedades a través de ejemplos usando topología.

Como lo mencioné, vamos a hablar ahora del espacio proyectivo $latex \mathbb{P}^{n}_{\mathbb{K}}$, en el post anterior trabajamos en el espacio afín $latex \mathbb{A}^{n}_{\mathbb{K}}$ y definimos el campo de funciones, el cual jugará un papel imporante en Riemann-Roch

Recomiendo leer al menos la página de Wikipedia de geometría proyectiva así como el artículo del plano complejo proyectivo , aquí daré cierta intuición, ejemplos, definiciones y construcciones, para no dejar ese hueco.

Sea $latex V$ un espacio vectorial de dimensión finita sobre un campo $latex \mathbb{K}$ (de hecho para nuestros propósitos el espacio que tomaremos será $latex V=\mathbb{C}^2$) y considera la siguiente relación de equivalencia entre los vectores  $latex V\setminus \lbrace 0 \rbrace$:

$latex u\sim v \Leftrightarrow \exists \lambda \in \mathbb{K}^{*} \mid u=\lambda v$

Es decir, estamos diciendo que dos vectores $latex u$ y $latex v$ estarán en la misma partición (están relacionados) sí y sólo sí están en la misma linea que pasa por el origen, es decir, este espacio consta de todas las lineas que salen del origen bajo esta relación, con un ombligo, recuerda que quitamos al 0

Por lo que tenemos que si nuestro espacio vectorial  $latex V=\mathbb{C}^2$
$latex \mathbb{P}(V):=V\setminus \lbrace 0 \rbrace / \sim$

y para reducir notación:

$latex \mathbb{P}^{n}_{\mathbb{C}}:=\mathbb{P}(\mathbb{C}^{n+1})$

Por lo que a nosotros nos interesará trabajar en:

$latex \mathbb{P}^{2}_{\mathbb{C}}$

El cual es el plano proyectivo complejo.

Esta geometría realmente nace de la perspectiva a la hora de pintar un paisaje y quieres poder mostrar el horizonte en tu obra a pesar de que éste esté en el infinito.

De hecho, los puntos de $latex \mathbb{P}^{2}_{\mathbb{C}}$ son denotados como $latex [a:b:c]$

Ejemplo:

Como a mucha banda matemática y a mi, nos gustan los ejemplos para poder entender los conceptos abstractos, afortunadamente aquí sí hay algo en lo que todo el mundo es familiar.

Vamos a ver cómo se ve $latex \mathbb{P}^{1}_{\mathbb{R}}$, de hecho vamos a demostrar que este espacio es realmente homeomorfo al círculo $latex \mathbb{S}^1$

Este espacio se le llama linea proyectiva real y nace de considerar la relación de equivalencia mencionada inicialmente sobre $latex \mathbb{R}^2$.

Más formal:

Si $latex x,y\in \mathbb{R}^2$, tenemos que $latex x\sim y \Leftrightarrow x=\lambda y$ con $latex \lambda \in \mathbb{R}$ y:

$latex \mathbb{P}^{1}_{\mathbb{R}}=\mathbb{R}^2\setminus \lbrace 0 \rbrace / \sim$

Vamos a usar topología aquí para demostrar que $latex \mathbb{S}^1$ y $latex \mathbb{P}^{1}_{\mathbb{R}}$ son homeomorfos, de hecho la topología cociente aunque supongo que hay caminos tal vez más directos.

Consideremos:

$latex \psi:\mathbb{R}^2 \setminus \lbrace 0 \rbrace \rightarrow \mathbb{P}^1_{\mathbb{R}}$
$latex (x,y) \mapsto [x:y]$

Ahora, vamos a restringir esto a $latex \mathbb{S}^1$

es decir $latex \hat\psi = \psi\mid_{\mathbb{S}^1}$ por lo que tenemos que en $latex \hat\psi :\mathbb{S}^1 \rightarrow \mathbb{P}^1_{\mathbb{R}}$  $latex \hat\psi(x,y)=\hat\psi(-x,-y)$ es decir, a cada punto del círculo bajo la relación $latex \sim$ se reduce en la restricción al círculo a una relación más simple que le llamaremos $latex \hat\sim$ la cual definimos como $latex a,b\in \mathbb{S}^1$ entonces $latex a\hat\sim b\Leftrightarrow a=-b$

Es decir, la relación restringida al círculo nos dice que las antípodas están en la misma clase de equivalencia.

Entonces lo que basta demostrar es que $latex \tilde\psi:\mathbb{S}^1/\hat\sim \rightarrow \mathbb{S}^1$
es un homeomorfismo.

Consideremos el mapeo:

$latex \phi:\mathbb{S}^1 \rightarrow \mathbb{S}^1$

$latex (x,y) \mapsto (x^{2} - y^{2},2xy)$

Este mapeo está inspirado en $latex z\mapsto z^2$ en $latex \mathbb{C}$ pero viéndolo en $latex \mathbb{R}^2$ y restringido a $latex \mathbb{S}^1 \subset \mathbb{R}^2$

Este mapeo $latex \phi$ claramente es continuo y suprayectivo y $latex \phi$ pasa por el cociente bajo $latex \hat\sim$ o sea, respeta la relación de equivalencia $latex \hat\sim$ ya que si $latex z\in\mathbb{S}^1$ tenemos que $latex \phi(z)=\phi(-z) \Rightarrow z\hat\sim -z$

Usando la propiedad universal de la topología cociente con esta $latex \phi$ tenemos que $latex \tilde\psi:\mathbb{S}^1/\hat\sim \rightarrow \mathbb{S}^1$ es un homeomorfismo y es único.

Por lo que:

$latex \mathbb{P}^{1}_{\mathbb{R}}=\mathbb{R}^2\setminus \lbrace 0 \rbrace / \sim \cong \mathbb{S}^1$


Más ejemplos usuales existen , por ejemplo si nos tomamos $latex \mathbb{C}$ en vez de $latex \mathbb{R}$ ustedes pueden demostrar que la recta proyectiva compleja:

$latex \mathbb{P}^{1}_{\mathbb{C}} \cong \hat{\mathbb{C}}:=\mathbb{C}\cup \lbrace \infty \rbrace$

La cual es la esfera de Riemann, éste es un ejemplo fundamental en análisis complejo y geometría algebraica por ser una superficie de Riemann compacta, esto último es relevante ya que nos permite verla como una curva proyectiva algebraica.

Los espacios proyectivos complejos son una herramienta muy poderosa, ya que al agregar este punto $latex \infty$ en ciertos casos se puede definir la división por 0 haciendo que por ejemplo cualquier función racional meromorfa en los complejos sea extendida a una función continua sobre la la recta proyectiva compleja, mapeando sus polos al infinito y conservando continuidad.

En los espacios proyectivos suceden cosas interesantes, por ejemplo veremos que por la naturaleza del espacio en función de su relación de equivalencia, las ecuaciones algebraicas dentro de nuestro espacio proyectivo deberán ser homogéneas, o que existen un puntos que no están en el espacio vectorial en correspondencia con el proyectivo o que si definimos dos rectas paralelas en el espacio vectorial y lo transladamos al espacio proyectivo sí se intersectarán, de hecho TODAS las rectas del espacio proyectivo se intersectan en un punto 

Regresando a la analogía de las obras de pintura de paisajes, imagina ¿cómo pintarías la foto de unas vías del tren vistas de frente?, si observas bien las vías, éstas, pareciera que se intersectan en el horizonte.

Para terminar esto veamos lo que mencioné en negritas el penúltimo parrafo a éste.

Consideremos las soluciones (el conjunto de ceros) de un polinomio definido con sus variables en $latex \mathbb{P}^{n}_{\mathbb{K}}$ es decir, un punto en general sería con $latex n+1$ variables , $latex P=[x_0:...x_n]\in \mathbb{P}^{n}_{\mathbb{K}}$, estos puntos por como está definido el espacio proyectivo, están determinados por la multiplicación por un escalar $latex \lambda$, el cual da la relación de equivalencia, por lo que un polinomio con variables proyectivas deberán considerar esa restricción a la hora de considerar sus soluciones, estos polinomios se les llama homogéneos

Definición (polinomio homogéneo): Un polinomio:

$latex f(x_0,x_1,...,x_n) = \displaystyle \sum { a_{\eta_0...\eta_n}}x_{0}^{\eta_0}...x_{n}^{\eta_n}$

Se dice homogeneo de grado $latex d$ si TODOS sus monomios tienen el mismo grado $latex d=\sum_{i=0}^{n} \eta_i$

Por lo que si $latex f$ es homogéneo de grado $latex d$ entonces:

$latex f(\lambda x_0, ..., \lambda x_n)=\lambda^d f(x_0,...,x_n)$

Con esto tenemos que los polinomios homogéneos están bien definidos en el espacio proyectivo.

Ahora, lo que nos resta ver es una propiedad interesante, dos lineas siempre se intersectan en el plano proyectivo, y para esto lo que haremos un ejemplo, será transformar polinomios en dos variables complejas $latex \mathbb{C}^2$ a polinomios en $latex \mathbb{P}^2_{\mathbb{C}}$ a través de un proceso que se llama "homogenización" , y lo haremos con dos lineas paralelas, y veremos como es la intersección de sus imágenes.

La siguiente definición es para construir un polinomio cualquiera, a un polinomio homogéneo , es decir con monomios del mismo grado, esta operación es invertible.

Definición (homogeinización): Sea $latex p(x,y) \in \mathbb{C}[x,y]$, el polinomio correspondiente en $latex \mathbb{P}^2_{\mathbb{C}}$ es:

$latex p(x,y,z)=z^{n}p(\frac{x}{z},\frac{y}{z})$

Es fácil ver que el polinomio resultante de este proceso es realmente homogéneo.

Ejemplo (intersección de las imágenes bajo homogenización de dos rectas afines):

Sean
$latex x+y=2$
$latex x+y=3$

dos rectas definidas en $latex \mathbb{C}^2$

claramente son paralelas, homogeneizando tenemos que

$latex x+y=2z$
$latex x+y=3z$

por lo que tenemos que $latex [a:-a:0] \in \mathbb{P}^2_{\mathbb{C}}$ está en la linea al infinito y es solución de ambas ecuaciones,

nota que $latex [0:0:0]$ también es solución, pero éste punto no está definido en el espacio proyectivo por construcción.

Otro ejemplo serían dos circunferencias de radio distinto:


$latex x^2 + y^2 = 1$
$latex x^2 + y^2 = 2$

Claramente no se intersectan en el espacio afín complejo

Homogeneizando, tenemos que

$latex x^2 + y^2 -1 \mapsto z^2\Big ( \frac{x^2}{z^2}+\frac{y^2}{z^2}-1\Big )=x^2+y^2-z^2$

Similarmente con el otro polinomio, por lo que tenemos que intersectar en $latex \mathbb{P}^2_{\mathbb{C}}$

$latex x^2+y^2-z^2$   y   $latex x^2+y^2-2z^2$

y tenemos que todos los puntos de la forma $latex \lambda(\pm 1,\pm i,0)$ son soluciones, y si $latex \lambda \neq 0$

tenemos que $latex [\pm 1:\pm i:0]\in \mathbb{P}^2_{\mathbb{C}}$ es un punto en la linea al infinito que intersecta a ambas circunferencias proyectivas de distinto radio.

La relación con curvas elípticas será que éstas realmente hay que proyectivizarlas (homogeneizarlas) y al trabajar con ellas en criptografía es viéndolas en el espacio proyectivo, es decir para que todo funcione como queremos necesitamos la cerradura proyectiva, mas no el hecho de usar un punto cualquiera para darle estructura de grupo.


Con esto, y el post anterior estamos listos para la siguiente parte que será el teorema de Riemann-Roch


Eduardo Ruiz Duarte (beck)
twitter: @toorandom

Wednesday, December 11, 2013

Teorema de Riemann-Roch y divisores en criptografía (Parte 1: campos de funciones y gavillas sobre variedades)

En criptografía muchos han visto que se estudian las curvas elípticas y menos frecuentemente las curvas hiperelípticas, algunos recordarán la estructura de grupo que se le da a una curva elíptica $latex C$ con la usual regla de intersección de una recta con la curva haciendo uso abusivo del teorema de Bézout para fundamentar la estructura de grupo que hay en sus puntos, que más formalmente, es la estructura de grupo que hay en las clases de divisores formados por las sumas formales de ideales máximos de todos los subanillos del campo de funciones de $latex \mathbb{K}(C)$, este grupo es el grupo de Picard de orden 0 de la curva $latex C$ que es:

 $latex Pic^0(C) = Div^0(C)/Prin(C) \cong \mathbb{J}(C)$.

Esta manera de ver las cosas NO es para complicar lo ya existente, sino es con propósitos de poder exprimir más la teoría que lo respalda para poder investigarlo mejor y generalizarlo a otras curvas no elípticas.

La estructura de grupo de manera inocente o usual se puede ver en muchos textos pobres en matemáticas pero tal vez ricos en aplicaciones criptográficas como esto:



El propósito de este post será el poder resumirte la teoría que hay detrás.


Comencemos con unas definiciones, voy a suponer que quien me lee está familiarizado con la topología de Zariski la cual está definida por los conjuntos algebraicos como cerrados, de hecho estas definiciones son las interesantes para la topología de Zariski, y con esto pueden demostrar fácilmente las propiedades de espacio topológico.

Definición (ceros):
Sea $latex A:= \mathbb{K}[x_1,...,x_n]$ el anillo de polinomios en $latex n$ variables sobre el campo algebraicamente cerrado $latex \mathbb{K}$ y $latex J \subset \mathbb{K}[x_1,...,x_n]$ un ideal, entonces definimos el conjunto de ceros del ideal $latex J$ como:

$latex V(J):=\lbrace P\in \mathbb{A}^{n}_{\mathbb{K}} \mid f(P)=0$     $latex \forall f\in J\rbrace$


Definición (variedad afín): Un subconjunto $latex X\subset \mathbb{A}^n_{\mathbb{K}}$ es un conjunto algebraico (variedad afín) en el espacio afín $latex \mathbb{A}^n_{\mathbb{K}}$ si existe un $latex T\subset \mathbb{K}[x_1,...,x_n]$ tal que:

$latex X=V(T)$

Decimos que $latex X$ es un cerrado de Zariski, en la topología dada a  $latex \mathbb{A}^n_{\mathbb{K}}$.

Veámos primero lo que es el anillo de coordenadas de una variedad.

Definición (función polinomial en la variedad V): Una función polinomial es un mapeo $latex f:V \rightarrow \mathbb{K}$ tal que existe un $latex F\in \mathbb{K}[x_1,...,x_n]$ con $latex f(P)=F(P)$  $latex \forall P\in V$

Este polinomio $latex F$ no está únicamente determinado por los valores que toma en $latex V$ o sea si tenemos $latex F,G\in \mathbb{K}[x_1,...,x_n]$:


$latex F\mid_{V}=G\mid_{V} \Leftrightarrow (F-G)\mid_{V}=0 \Leftrightarrow F-G\in I(V)$

Donde:

$latex I(V):=\lbrace f\in \mathbb{K}[x_1,...,x_n] \mid f(P)=0$    $latex \forall P\in V\rbrace$



Esta definición de función polinomial y su relación de igualdad con otros polinomios, huele a una relación de equivalencia, por lo que vamos a suponer que lo es y se deja a quien lee para que lo demuestre y tenemos que:

Denotaremos ahora a $latex V$ como el conjunto algebraico $latex V(I)$ donde $latex I$ es ideal de $latex \mathbb{K}[x_1,...,x_n]$

Definición (anillo de coordenadas de una variedad): Un anillo de coordenadas de una variedad $latex V$ es:

$latex \mathbb{K}[V]:=\mathbb{K}[x_1,...,x_n]/I(V)$

Este anillo sabemos que es un dominio entero si $latex I(V)$ es un ideal primo, y esto naturalmente sucede si $latex V$ es irreducible , es decir no es union de otros cerrados de zariski


De lo anterior sobre funciones polinomiales y la última definición se puede demostrar que:

$latex K[V]=\lbrace f \mid f:V\rightarrow \mathbb{K}$ es una función polinomial $latex \rbrace$

Cabe notar que se le llama anillo de coordenadas porque las funciones que te dan la i-ésima coordenada de los elementos de $latex V$, $latex x_i$ son las generadoras de $latex \mathbb{K}[V]$

Es fácil ver que $latex \mathbb{K}[ \mathbb{A}^n_{\mathbb{K}}]=\mathbb{K}[x_1,...,x_n]$ y que el anillo $latex \mathbb{K}[V]$ juega el papel para $latex V$ como $latex \mathbb{K}[x_1,...,x_n]$ para $latex \mathbb{A}^n_{\mathbb{K}}$

Observaciónes sobre lo anterior con respecto a la topología de Zariski en $latex \mathbb{A}^n_{\mathbb{K}}$.


  • Los ideales primos de $latex \mathbb{K}[V]$ están en correspondencia 1:1 con irreducibles $latex W\subset V$
  • Los ideales máximos de  $latex \mathbb{K}[V]$ están en correspondencia 1:1 con los puntos de $latex V$
  • Los ideales radicales de $latex \mathbb{K}[V]$ están en correspondencia 1:1 con los cerrados $latex W\subset V$

Definición (campo de funciones de V): El campo de funciones de $latex V$ es el campo de fracciones de $latex \mathbb{K}[V]$ y es denotado por $latex \mathbb{K}(V)$, las $latex f\in \mathbb{K}(V)$ se llaman funciones racionales sobre $latex V$

Definición (función regular en P): Una función $latex f\in \mathbb{K}(V)$ y $latex P\in V$ se dice que es regular en $latex P$ si $latex f=\frac{g}{h}$ con $latex h(P)\neq 0$, y definimos:

$latex dom(f):=\lbrace P\in V \mid f$ es regular en $latex P\rbrace$

Proposición: El conjunto:

$latex V_f:=\lbrace P\in V\mid f(P)\neq 0\rbrace$

es un abierto de $latex V$


Teorema: 

  • $latex dom(f)$ es abierto y denso en $latex V$
  • $latex dom(f)=V\Leftrightarrow f\in \mathbb{K}[V]$
  • $latex V_g\subset dom(f) \Leftrightarrow f\in \mathbb{K}[V][1/g]$

Ahora, entraremos a un concepto central, para poder analizar una variedad localmente... para esto sabemos que un anillo local sólo tienen un ideal máximo, y tenemos que la siguiente definición

Definición (anillo de funciones regulares): El anillo de funciones regulares de $latex V$ localizado en el punto $latex P\in V$ es:

$latex O_{V,P}:=\lbrace f\in \mathbb{K}(V)\mid f$ es regular en $latex P\rbrace$

Es fácil demostrar que esto es en efecto un subanillo de $latex  \mathbb{K}(V)$ y que su único ideal máximo no deberá tener unidades por lo que su ideal máximo es:

$latex m_{P}:=\lbrace f/g \in \mathbb{K}(V)\mid f(P)=0, g(P)\neq 0 \rbrace$

Ahora vamos a la últma parte de este blog donde discutiremos la estructura de gavilla de una variedad

Estructura de gavilla de una variedad

Tenemos que el anillo $latex O_{V,P}$ es local y es un subanillo de $latex \mathbb{K}(V)$ y su ideal máximo es $latex m_{P}$, es fácil relacionar a $latex O_{V,P}$ con $latex \mathbb{K}[V]$ ya que con localización puedes demostrar que:

$latex \hat{m}_P=\lbrace f\in \mathbb{K}[V]\mid f(P)=0\rbrace=I(\lbrace P \rbrace)+I(V)\subset \mathbb{K}[V]$

Es máximo y:

$latex O_{V,P}=\mathbb{K}[V]_{\hat{m}_P}$


Es decir que $latex O_{V,P}$ es la localización del anillo de coordenadas de $latex V$ en el ideal máximo $latex \hat{m}_P$

Ahora vamos a definir el concepto final:

Definición-Teorema (estructura de gavilla en $latex O_{V}(U)$, germen y fibra ): Para todo abierto $latex U \subset V$ tenemos:

$latex O(U):=O_{V}(U):=\lbrace f\in \mathbb{K}(V) \mid f$ es regular en $latex U \rbrace$

Es una $latex \mathbb{K}-$álgebra con $latex O_{V}(\emptyset):=\lbrace 0 \rbrace$

Todos los $latex O_{V}(U)$ con $latex U\subset V$ forman una gavilla $latex O_V$ bajo la restricción de homomorfismos usual y el anillo $latex O_{V,P}$ es una fibra de la gavilla $latex O_V$  y los elementos $latex f\in O_{V,P}$ se les llama gérmenes de funciones y:

$latex O(V)=\mathbb{K}[V]$


La teoría de gavillas da una estructura rica a una variedad, en este caso , puede ser el de una curva elíptica o hiperelíptica

Saludos

Eduardo Ruiz Duarte (beck)
Twitter: @toorandom

Wednesday, December 04, 2013

Criptografía asimétrica combinatoria-algebraica no usual con bases de Gröbner

Siempre me ha gustado investigar estructuras algebraicas con el fin de poder ver si puedo sumergir criptografía asimétrica dura ahí, generalmente ésta basada en el problema de logaritmo discreto en curvas algebraicas; considero que es mi área favorita de trabajo y posiblemente a lo que me vaya a dedicar el resto de mi vida, pero aquí vamos a ver algo diferente que podría o no ser seguro en su implementación pero no deja de ser interesante.


Primero vamos a analizar un caso particular de un esquema de cifrado con polinomios y luego veremos cómo generalizarlo y definiendo con bases de Gröbner.

Vamos a utilizar cualquier $latex \mathbb{F}-algebra$ de tipo finito, i.e. finitamente generada, con grado de trascendencia $latex n$ veamos cómo funciona esto.

Construcción del algoritmo de cifrado:

Sea $latex \mathbb{F}$ un campo finito y $latex T=\lbrace t_{i}\rbrace_{i=1}^{n}$ un conjunto de variables.


Queremos que $latex A$ reciba un mensaje $latex m\in \mathbb{F}$ de $latex B$ cifrado.

  • $latex A$ va a escoger un vector aleatorio $latex y\in \mathbb{F}^{n}$ como llave privada

  • $latex A$ escoge polinomios como llave pública $latex P=\lbrace q_j \rbrace \subseteq \mathbb{F}[T]$ tal que $latex q_j(y)=0$ $latex \forall j$
         Es fácil generar polinomios con los ceros que necesitamos, por ejemplo si
         ya tenemos la llave privada $latex y$ tomas $latex q_j = \hat {q}_j - \hat{q}_j(y)$ con $latex \hat{q}_j \in \mathbb{F}[T]$.
         Lo que no es tan fácil es escogerlos seguros y álgebraicamente independientes, pero hay métodos.

  •  $latex B$ quiere mandar el mensaje $latex m\in \mathbb{F}$ a $latex A$ por lo que se toma un elemento del ideal generado por la llave pública $latex P$ que es $latex (P) \subset \mathbb{F}[T]$:

   $latex p = \displaystyle \sum { h_j q_j } $

En otras palabras escoge $latex \lbrace h_j \rbrace \subset \mathbb{F}[T]$ y genera el polinomio $latex p$

  • $latex B$ le manda a $latex A$ el polinomio multivariable        
$latex c=p+m$


Este esquema de cifrado funciona ya que $latex A$ va a poder obtener $latex m\in \mathbb{F}$ ya que conoce los ceros de los generadores del ideal $latex (P)\in \mathbb{F}[T]$ por lo tanto conoce los ceros de $latex p$ independientemente de los $latex \lbrace h_j \rbrace$ , por lo que usando su llave privada $latex y$ tenemos que $latex A$ puede calcular fácilmente

$latex c(y)=p(y)+m=m$


Nota que este esquema de cifrado es probabilístico y no determinístico, i.e. en cada
ocasión que se cifra $latex m$ es diferente ya que depende de los elementos del ideal de la llave pública que se tomen.

Su seguridad también depende de los ceros del conjunto algebraico generado por $latex B$, en este caso cada cero sería $latex y=(y_1,y_2,...,y_n)$ y cualquier cero en la intersección de las hipersuperficies funcionaría, su seguridad depende de la solución de sistemas de ecuaciones algebraicos no lineales de grado arbitrario , es decir, en dimensión grande y con un número grande de polinomios generadores independientes del ideal de la llave pública, es POSIBLE tener criptografía segura, digo posible porque no se ha demostrado que su solución NO sea en tiempo polinomial, pero creo que podría ser más seguro si usamos la teoría de bases de Gröbner.

Generalización:

Veamos unas definiciones que vienen de la teoría de bases de Gröbner para poder intentar una generalización, las cuales incluyen la reducción módulo otro polinomio multivariable, donde los monomios deberán estar ordenados bajo cierto orden lexicográfico.

Definición (módulo polinomio multivariable): Decimos que $latex f$ reduce a $latex h$ módulo $latex g$ parcialmente si $latex a_{i}X^{i}$ es un monomio de $latex f$ que es divisible por el término líder de $latex g$ ,$latex lt(g)$ (líder bajo el órden con el que organicemos nuestros polinomios como el lexicográfico por grado) y que sucede que:

$latex h=f-\frac{a_{i}X^{i}}{lt(g)}g$

Donde escribimos que $latex f \equiv h \bmod g$

Definición (módulo un conjunto de polinomios): Sea $latex G=\lbrace g_1,...,g_l \rbrace \subset \mathbb{F}[T]$ y sea $latex f\in \mathbb{F}[T]$, entonces decimos que $latex f$ se reduce a $latex h$ módulo $latex G$ ($latex f \equiv h \bmod G$) si tenemos la sucesión $latex h_0=f, ..., h_k=h$ tal que $latex h_j \equiv h_{j+1} \bmod g$ para algún $latex g\in G$

Definición (base de Gröbner): Sea $latex F=\lbrace g_1, ..., g_l \rbrace \subset \mathbb{F}[T]$ un conjunto finito de polinomios en $latex m=|T|$ variables e $latex I\subset \mathbb{F}[T]$ el ideal generado por $latex F$, decimos que $latex F$ es una base de Gröbner para el ideal $latex I$ si para todo $latex 0\neq f\in I$ se tiene que $latex lt(g_k)\mid lt(f)$ para algún $latex g_k\in F$


Teorema: F es una base de Gröbner para un ideal $latex I\subset \mathbb{F}[T]$ $latex \Leftrightarrow$ $latex \forall f \in I$ $latex f\equiv 0 \bmod F$

Con este último teorema nos resulta TRIVIAL el poder construir ideales aleatorios (finitos, anillos noetherianos) y su base de Gröbner asociada.

Regresando al esquema de cifrado original y rehaciéndolo con esto:

$latex A$ escoge una base de Gröbner $latex G=\lbrace g_1,...,g_l\rbrace$ de un ideal $latex I \subset \mathbb{F}[T]$, la llave privada de $latex A$ es $latex G$.

Sea $latex S\subset \mathbb{F}[T]$ el conjunto de TODOS los polinomios que no pueden ser reducidos módulo $latex G$ (ve las definiciones anteriores), este $latex S$ realmente sería el conjunto de representantes del anillo $latex \mathbb{F}[T]/I$ como ya se lo habrán imaginado, ahora supón que $latex S$ es público, aunque $latex G$ no lo sea, tenemos que todo mensaje $latex m \in \mathbb{F}$ es un elemento de $latex S$.

Un ejemplo:


 Sea $latex T=\lbrace t_1,...,t_n\rbrace$ y $latex y \in \mathbb{F}^n$ un punto secreto, $latex A$ toma como base de gröbner $latex G=\lbrace t_1-y_1, ..., t_n - y_n\rbrace$  en este caso tenemos que $latex S=\mathbb{F}[T]/(G)\cong \mathbb{F}$ es el campo de las constantes.

Ahora $latex A$ escoge un conjunto como llave pública $latex P=\lbrace q_j \rbrace \subset I=(G)$, esto es fácil ya que  podría tomar un $latex \hat{q}_j\in \mathbb{F}[T]$ arbitrario y calcular $latex q_j = \hat{q}_j - \overline{q}_j$ donde $latex \overline{q}_j \in S$ y $latex \hat{q}_j \equiv \overline{q}_j \bmod G$

Consideremos el ideal $latex J=(P)$ y $latex m\in S$, entonces $latex B$ le cifrará a $latex A$ el mensaje $latex m$ escogiendo al azar un elemento de $latex J$, ya que la llave pública de $latex A$ es $latex P$ y $latex J=(P)$:

$latex p=\displaystyle \sum h_{j}q{j} \in J$

$latex B$ le manda a $latex A$ $latex c=p+m$

$latex A$ al recibir $latex c$ sólo tendría que reducirlo módulo la base de Gröbner $latex G$ 

En este ejemplo cuando $latex G=\lbrace t_i - y_i \rbrace$ sería el caso particular que vimos en el principio.


Esta criptografía es rara y no es usada ni considerada AÚN SEGURA debido a que falta demostrar que tan dificil es el problema en términos de complejidad.


Espero les haya gustado

Eduardo Ruíz Duarte (beck)
@toorandom