Tuesday, February 10, 2015

Encontrando números primos grandes con approach matemático-computacional

Si estás de un smartphone no se verán los símbolos, probablemente quieras verlos así que haz click aquí

Recientemente me vi en la necesidad de encontrar algunos números primos grandes de la forma $latex (3*8^n)-1$ por una cuestión de un problema de geometría aritmética y primality testing, quiénes creo que se podrían interesar en esto fueron en Facebook Esteban Gutierrez y Manuel López Michelone quiénes comentaron sobre esto, un análisis rápido te dice que ese número es primo para $latex n\in \lbrace 1,2,6,72,1092,5687 \rbrace$ pero otro análisis no tan rápido que hice fue para descubrir $latex n=17129$, estos número para el ojo inocente parecerían inofensivos, pero para $latex n=17129$ nos encontramos con un número de 16,000 dígitos aproximadamente, y ahora mi workstation está checando $latex >n=35000$ que son como 32,000 dígitos decimales, es decir 105,000 bits, tardándose aproximadamente 30 minutos por cada thread (hice 32 POSIX-threads) entonces me arroja aproximadamente 32 resultados cada media hora, y el tiempo sube por cada iteración logarítmicamente, así que si sigo así pronto comenzará a tardar horas, el código lo voy a publicar ahorita, así que encontrarán las ligas al final de este post para que lo corra cualquier linuxero, o mejor decir... "POSIXERO" ya que toda el api que uso al final es POSIX compliant y para manejar números grandes y hacer aritmética uso BN  (Bignum) de OpenSSL que considero es lo más rápido ya que se usa en la industria, el código detecta tus procesadores y usa TODOS, así que tomalo en cuenta con el nice, tiene macros para funcionar en OSX (Apple) ya que pthread_set_affinity_np() y CPU_SET funcionan diferente.

La pregunta matemática sería:

¿Existen una cantidad infinita de números primos de esta forma?


Ahora explicaré cómo lo hice para que sea lo más óptimo que se me pudo ocurrir.

1. Construir número optimamente

$latex (3*8^n)-1$ lo podemos fabricar en binario en vez de calcularlo, con esto nos evitamos muchos ciclos del procesador


Por un lado tenemos que $latex 8^n=2^{3n}$  y $latex 2^m=1000...000B$ con $latex m$ $latex 0$'s eso significa que $latex 8^n$ tiene $latex 3n$ ceros y un $latex 1$ al principio, después multiplicar por $latex 3$ es lo mismo que sumar $latex 3$ veces $latex 1000...000B$ el cual será el número $latex 11000...000B$ con $latex 3n$ ceros y restar $latex 1$ será negar todos los ceros y el segundo $latex 1$ por lo que va a quedar    $latex (3*8^n)-1=10111...111B$   donde el número de $latex 1$'s menos significativos es $latex 3n$ , con esto ya no tenemos que calcular exponenciación que es muy costosa.

2. Ignorar números que nos harán perder el tiempo

Sucede MUY frecuentemente que $latex (3*8^n)-1$ es múltiplo de $latex 5$ , esto es fácil verlo
ya que si $latex 3*8^n$ termina en $latex 6$ o $latex 1$ entonces $latex (3*8^n)-1$ es múltiplo de $latex 5$, pero no puede terminar en $latex 1$ porque $latex 3*8^n$ es par, y para que termine en $latex 6$ como $latex 8^n$ termina en $latex 8,4,2,6,8,4,2,6,8,...$ (en ese orden comenzando con n=1) nos interesa saber cuándo $latex 8^n$ termina en $latex 2$ para que $latex 3*8^n$ termine en $latex 6$ y por consiguiente $latex (3*8^n)-1$ sea múltiplo de $latex 5$.

Un chequeo rápido y respaldado por la propiedad inductiva en los número naturales sobre $latex n$ tenemos que $latex 8^n$ termina en $latex 2$ si $latex n=3,7,11,15$ es decir si $latex n=4t-1$ y más computacionalmente si $latex n\equiv 3 \mod 4$ o más humano "si $latex n-3$ es múltiplo de $latex 4$" entonces esto nos dice que podemos eliminar automáticamente 25% de todos los exponentes al checar $latex (3*8^n)-1$ ya que serán múltiplos de $latex 5$

3. Optimizar test de primalidad y utilizar números más familiares para una computadora

Una vez construido el número, y filtrados los exponentes que hacen trivialmente compuesto al número, necesitamos ver que lo que tenemos en efecto sea un número primo.

Para hacer esto nos auxiliaremos en el pequeño teorema de Fermat el cual lo escribo diferente a Fermat para que se entienda dice:

Teorema de Fermat
Si $latex p$ es primo y $latex mcd(p,a)=1$ $latex \Rightarrow$ $latex a^p - a$ es múltiplo de $latex p$

Equivalente

Si $latex p$ es primo y $latex mcd(p,a)=1$ $latex \Rightarrow$ $latex a^{p-1} \equiv 1 \bmod p$

Esto es lo mejor que tenemos y lo peor es que existe la posibilidad de un "falso positivo"
ya que el teorema aquí ya supone que $latex p$ es primo, es decir estamos checando una propiedad que tiene un número primo siempre, pero podría tenerla otro número también ya que el teorema no es un "si y sólo sí" $latex \Leftrightarrow$ , pero para nuestra fortuna, los números que cumplen la propiedad de Fermat y no son primos son "strong pseudo-primes" , "Fermat Liars" y son raros, de hecho yo prefiero Números de Carmichael quién fue el que los estudió y para nuestra fortuna, no hay tantos y son raros, y si nos toparamos con un "posible primo" , cambiamos la $latex a$ del teorema de Fermat y volvemos a probar y si también se cumple la congruencia, es ya casi un hecho que lo que tenemos es primo.

Pero bueno aún podemos optimizar MÁS , vamos a optimizar el teorema de Fermat, ya que como pueden ver... vamos a tener que elevar un número (en mi caso 2) a la $latex x$ donde $latex x$ es un número de más de 30 mil dígitos, módulo es número de 30 mil dígitos... afortunadamente existen algoritmos para hacer esto en tiempo logarítmico pero aún así es tardado, así que si podemos eliminar más ciclos sería bueno.

Tenemos que $latex x=(3*8^n)-1$ nunca es el número primo $latex 2$ así que podemos suponer que es impar sin ningún problema , por un lado tenemos que $latex a^{x-1} \equiv 1 \bmod x \Leftrightarrow a^{x-1} -1 \equiv 0 \bmod x$ si $latex x$ es primo,  ahora,  $latex x-1=2k$ es decir es par, entonces $latex a^{x-1}-1 = a^{2k}-1 = (a^k -1)(a^k + 1) \equiv 0 \bmod x$ (diferencia de cuadrados), como $latex k=\frac{x-1}{2}$ entonces tenemos  que $latex (a^{\frac{x-1}{2}}-1)(a^{\frac{x-1}{2}}+1) \equiv 0 \bmod x$ lo que significa que para que se cumpla Fermat, tiene que suceder que $latex a^{\frac{x-1}{2}}\equiv 1$ ó $latex -1 \bmod x$ donde $latex -1\equiv x-1 \bmod x$ y con esto reducimos 1 ciclo más en la exponenciación modular que es muy costosa, y usamos $latex a=2$ ya que la exponenciación por 2 sólo es shifting a la izquierda, y usando 2 es hermoso para el algoritmo de exponenciación modular porque la complejidad
$latex o(3kn^{1.585})$ (Multiplicación Karasuba y reducción Montgomery para mod_exp hasta donde sé que usa BN de OpenSSL) esperada baja considerablemente teniendo muchos 0's en su expresión lo que reduce pasos (por eso la $latex o(g[n]))$ y no la $latex O(g[n]))$),  donde $latex 3k$ es el número de bits de $latex x$ (nota aquí que la $latex n$ representa la variable de complejidad y no el exponente), y con eso hemos encontrado los primos que mencioné al principio.

Espero opiniones, source code aquí

Eduardo Ruíz Duarte
twitter: @toorandom

Por Morbo aquí les dejo el más grande que he encontrado, tardó 3 minutos en 1 thread. el cual es $latex (3*8^{17129})-1$ el cual tiene 51,388 bits .






Monday, February 09, 2015

Complejos de de Rham y cohomología (Derivaciones parte 1/4)

Esta es una especie de continuación de un post donde traté de llegar desde el cálculo hasta la cohomología de de Rham utilizando rotacional, divergencia y gradiente (De Rham), pero es hora de hacerlo formalmente, y para ello necesitaremos imaginarnos unos espacios que se llaman diferenciales de Kähler, antes hablé de diferenciales y k-formas diferenciales , pero lo retomaremos, el punto de este post será poder usar la cohomología de de Rham para saber si una curva hiperelíptica sobre un campo finito es segura criptográficamente hablando calculando el número de elementos de su jacobiana el cuál nos dice sobre su seguridad de acuerdo a su factorización, y para esto utilizaremos el teorema del punto fijo de Lefschetz sobre el morfismo de Frobenius en característica 0 p-ádico (lift a $latex \mathbb{Q}_p$) definido en el primer grupo de cohomología de una subálgebra de de Rham, para eso primero veremos como construir toda el álgebra de de Rham usando diferenciales de Kähler.

Pero antes de todo esto necesitamos empezar con los preliminares, que serán el concepto de derivacion en cualquier álgebra.


Derivaciones en un punto

La derivada en dirección de un vector tangente $latex v$ a un punto $latex p\in \mathbb{R}^n$ de una función $latex f\in C^{\infty}(\mathbb{R}^n)$ es un número real:

$latex D_v(f):=\sum_{i=1}^n x_i(v) \frac{\partial f}{\partial x_i}(p)$

Donde $latex x_i$ son las coordenadas en $latex \mathbb{R}^n$ y $latex x_i(v)=v_i$ (i-ésimo componente de $latex v$)

Para todo vector tangente $latex v$ a un punto $latex p\in \mathbb{R}^n$ tenemos que la derivada direccional en $latex p$ nos da un mapeo de espacios vectoriales

$latex D_v:C^{\infty}_p\rightarrow \mathbb{R}$


que manda $latex f$ definida en $latex p$ a un número real, en general la función $latex D_v$ está definida como:

$latex D_v=\sum x_i(v) \frac{\partial}{\partial x^{i}}\mid_p$


Tenemos que $latex \forall v\in T_p(\mathbb{R}^n)$ hay un $latex D_v$ y todos cumplen la regla de Leibniz, es decir $latex D_v(fg)=(D_vf)g(p)+f(p)D_vg$.

Todos los mapeos $latex \mathbb{R}$-lineales $latex D:C^{\infty}_p\rightarrow \mathbb{R}$ que satisfacen la regla de Leibniz son derivaciones en $latex p$  y denotamos a todas las derivaciones en $latex p$ como $latex \mathbb{D}_p(\mathbb{R}^n)$ y de hecho este espacio es un espacio vectorial ya que dos derivaciones sumadas en el mismo punto es una derivación, y como es $latex \mathbb{R}$-lineal no pierden la propiedad de Leibniz al multiplicarlas por un escalar, entonces por ahora ya tenemos que TODAS las derivadas direccionales en $latex p$ son todas las derivadas en $latex p$ por lo que tenemos un mapeo.


$latex \phi:T_p(\mathbb{R}^n)\rightarrow \mathbb{D}_p(\mathbb{R}^n)$
$latex v\mapsto D_v=\sum x_i(v) \frac{\partial}{\partial x^{i}}\mid_p$


Como $latex D_v$ es lineal en $latex v$ , el mapeo $latex \phi$ es un mapeo de espacios vectoriales, faltaría ver qué sucede con las constantes, es decir que si $latex D\in \mathbb{D}_p(\mathbb{R}^n)$ entonces si $latex c\in\mathbb{R}$ entonces $latex D(c)=0$ pero esto se sigue que la linealidad y la regla de Leibniz haciendo que $latex c=1c$.

Función $latex \delta$ de Kronecker

Ésta es una función muy útil para la notación
$latex \delta_j^i=\left\{\begin{array}{11} 1&\mbox{if } i=j\\ 0 & \mbox{if }i \neq j \end{array}\right$

Ahora, tenemos que es fácil demostrar que $latex \phi$ definido previamente es un isomorfismo, es decir $latex T_p(\mathbb{R}^n) \cong \mathbb{D}_p(\mathbb{R}^n)$ ya que si procedemos naturalmente al suponer que $latex D_v=0$ para algún $latex v\in T_p(\mathbb{R}^n)$ entonces $latex 0=D_v(x_j)=\sum_i v^i \frac{\partial}{\partial x_i}\mid_p x_j = \sum_i x_i(v)\delta_i^j = x_j(v)$ y entonces $latex v=0$ lo que nos dice que $latex \phi$ es inyectiva.

Aquí la función $latex \delta$ nos ayuda a eliminar las parciales en las variables que no son iguales al índice con notación más limpia, la suprayectividad la pueden demostrar ustedes.

Lo que sucede aquí es que para todo vector tangente a $latex p$ tenemos una derivación en $latex p$ entonces si ambos son espacios vectoriales, uno de puntos... y otro de derivaciones, lo más natural es identificar sus bases estándares, si $latex \lbrace e_1,e_2,...,e_n \rbrace$ es base de $latex T_p(\mathbb{R}^n)$ entonces bajo este isomorfismo tenemos que:

$latex \phi(e_i) = \sum_i \delta_i^j \frac{\partial}{\partial x_i}\mid_p=\frac{\partial}{\partial x_i}$

Por lo que: 

$latex \bigg \lbrace \frac{\partial}{\partial x_1}\mid _p,..., \frac{\partial}{\partial x_n}\mid_p\bigg\rbrace$ genera al espacio vectorial $latex \mathbb{D}_p(\mathbb{R}^n)$ y es su base estándar.

Con esto nos conviene denotar a los vectores $latex v\in T_p(\mathbb{R}^n)$ tangentes a $latex p$ más explícitamente en términos de la base de $latex \mathbb{D}_p(\mathbb{R}^n)$ los cuales son puntos $latex v=\sum v_i e_i = \sum x_i(v) e_i = (v_1,...,v_n)$ como:

$latex v=\sum v_i \frac{\partial}{\partial x_i}\mid_p$


Campos vectoriales

Si $latex U\subset \mathbb{R}^n$ es un abierto un campo vectorial $latex X$ es una función que asigna a $latex p\in U$ un vector tangente $latex X_p \in T_p(\mathbb{R})^n$, este vector $latex X_p$ en términos de la base $latex \bigg \lbrace \frac{\partial}{\partial x_j}\mid_p \bigg \rbrace$ es:

$latex X_p=\sum a_i(p) \frac{\partial}{\partial x_i}\mid_p = (a_1,...,a_n)$ 

con $latex p\in U$, $latex a_i\in C^\infty(U)$, $latex a_i(p)\in \mathbb{R}$ 

Podemos omitir la $latex p$ en este caso y decir que el campo vectorial $latex X=\sum a_i \partial/\partial x_j$ 

Ejemplos típicos:

$latex X=\frac{-y}{\sqrt{x^2+y^2}}\frac{\partial}{\partial x}+\frac{x}{\sqrt{x^2+y^2}}\frac{\partial}{\partial y}= \bigg ( \frac{-y}{\sqrt{x^2+y^2}},\frac{x}{\sqrt{x^2+y^2}} \bigg )$

y

$latex Z=\frac{x\partial}{\partial x} + \frac{-y\partial}{\partial y}=(x,-y)$

Es importante la notación como punto y la de vector para que noten la base y la importancia del operador $latex \partial/\partial x_i$

Aquí están los dos campos vectoriales dibujados en $latex \mathbb{R}^2\setminus \lbrace 0 \rbrace$ y $latex \mathbb{R}^2$ respectivamente, ustedes vean la definición y el dibujo.





Entonces un campo vectorial $latex X=\sum a_i \partial/\partial x_j$ nos permite "mover" la $latex p\in U\subset \mathbb{R}^n$  , podemos multiplicar cualquier función $latex f\in C^{\infty}(U)$ por un campo vectorial $latex X$ y aún así seguir teniendo un campo vectorial ya que $latex fX=\sum (fa^i)\partial/\partial x_i$ es un campo vectorial $latex C^\infty$ en $latex U$ por lo que podemos sumarlos y multiplicar por 'escalares' del anillo $latex C^\infty(U)$ entonces tenemos que todos los campos vectoriales en $latex U$ los denotamos por $latex \mathfrak{X}(U)$ es un $latex C^\infty(U)-$módulo 


Derivaciones a partir de campos vectoriales

Vamos a definir más derivaciones ahora a partir de esto.

Sea $latex X \in \mathfrak{X}(U)$ con $latex U\subset \mathbb{R}^n$ y sea $latex f\in C^{\infty}(U)$ definimos la función $latex Xf$ en $latex U$ como:

$latex (Xf)(p)=X_pf = \sun a_i(p)\frac{\partial f}{\partial x_i}(p)$   $latex \forall p\in U$

sin la $latex p$ tenemos que la función es $latex Xf=\sum a_i \frac{\partial f}{\partial x_i}$
donde se ve claramente que $latex Xf\in C^\infty(U)$ , por lo que podemos definir a el campo vectorial $latex X$ como una función que mapea funciones a funciones

$latex X:C^{\infty}(U)\rightarrow C^\infty(U)$
$latex f\mapsto Xf$


Como podemos intuirlo este mapeo para todo campo vectorial cumple la regla de Leibniz es decir

$latex X(fg)=(Xf)g+fXg$

Ya que puntualmente se cumplirá la regla de Leibniz si ustedes lo verifican.

Una derivación en el álgebra $latex C^\infty(U)$ sobre  $latex \mathbb{R}$ es un mapeo $latex \mathbb{R}$-lineal
$latex D:C^{\infty}(U)\rightarrow C^{\infty}(U)$ tal que $latex D(ab)=(Da)b+aDb$ donde $latex a,b\in C^{\infty}(U)$ .

Todas las derivaciones de $latex C^{\infty}(U)$ están cerradas bajo suma y multiplicaciones escalar por lo que forma un espacio vectorial el cual lo llamamos $latex Der(C^{\infty}(U))$ y esto funciona con cualquier álgebra, no sólo con las funciones infinito diferenciales, por lo que tenemos el siguiente mapeo


$latex \Phi:\mathfrak{X}(U)\rightarrow Der(C^{\infty}(U))$
$latex X\mapsto [f\mapsto Xf]$

Esto como imaginarán es un isomorfismo lo que quiere decir es que todos los campos vectoriales de un abierto $latex U$ pueden ser identificados con derivaciones del álgebra $latex C^{\infty}(U)$.