Tuesday, May 06, 2014

Dos teoremas básicos que debes comprender de cálculo si quieres hacer investigación aunque creas que "no los vas a usar" (creeme que sí) (Teorema de la función implícita)

Nota: si estás en una tablet o teléfono seguramente no podrás visualizar los símbolos por lo que te invito a hacer click aquí para refrescar esta página con la versión Latex.


Esta es la segunda parte de los dos teoremas importantes, ya vimos el teorema de la función inversa, ahora usaremos ése para otro muy importante que es el teorema de la función implícita.


En la vida real es raro que una curva en el plano pueda ser descrita como la gráfica de una función en una variable, es decir a veces puede que no sea una función en donde estamos trabajando.

Esto de manera algebraica es cuando tú no puedes despejar de manera explícita algo en términos de una variable, el ejemplo perfecto para esto siempre es la circunferencia.

$latex x^2 + y^2 = 1$

Para todo valor de $latex x$ (quita al 1 y -1) no hay valores siempre para $latex y$ en la circunferencia o hay dos valores para $latex y$ lo cual es algo feo en términos de funciones, las curvas en el plano que pueden expresarse limpiamente como $latex y=f(x)$ son las más fáciles para trabajar y son las que nos encontramos en cálculo elemental, pero esto en la vida real como lo mencioné es raro y vamos a ver bajo que condiciones podemos encontrar un pedazo del dominio de la "curva" para definir una función "implícita".


Sigamos con el círculo, como saben a veces hemos visto que al despejar $latex y$ de la circunferencia nos queda algo así como:

$latex y=\pm \sqrt{1-x^2}$

Esto es que a $latex y$ le tocan dos funciones, la parte positiva de la raiz y la negativa, pero esto no es "una función" en términos algebraicos y geométricamente la parte negativa representa la semicircunferencia inferior y como es de esperarse la positiva la semicircunferencia superior.

Pero qué pasa con los puntos (1,0) y (-1,0) , aquí estos puntos son parte de ambas funciones , por lo que no hemos "ganado" aún en términos de que ya separamos a la circunferencia en 2 funciones.

Pero cuál es el problema aquí?

La dificultad radica en el hecho de que en estos puntos de la circunferencia , la tangente es infinita, recuerden , recuerden que la tangente en un punto es la mejor aproximación lineal a la circunferencia en ese punto .

Si la tangente se puede escribir como $latex y=mx+b$ entonces no debería ser sorprendente que la circunferencia puede escribirse como $latex y=f(x)$ al menos localmente.

El propósito del teorema de la función implícita es tener un "algoritmo" que nos permita determinar cuando los ceros de un conjunto de funciones en $latex \mathbb{R}^N$ pueden ser expresados como la gráfica de una función $latex \hat{y}=f(\hat{x})$ donde $latex \hat{x}$ son las variables independientes y $latex \hat{y}$ son las dependientes.

Esto es lo que intuición de lo que queremos saber del espacio tangente de los ceros de funciones.


Entonces veamos, supongamos que $latex N=n+k$ y consideremos entonces $latex \mathbb{R}^{n+k}$ y por conveniencia denotemos a sus coordenadas como $latex (x_1, ..., x_n, y_1, ..., y_k)$ donde a veces abreviaremos a estos puntos como $latex (x,y)$ , y sean


$latex f_1(x_1,...,x_n,y_1,...,y_k),...,f_k(x_1,...,x_n,y_1,...,y_k)$

k funciones continuas diferenciables que como dijimos para abreviar las escribiremos como:

$latex f_1(x,y),..., f_k(x,y)$

 Y consideremos los ceros de estas funciones en el conjunto $latex V$

$latex V=\lbrace (x,y)\in \mathbb{R}^{n+m} : f_1(x,y)=0,...,f_k(x,y)=0\rbrace $

Queremos determinar, cuándo, dado un punto $latex (a,b)\in V$ con $latex a\in \mathbb{R}^n$ y $latex b\in \mathbb{R}^k$ existen k funciones:

$latex \rho_1(x_1,...,x_n), ...,\rho_k(x_1,...,x_n)$

Definidas en una vecindad de un punto $latex a$ en $latex \mathbb{R}^n$ tal que $latex V$ puede ser descrita en una vecindad de $latex (a,b)\in \mathbb{R}^{n+k}$ como:

$latex \lbrace (x,y)\in\mathbb{R}^{n+k} : y_1 = \rho_1(x_1,...,x_n), ..., y_k=(x_1,...,x_n)\rbrace$

Es decir queremos encontrar todas las funciones $latex \rho_i$ que nos  "despejan" las $latex y_i$


Este conjunto de manera compacta lo podemos escribir como $latex \lbrace y_1=\rho_1(x), ..., y_k=\rho_k(x)\rbrace$

Esto más explícitamente es que queremos encontrar $latex k$ funciones $latex \rho_1, ..., \rho_k$ tal que para todo $latex x\in \mathbb{R}^n$ tengamos que:


$latex f_1(x,\rho_1(x))=0, ..., f_k(x,\rho_k(x))=0$

Entonces el teorema lo que nos va a decir es cuándo las $latex k$ funciones $latex f_1,...,f_k$ pueden ser usadas para definir implícitamente (ya que construirlas es otro problema) las $latex k$ funciones $latex \rho_1, ..., \rho_k$

Creo que con esto estamos listos para definir el teorema

Teorema de la función implícita: 
Sean $latex f_1(x,y),...,f_k(x,y)$ $latex k$ funciones continuas diferenciables en $latex \mathbb{R}^{n+k}$ y supón que $latex p=(a,b)\in \mathbb{R}^{n+k}$ es un cero de todas las $latex f_i(x,y)$, es decir:

$latex f_1(a,b)=...=f_k(a,b)=0$

Ahora supón que en el punto $latex p$ la matriz siguente de $latex k\times k$ es invertible:



 $latex M=\begin{pmatrix} \frac{\partial f_1}{\partial y_1}(p)&\hdots & \frac{\partial f_1}{y_k}(p)\\ \vdots & \space & \vdots \\ \frac{\partial f_k}{y_1}(p)&\hdots&\frac{\partial f_k}{y_k}(p) \end{pmatrix}$


Entonces, en una vecindad de $latex a\in \mathbb{R}^n$ existen $latex k$ funciones diferenciables únicas $latex \rho_1(x),...,\rho_k(x)$ tal que:


$latex f_1(x,\rho_1(x))=0, ..., f_k(x,\rho_k(x))=0$


Regresemos a la circunferencia, aquí la función es $latex f(x,y)=x^2+y^2-1=0$ la matriz $latex M$ del teorema sería de $latex 1\times 1$:

$latex \frac{\partial f}{\partial y_1}=2y$

Esta matriz no es invertible en $latex y=0$ y en la circunferencia esto nos dice que según el teorema no hay funciones implícitas en los puntos (1,0) y (-1,0).

Demostración:

Ahora para la demostración qué hacemos?

Este teorema es una consecuencia como podrán intuirlo del teorema de la función inversa, vamos a simplificar más aún la notación para escribir la k tupla (la parte $latex n+1,n+2,...,n+k$ de $latex f$) $latex (f_1(x,y),...,f_k(x,y))$ como $latex f(x,y)$ y definamos una nueva función $latex F:\mathbb{R}^{n+k} \rightarrow \mathbb{R}^{n+k}$ por:

$latex F(x,y)=(x,f(x,y))$  y observa cuál es la jacobiana de este mapeo, el cuál es fácil ver que es la matriz de $latex (n+k)\times (n+k)$:


$latex \begin{pmatrix}I&0\\ *&M \end{pmatrix}$


Donde $latex I$ es la matriz identidad de $latex n\times n$, $latex M$ es la matriz de $latex k\times k$ del teorema, 0 es la matriz de $latex n\times k$ de ceros y * es alguna matriz de $latex k\times n$.

Por la estructura de esta matriz (triangular), tenemos que el determiante de la Jacobiana es sólamente el determinante de $latex M$ , entonces la jacobiana es invertible si y sólo sí $latex M$ es invertible, y por el teorema de la función inversa existiría un mapeo $latex G:\mathbb{R}^{n+k}\rightarrow \mathbb{R}^{n+k}$ que sería localmente la inversa de $latex F(x,y)=(x,f(x,y))$ en una vecindad del punto $latex (a,b)$


Démosle forma a esta $latex G(x,y)$ :


$latex G(x,y)=(G_1(x,y),...,G_{n+k}(x,y))$

Tenemos que por cómo está definida $latex F(x,y)=(x,f(x,y))$ en las primeras n coordenadas del mapeo $latex G$

$latex G_i(x,y)=x_i$     $latex 1\leq i \leq n$

Y las últimas $latex k$ funciones de $latex G$ reetiquetemoslas como:

$latex p_i(x,y)=G_{i+n}(x,y)$

Por lo que tenemos ya a $latex G$ más explícita como:


$latex G(x,y)=(x_1,...,x_n,\rho_1(x,y),...,\rho_k(x,y))$

Queremos mostrar que las funciones $latex \rho_i(x,0)$ son las funciones que el teorema dice que existen, es decir queremos que no tengan coordenada $latex y$ en términos más informales.

Nos hemos fijado anteriormente en el conjunto de puntos de $latex \mathbb{R}^{n+k}$ donde las $latex k$ funciones $latex f_i$ originales son cero, y le habíamos llamado a este conjunto $latex V$ , la imagen de $latex V$ bajo $latex F$ estará contenido en el conjunto $latex (x,0)$. Entonces la imagen de $latex G(x,0)$ al menos localmente alrededor de $latex (a,b)$ será $latex V$, entonces debemos de tener que:


$latex f_1(G(x,0))=0,...,f_k(G(x,0))=0$


Pero esto qué significa?


$latex f_1(x,\rho_1(x,0))=0,...,f_k(x,\rho_k(x,0))=0$

Que es exactamente lo que queríamos probar.  $latex \blacksquare$


aquí usamos el teorema de la función inversa para probar el teorema de la función implícita, pero también se puede hacer al revés, por lo que ambos teoremas son equivalentes.


Espero les haya servido de algo y chequen el post anterior si no les queda claro que es la clave de la demostración de este que es el del teorema de la función inversa.


Saludos


Eduardo Ruíz Duarte (beck)
twitter: @toorandom




No comments: