3.1 Derivadas e gradientes - parte 2

página anterior: parte 1

Uma das propriedades das derivadas de funções de uma variável que gostaríamos de estender para o contexto de funções de várias variáveis é a que afirma que uma função diferenciável num ponto é contínua nesse ponto, de modo a que a existência de derivada signifique um acréscimo de regularidade ou suavidade para a função (para além da continuidade). No entanto, usando apenas o que temos neste momento ao nosso dispor, isto é, derivadas segundo vectores, não é possível validar uma tal propriedade, como se ilustra a seguir:

Exemplo de função descontínua com derivadas nulas segundo qualquer vector

Considere-se a função $f : \mathbb{R}^2 \to \mathbb{R}$ definida por

(1)
\begin{align} f(x,y) = \left\{ \begin{array}{ll} 1 & \mbox{ se } \, y=x^2 \wedge x \not= 0 \\ 0 & \mbox{ nos restantes pontos } \end{array} \right.. \end{align}

Trata-se de uma função claramente descontínua na origem (prove!). No entanto, a derivada segundo um qualquer vector nesse ponto dá sempre zero (confira!).

Numa situação análoga no contexto de funções de uma variável, não só a função seria contínua como o gráfico admitiria tangente no ponto correspondente. No contexto de funções de duas variáveis, procuraríamos que o gráfico da função admitisse plano tangente no ponto correspondente. Tal não é, no entanto, o caso no exemplo em cima, como se poderá observar a partir de um esboço do gráfico de $f$.

A extensão da noção de diferenciabilidade para funções de várias variáveis tem, de facto, a ver com a possibilidade de os respectivos gráficos admitirem (hiper)planos tangentes. Para se perceber a razão pela qual se define como define em baixo, é conveniente começar por olhar para a diferenciabilidade de funções de uma variável do ponto de vista da admissibilidade de rectas tangentes ao gráfico e da possibilidade de os valores da função se poderem localmente aproximar linearmente. Mais concretamente:

Se uma função $f : I \subset \mathbb{R} \to \mathbb{R}$ for diferenciável em $a \in I$, sabemos que a equação da recta tangente ao gráfico de $f$ em $(a,f(a))$ é $y=f(a)+f'(a)(x-a)$. Por outro lado, a propriedade

(2)
\begin{align} \lim_{x \to a} \frac{f(x)-f(a)}{x-a} = f'(a) \in \mathbb{R} \end{align}

que caracteriza a diferenciabilidade de $f$ em $a$, pode, como facilmente se vê, ser equivalentemente descrita através da existência de um número real $m$ tal que

(3)
\begin{align} \lim_{x \to a} \frac{f(x)-f(a)-m\,(x-a)}{x-a} = 0, \end{align}

sendo que, quando se verifica a propriedade, terá necessariamente que ser $m=f'(a)$.

Ou seja, de entre todas as rectas não verticais $y = f(a) + m\,(x-a)$ que passam por $(a,f(a))$, no processo de diferenciabilidade é escolhida a que melhor aproxima o gráfico de $f$ numa vizinhança de $(a,f(a))$, no sentido preciso dado por (3): no caso de se escolher $m=f'(a)$, não só a diferença $f(x) - (f(a)+m(x-a))$ vai para zero quando $x$ tende para $a$, como vai para zero mais rapidamente do que a diferença $x-a$.

Transpondo esta ideia para o contexto de funções $f$ reais de duas variáveis reais $x$ e $y$, e recordando que a equação geral de um plano não vertical que passe por $((a_1,a_2),f(a_1,a_2))$ é

(4)
\begin{equation} z = f(a_1,a_2) + m_1 (x-a_1) +m_2 (y-a_2), \end{equation}

para a diferenciabilidade de $f$ deverá então exigir-se a possibilidade de se escolherem $m_1, m_2 \in \mathbb{R}$ tais que

(5)
\begin{align} \lim_{(x,y) \to (a_1,a_2)} \frac{f(x,y)-f(a_1,a_2)-m_1\,(x-a_1) - m_2\,(y-a_2)}{\| (x,y)-(a_1,a_2) \|} = 0. \end{align}

Observe que o problema da divisão por um vector, a que aludimos no início desta secção, é aqui contornado pela consideração da norma do vector em denominador. Note também que um tal expediente não resolveria o nosso problema inicial de adaptação da noção de derivada de funções de uma para funções de duas variáveis, já que uma tal abordagem faria, mesmo no caso de funções de uma variável, com que funções diferenciáveis deixassem de o ser. Esse expediente resulta aqui porque o problema foi transformado de forma a que o que se exige é que determinado limite valha zero (assim, em (3) podemos também escrever $|x-a|$ em denominador, em vez de $x-a$).

No caso de funções de mais de duas variáveis, onde já não temos uma representação gráfica para nos ajudar, a ideia chave para a diferenciabilidade deverá ser a possibilidade de se poder aproximar a diferença $f(x)-f(a)$, agora com $x=(x_1, \ldots, x_n)$ e $a=(a_1,\ldots,a_n)$, por uma expressão que dependa linearmente da diferença $x-a=(x_1-a_1, \ldots, x_n-a_n)$, ou seja, por uma combinação linear das diferenças $x_1-a_1, \ldots, x_n-a_n$, ou, o que vai dar no mesmo, pelo produto de uma matriz-linha

(6)
\begin{align} [m_1 \, \ldots \, m_n ] \end{align}

pelo vector-coluna

(7)
\begin{align} \left[ \begin{array}{c} x_1-a_1 \\ \vdots \\ x_n-a_n \end{array} \right], \end{align}

ou pelo produto interno

(8)
\begin{align} (m_1, \ldots, m_n) \cdot (x_1-a_1, \ldots, x_n-a_n). \end{align}

Após estas considerações, a definição que se segue deverá parecer natural:

Definição de função real diferenciável

Sejam $f : D \subset \mathbb{R}^n \to \mathbb{R}$ e $a \in {\rm int}\, D$. Diz-se que $f$ é diferenciável em $a$ se existir $m \in \mathbb{R}^n$ tal que

(9)
\begin{align} \lim_{x \to a} \frac{f(x)-f(a)-m \cdot (x-a)}{\| x-a \|} = 0. \end{align}

Seguir para a parte 3 ou adicionar um comentário em baixo.

Add a New Comment
Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-Noncommercial-No Derivative Works 2.5 License.