(해석학 참고링크)
(해석학) 16. 다변수벡터함수의 미분, 그래도 이미 알고 있는 것이라서 다행이네.... (Differentiation of MIMO): https://0418cshyun.tistory.com/85
지난 챕터에선 다변수함수의 극한, 연속을 다뤘다. 그렇다면 다변수함수의 미분은 어떻게 될까??
일변수함수일 때를 생각해보자.
자, 그럼 이번에도 똑같이 다변수함수를 적용하려는데... f(x)가 벡터라서 분수 표현이 문제가 된다... 또한, 만약에 미분값이 존재한다면 저 미분값을 어떻게 표현하는지도 문제다. (벡터라서 실수가 아니다.)
1. 일단, 만약에 미분값이 존재한다면 미분값이 어떻게 표현될지 생각해보자.
일변수일때는 df/dx를 생각했었는데,
다변수일때는 다음과 같이 생각할 수 있다.
즉, 저 벡터 x가 약간 변할 때, 벡터함수 f(x)는 얼마나 변하는가를 보고 싶은 것이다.
벡터 x가 약간 변한다는 것은 x의 성분 별로 생각할 수 있다. 즉, x_1, x_2,...,x_m 가 약간 변한다는 것이다.
또한 벡터함수 f가 약간 변한다는 것도 f의 성분 별로 생각할 수 있다. 즉, f_1, .., f_n이 약간 변한다는 것이다.
그런데, x_1이 약간 변하면 이는 f_1, f_2, ... ,f_n을 모두 변화시킬 것이다. 이는 x_2,...,x_m도 동일하다.
즉, 저 미분값은, 각 성분별로 변하는 정도를 다 표시해주어야 한다는 것이다.
그러므로 우리는 저 미분값을 다음과 같이 표현할 수 있다.
(Jacobian)
이렇게 미분값은 행렬로 나타내어지고, 이 (n by m) 행렬을 야코비행렬(자코비언)(Jacobian) 이라고 한다.
또한,
은 편미분(Partial Derivative)이라고 하고, 위 설명에서 각 성분별로 변하는 정도를 말한다. 예를 들어 i=1, j=1이라면 x_1(만)이 f_1(만)에 미치는 미분값이라고 할 수 있다.
자, 여기서 드디어 고등학교 때 몰래 쓰는 Top 2 안에 드는 편미분에 관한 이야기가 나온다.
편미분(Partial Derivative)이란 위의 설명을 따라오면 이해가 되겠지만, 다변수함수에서 변수 1개가 벡터함수 1개에 미치는 영향, 미분이라고 할 수 있다.
(Partial Derivative(편미분))
위에서도 설명하였지만, 편미분은 변수 1개(즉, j번째 basis)가 일변수(실수)로 가는 함수(f_i)에 미치는 미분값을 얘기하는 것이다.
고등학교 얘기를 하자면, 어차피 일변수함수도 다변수함수처럼 다룰 수 있으므로, 편미분이 어쩌다보니 그냥 미분하는 것과 똑같아진 것으로, 원칙적으로 이야기하자면 쓰면 안된다...
어쨌든 편미분을 통하여 각 성분별로 일변수함수 미분처럼 생각할 수 있다.
자, 그럼 정리해보자.
일변수일 때는 그냥 실수 함수로 나타내어지지만, 다변수일 때는 무려 행렬 함수로 표현된다.
2. 분수 꼴 문제
이를 해결하기 위해서 미분을 조금 다른 방식으로 생각해보자.
이런 식으로 생각하면, 분수 꼴을 해결할 수 있고, limit 내부의 벡터값을 norm을 취하면 다변수함수일 때도 그대로 이용가능하다. 그러므로 다변수함수의 미분은 다음과 같이 정의된다.
(다변수함수의 미분)
그런데, 우리는 이미 저 A(x)의 꼴이 행렬(Jacobian)로 나온다는 것을 알고 있다. 즉, A(x)는 선형사상(Linear mapping)이다.
그리고, 위의 편미분과 구분하기 위해 이 A(x), 혹은
를 전미분(Total Derivative)이라고 한다.
사실, 전미분 df/dx에는 저 vector x가 아무 의미가 없다. 어떤 변수로 f를 미분한다는 말이라기보다는 그냥 모든 방향에 대해서 미분한 것이기 때문이라서 전미분은 다음과 같이 표시하기도 한다.
(Note) 위 표현은 미분형식(differential form)이라고 부른다. 미분형식에 대한 내용은 나중에 다루기로 한다.
다음시간에는 다변수함수의 미분을 이용한 Chain Rule과 이에 관련된 정리들을 다뤄본다.