【数Ⅲ微分】合成関数の微分の仕組み dx,dy の意味まで掘り下げてみる

合成関数の微分って計算はできるようになったけど、何でこうなるのか分からない。
例えば、$\sin^2 x$ とかどう計算してる?
$(\sin^2 x)’=2\sin x\cdot(\sin x)’=2\sin x\cos x$ です。でも $(\sin x)’$ をかけるとことか、教科書見ても意味がよく分からないです。
確かに理解するのタイヘンだけど、数学的厳密さとかこだわらなければそれなりに理解はできるから、一緒に考えてみようか。

$y$ を $x$ で微分する、は合成関数

ここで、合成関数の考え方から整理していきます。

まず、$y=x^2$ という関数を考えます。これを左辺と右辺に分けて微分してみましょう。

$y=x^2$
$(y)’=(x^2)’\\1=2x$

微分すると接線の傾きが求められるので、この式だと接線の傾きが常に $1$ ?という矛盾した形が出来上がっています。

これ計算の仕方が根本間違ってるの。

おかしな計算になったのは左辺の方です。$y$ を微分して $1$ というのは、$y$ を $y$ で微分するという計算を行っています。左右がイコール関係なのだから、右辺を $x$ で微分したなら左辺も $x$ で微分しなければなりません

でも前に習ったけど、$x$ で微分するときって $x$ 以外の文字は定数って解釈だから、$y$ は定数になって微分したら $0$ になりますよね?

ならないよ。

また意味不明!

定数というのは、言い換えれば $x$ の値に関係なく、変化しない一定の値ということです。しかし、$y$ というのは値が入る箱のようなもので、今回 $y$ という箱の中には $x^2$ が入っている状態だと言えます。イメージとしてこのような感じです。

つまり、$y$ は $x$ の値によって変化するから定数ではない、ということです。

じゃあ、何なんですか?

文字の中に関数が入ってるから、合成関数。

ああ、そーいうこと。

そこで、合成関数の微分を行います。

$y=x^2$

両辺を $x$ で微分すると

$\displaystyle\frac{dy}{dx}\frac{d}{dy}y =\frac{d}{dx}x^2$
$y’=2x$

結局フツーに微分してるのと同じ話になる。

$dx$ とか $dy$ ってどういうこと?

$\displaystyle\frac{d}{dy}$ は式を $y$ で微分してね!という意味です。同様に $\displaystyle\frac{d}{dx}$ は式を $x$ で微分するということです。数式$y$ を $y$ で微分すれば $1$ になります。また、$\displaystyle\frac{dy}{dx}$ と $y’$ は単なる書き方の違いで、どちらも同じものでした。よって、$\displaystyle\frac{dy}{dx}\frac{d}{dy}y=y’\cdot1=y’$ となるのです。
何でこんな式作るの?

合成関数の計算はつじつま合わせ

数Ⅱで習ってきた微分の方法では $y$ を $x$ で微分することはできません。そこで、微分のところを$\displaystyle\frac{dy}{dx}\frac{d}{dy}$ とすることによって、$dy$ どうしが約分されて $\displaystyle\frac{dy}{dx}\frac{d}{dy}=\frac{d}{dx}$ となり、$x$ で微分したのと同じ、ということになるのです。

要するに計算できるようにするためのつじつま合わせだよね。だから実際に計算するときには約分したらダメよ。わざわざ式を作った意味がなくなる。

結果として、合成関数の微分はこういう法則性が出来上がります。

はじめにやった $\sin^2 x$ の微分も $y$ が $\sin$ に置き換わったと考えれば、$\sin$を微分して $(\sin)’$ を付ける、と考えて同じように計算できるようになるのです。

ここで練習問題。
$x^2+xy+y^2=1$ を $x$ で微分し $\displaystyle\frac{dy}{dx}$ を求めよ。
$\displaystyle\frac{dy}{dx}$ と $y’$ は同じことだから、$y’$ を求めていけばよい。

ここで $xy$ はかけ算だから、かけ算の微分の公式を使って $x’y+xy’$ となります。$y$ を微分するときには「$y$ を微分して $\times y’$」の法則を使いましょう。

よって

$2x+x’y+xy’+2yy’=0$

となります。$x’$ は $1$ になるので

$2x+y+xy’+2yy’=0$
$xy’+2yy’=-(2x+y)$
$(x+2y)y’=-(2x+y)$
$\displaystyle y’=-\frac{2x+y}{x+2y}$

(答え)

解き方は分かったけど、すっきりしない感じ。

ビジュアル的に見えない感じの抽象的な作業をしているよね。
こういうのってやる意味あるんですか?
AIとかもそうだけど、目に見えないところで数式だけが存在していて、でもそれが役に立つってことがあるの。こういうのってずっと掘り下げて勉強し続けないと価値が分からないってのが普通だから、入り口で文句言わないのが上達のコツよ。

結局 $dx$ や $dy$ とは何なのか?

合成関数の微分のやり方が分かっても $dx$ や $dy$ が何を指しているのか分からないままだとすっきりしませんよね。この話は高校数学の範囲を超えるような超えないような微妙な扱いなのですが、厳密な定義を追求しなければそれなりに目で見える形で説明ができます。

例えば、$y=x^2$ を微分すると $\displaystyle \frac{dy}{dx}=2x$ となります。これを変形して、$dy=2x\enspace dx$ とします。このとき $dx$ は 「この式の $x$ は横向きの微小な変位を表すよ!」というただし書きのような意味があります。同様に $dy$ は縦向きの微小な変位を表し、式から縦向きの微小な変位は横向きの微小な変位の2倍の大きさであることが分かります。図で表すとこのような感じです。

図では分かるように大きく描いていますが、本当はこの $dx$ と $dy$ はゼロに近い非常に小さな値をイメージしてください。

$dx$ って変化量のことなんですね。

そうそう。変化量のめちゃくちゃ小さいヤツと思って。

つまり、$\displaystyle\frac{dy}{dx}=\frac{\text{yの変化量}}{\text{xの変化量}}=\text{傾き}$ となるのです。

もう1個疑問だけど、$\displaystyle\frac{d}{dx}x^2$ って $\displaystyle\frac{d}{dx}\times x^2$ っていう解釈でいいんですか?

それやったらダメ。あくまでお互いは独立した存在だと思って。例えば、$\displaystyle\lim_{x\rightarrow0} 5x^2$ を $\displaystyle\lim_{x\rightarrow0} \times 5x^2$ と解釈したりなんかしないでしょ?それと同じこと。
でも、約分したりできますよね。
あくまで $dx$ や $dy$ の部分での話。数式と混ぜないようにね。
あともう1個。$dx$ は分かったとして $d$ って何なんですか?

例えば $\displaystyle\frac{d}{dx}x^2$ って数式単体で言えば、文字って $x$ しかないじゃない?本当は $y=x^2$ みたいにしてグラフ書いたら $x$ 軸と $y$ 軸が出てくるんだろうけど、式に縦軸を示す文字がないから $d$ にしてるの。つまり縦軸名前なしってこと。
なんか、ちょっと分かってきました。
がんばってね。