2020/05/04 14:49 更新
2つのBanach空間の間の関数に関するいくつかの話題 その1
目次

前提知識

基礎的な関数解析.
後半ではHahn-Banachの定理を使う予定なので, 知っていたほうが良いかもしれない.
(あとあと気づいたが, この記事ではBanach空間を登場させる必要がない. すべて, ノルム空間上での話にできる. Hahn-Banachの定理自体はBanach空間じゃなくても成立することに注意!(自分への注意.)でも, Banach空間の話も少し冒頭ですでに書いてしまっているので供養として残しておく. Banach空間の話は飛ばしてもらっても後には影響はない.)

本題

Banach空間上の関数って微分できるの?

微分と聞いたとき, 皆さんは何を思い浮かべるであろうか. まず最初に考えるのは, 1次元実数直線上の微分とかであろうか. それとももう少し進んだ方なら, 複素数上の複素微分などを思い浮かべる方も多いかもしれない. ここではそれらの微分の究極の一般化であるフレシェ微分 (Fréchet derivative)ガトー微分 (Gâteaux differential)を紹介する. これらの微分はぞれぞれBanach空間上ノルム空間上の関数の全微分と方向微分に対応している.

そもそもBanach空間ってなんだっけ?

この節では念のためBanach空間の定義を述べておこう.

定義 (Banach空間) ノルム空間$X$がBanach空間であるとは, $X$が完備な空間であるときのことをいう.

そもそも, 完備って何なのかということになるかと思うので以下に定義を書いておく.

定義 (完備) $(X, d)$を距離空間とする. $X$が完備であるとは, $X$内の任意のCauchy列が$X$内で収束するときのことをいう. ただし, 数列$\{x_n\}_n$がCauchy列であるとは, 任意の$\epsilon>0$に対してある$N\in\mathbb{N}$をとって,
$$ d(x_n, x_m) < \epsilon \quad (\forall n, m \ge N) $$ が成立するようにできる数列のことをいう.

本当はCauchyネット等を使った一般的な定義をしたいですが, ネットの定義をしなくてもこの記事は十分理解できるかと思いますので, 便宜上距離空間上の完備性のみを定義します. 上記のような点列による定義の場合, 確か第一可算かつHausdorffな位相空間まで拡張できたような気がします. ちなみにCauchyネットを使うと第一可算性を除いた位相空間に対しても完備性が定義ができます.

Banach空間の例

Banach空間の例を挙げておく.

Banach空間と言うとなぜか無限次元空間を想像しがちだが, 普通に有次元空間のものもある. 例えば, $\R^n$や$\mathbb{C}^n$である. では, Banach空間でない有限次元ノルム空間は存在するのかというと, 実は存在しない. この証明は有限次元空間にいかなるノルムを導入しても同値であるという有名な事実を知っている方なら少し考えればすぐ示せるのではないだろうか. 具体的には, 今有限次元ノルム空間に$\sup$ノルム(適当な基底とって座標表示したときに一番絶対値が大きいものをとってくるノルム)が入っているとして, 完備性を示せば良い. あとは完備性の定義どおりにちまちま確かめれば良い.

これで有限次元ノルム空間はBanach空間であることがわかり, 以下で定義する諸微分が普通の実数や複素数上でやる微分の真の拡張であることがわかるのである.
(冒頭でも書きましたが, 別にBanach空間であることがわからなくておいいです. ノルム空間であればいいので...)

では無限次元ではどうかというと, 有名なところだと$L^p$空間や連続写像全体の空間に$\sup$ノルムを入れたものなどがある.
なお, 無限次元ノルム空間は常にBanach空間であるとは限らない. そうならない例としては色々あるが, 有名なところだと$C^1$級関数全体の空間に$\sup$ノルムを入れたものなどが存在する.

フレシェ微分, ガトー微分の定義

さて, 準備も整ったということで, フレシェ微分やガトー微分を定義していこうと思う. ただ, せっかく定義したBanach空間であるが, しばらくは用いない. (使うのは第2弾になるかもしれない. )フレシェ微分やガトー微分の定義自体は一般のノルム空間上で定義できるからだ. ただし, 係数体は$\R$または$\mathbb{C}$とする. Banach空間を使うことになるのは, この定義の後の諸性質を調べる際である.

定義 (フレシェ微分) $(X, \|\cdot\|_X), (Y, \|\cdot\|_Y)$をそれぞれノルム空間とし, $F$を$X$の開集合$O$上で定義され, 値域を$Y$内にもつ関数とする. このとき, $x\in O$に対して適当な有界線形作用素$L_x: X\to Y$を選び, 任意の$\epsilon>0$に対して適当に$\delta>0$を選べば$\|h\|_X $$ \|F(x+h)-F(x) - L_xh\|_Y \le \epsilon\|h\|_X $$ が成立するようにできるならば, この関数$F$は点$x$において微分可能であるという. この条件を簡単に, $$ F(x+h) - F(x) - L_xh = o(h) $$ と書く. また, $L_xh\in Y$を$x$における関数$F$の強微分またはフレシェ微分といい, 有界線形作用素$L_x$を点$x$における関数$F$の強導関数またはフレシェ導関数という. この導関数$L_x$を今後$F'(x)$と書く.

定義 (ガトー微分) $(X, \|\cdot\|_X), (Y, \|\cdot\|_Y)$をそれぞれノルム空間とし, $F$を$X$の開集合$O$上で定義され, 値域を$Y$内にもつ関数とする. このとき, $x\in O$に対して, 空間$Y$におけるノルムによる収束の意味での極限値 $$ DF(x, h) = \left. \frac{\mathrm{d}}{\mathrm{d}t}F(x+th)\right|_{t=0} = \lim_{t\to 0} \frac{F(x+th)- F(x)}{t} $$ を関数$F$の$x$における(増分$h$の)弱微分またはガトー微分という. ガトー微分$DF(x, h)$は必ずしも$h$に関して線形ではない. しかし, 仮にこれが線形ならば, すなわち, ある$F_w':X\to \frak{L}(X, Y)$が存在して, $$ DF(x,h) = F_w'(x)h $$ となるならば, 作用素$F_w'$を弱導関数またはガトー導関数という. ただし, ここで$\frak{L}(X, Y)$は$X$から$Y$への線形作用素全体の集合であるとする.

フレシェ微分, ガトー微分の諸性質

フレシェ微分

ここではフレシェ微分の性質の一つである合成関数の微分に関するいわゆる連鎖律を示す.

命題 (連鎖律) $X, Y, Z$はノルム空間, $F$は$x_0$のある近傍から$Y$の中への関数で, $y_0=F(x_0)$とし, また, $G$は$y_0$のある近傍から$Z$の中への関数とする. このとき, 関数$F$が$x_0$で微分可能, $G$が点$y_0$で微分可能とすれば, $H=G\circ F$は点$x_0$において微分可能で,

$$ \begin{aligned} H'(x_0) = G'(y_0)F'(x_0) \end{aligned}$$

となる.


証明. 仮定により

$$\begin{aligned} F(x_0+\xi) &= F(x_0) + F'(x_0)\xi + o(\xi), \\ G(y_0+\eta) &= G(y_0) + G'(y_0)\eta + o(\eta). \end{aligned}$$

ここで, $F'(x_0), G'(y_0)$は有界線形作用素であるから,

$$\begin{aligned} H(x_0+\xi) &= G(y_0+F'(x_0)\xi +o(\xi)) \\ &= G(y_0) + G'(y_0)(F'(x_0)\xi + o(\xi))+o(F'(x_0)\xi+o(\xi)) \\ &= G(y_0) +G'(y_0)F'(x_0)\xi + o(\xi). \end{aligned}$$

となるので, 命題は示された.   □

ガトー微分

ガトー微分でも以下のような連鎖律は成立する.

$$D(G\circ F)(x, h) = DG(F(x), DF(x, h))$$

これはフレシェ微分で示した連鎖律と同様に示せると思う.
よって, 少し話題を変えて, ここではいわゆる有限増分の公式のガトー微分における拡張を導く.

$(X, \|\cdot\|_X), (Y, \|\cdot\|_Y)$をノルム空間とする. $O\subset X$を$X$の開集合, $F$を$O$上定義された$Y$に値を持つ関数とする. また, $[x_0, x] \coloneqq \{(1-t)x_0 + tx \in X \mid t\in [0,1]\} \subset O$とし, $F$はこの線分上でガトー微分可能であるとし, 導関数が存在すると仮定する. このとき, $Y$上からその係数体への任意の有界線形汎関数$\psi$に対して,

$$f_\psi(t) = \psi(F(x_0+t\Delta x)) $$

とおく. ただし, $\Delta x \coloneqq x-x_0$, $0\le t \le 1$である.
ここで, $f$の微分を考える. 定義どおりに計算してやると,

$$\begin{aligned} \frac{f_\psi(t+\Delta t)-f_\psi(t)}{\Delta t} &= \psi\left(\frac{F(x_0+t\Delta x + \Delta t \Delta x)- F(x_0 + t\Delta x)}{\Delta t}\right) \\ &\to \psi(F'_w(x_0+t\Delta x)\Delta x) \quad (\Delta t \to 0). \end{aligned}$$

したがって, $\frac{\mathrm{d}f_\psi}{\mathrm{d}t}(t) = \psi(F'_w(x_0+t\Delta x)\Delta x)$となる. ここで平均値の定理を用いることにより,

$$\begin{aligned} |f_\psi(t+\Delta t) - f_\psi(t)| &\le \sup_{0\le \theta \le 1}|\psi(F'_w(x_0+t\Delta x + \theta \Delta t \Delta x)\Delta x)||\Delta t| \\ &\le \sup_{0\le \theta \le 1}\|\psi\|\|F'_w(x_0+t\Delta x + \theta \Delta t \Delta x)\|\|\Delta x\|_X |\Delta t| \end{aligned}$$

となる. ただし, $\|\cdot\|$は作用素ノルムである. 書き直すと,

$$|\psi(F(x_0+t\Delta x + \Delta t \Delta x)- F(x_0 + t\Delta x))| \le \sup_{0\le \theta \le 1}\|\psi\|\|F'_w(x_0+t\Delta x + \theta \Delta t \Delta x)\|\|\Delta t\Delta x\|_X $$

となる. 特に, $t = 0, \Delta t = 1$として,

$$|\psi(F(x)- F(x_0))| \le \sup_{0\le \theta \le 1}\|\psi\|\|F'_w(x_0+ \theta \Delta x)\|\|\Delta x\|_X $$

となる. Hahn-Banachの定理から, $\psi(F(x)- F(x_0))=\|\psi\|\|F(x)- F(x_0)\|_Y$となるような汎関数が存在するので, これを用いると, 上の不等式は,

$$\|F(x)- F(x_0)\|_Y \le \sup_{0\le\theta \le 1}\|F'_w(x_0+ \theta \Delta x)\|\|\Delta x\|_X $$

となる. これは, 有限増分の公式の拡張になっている.
特に$F(x)$という関数を$x\to F(x)-F'_w(x_0)(x-x_0)$という関数に置き換えると,

$$\|F(x) - F(x_0) - F'_w(x_0)(x-x_0)\|_Y \le \sup_{0\le\theta \le 1}\|F'_w(x_0 + \theta \Delta x)- F'_w(x_0)\|\|x-x_0\|_X$$

となる. 一応注意しておくと, ここでの記法は先程と同じで$\Delta x = x -x_0$である. この形の不等式はこのあとのフレシェ微分とガトー微分の関係を考えるときやおそらく第2弾で定義するであろうペティス積分の特別な場合を議論する際に用いられる.

フレシェ微分とガトー微分の関係

この節ではフレシェ微分とガトー微分が一致するための十分条件を与えることにする. 具体的には以下の定理を示しておくが, これは有限次元での全微分と方向微分の関係を知っている方なら当たり前に思えることなのかもしれない. $(X, \|\cdot\|_X), (Y, \|\cdot\|_Y)$はノルム空間とする.

定理 関数$F:X\to Y$の弱導関数$F_w'(x)$が点$x_0$のある近傍上で存在し, この近傍における$x$の作用素値関数$F_w'(x)$が点$x_0$において連続ならば, 点$x_0$における強導関数$F'(x_0)$が存在して弱導関数$F'_w(x_0)$に等しい.

証明. 連続であるという仮定から, 任意の$\epsilon>0$に対して$\delta>0$が存在して, $\|h\|_X < \delta$ならば, $$\|F_w'(x_0+h) - F_w'(x_0)\| \le \epsilon $$

が成立する. ただし, ここで$\|\cdot\|$は作用素ノルムである. 関数$F$に先程導いた有限増分の公式からの帰結を適用すると,

$$ \|F(x_0+h) - F(x_0) - F_w'(x_0)h\|_Y\le \sup_{0\le \theta \le 1}\|F'_w(x_0+\theta h)-F_w'(x_0)\|\cdot\|h\|_X\le \epsilon\|h\|_X $$

となる. これは, まさしく強導関数が存在し弱導関数と一致していることを示している. (ピンとこない人はフレシェ微分の定義を見直すべし.) □

フレシェ微分を通して変分法の意味を考察する

さて, 以上でフレシェ微分とガトー微分の基本的な紹介が終わったのであるが, 数学系の人ならいざ知らず, 工学系や物理系の人はこんなことをして何になるんだというかもしれない. そこで, 応用というわけでもないが, 変分法というものをフレシェ微分を通して考えてみよう. 以下のような変分法においてよく出てくる汎関数を"変分"することを考える.

$$ F(x) = \int_a^b f(t, x(t), x'(t))\mathrm{d}t, \quad (x \in C^1[a,b])$$

ここで, $f$は$C^1$級であるとする. 変分とはつまるところこういった汎関数を"微分"するということだが, 有限次元の微分しか知らないままではいまいちこの意味がつかめないのである. しかし, 我々は現在フレシェ微分を知っているので, これを正当化できる.

微分を行うにはまず最初にノルム空間間の関数である必要であるので, $C^1[a,b]$にノルムを導入するわけであるが, 正直なんでも良いが, なんとなくBanach空間の構造を入れたほうが色々と気持ちが良いので, ノルム$\|\cdot\|_{C^1[a.b]}$を以下のように定める.

$$\|x\|_{C^1[a,b]} = \sup_{t\in [a,b]}|x(t)| + \sup_{t\in [a,b]}|x'(t)|.$$

もちろん, $\R$の方には通常のノルムを入れる. さて, ノルムも導入できたので, 汎関数$F: C^1[a.b] \to \R$をフレシェ微分する用意が整ったわけである.

以下では$\partial_if$を$f$を$i$番目の変数で偏微分したものとして定義する. フレシェ導関数$F'(x):C^1[a,b] \to \R$が$h\in C^1[a,b] \to\int_a^b \left( \partial_2f(t,x(t),x'(t))h(t) + \partial_3f(t, x(t), x'(t))h'(t) \right) \mathrm{d}t \in \R$という汎関数に等しいことを示す.

定義通りに考えていく.すると,

$$\begin{aligned} \left|F(x+h)-F(x) - \int_a^b \left( \partial_2f(t,x(t),x'(t))h(t) + \partial_3f(t, x(t), x'(t))h'(t) \right) \mathrm{d}t\right| &= \left|\int_a^b \left(f(t,x(t) + h(t),x'(t) + h'(t)) - f(t,x(t),x'(t)) - \partial_2f(t,x(t),x'(t))h(t) -\partial_3f(t, x(t), x'(t))h'(t) \right) \mathrm{d}t\right| \\ &\le (b-a) \sup_{t\in[a,b]} \left|f(t,x(t) + h(t),x'(t) + h'(t)) - f(t,x(t),x'(t)) - \partial_2f(t,x(t),x'(t))h(t) -\partial_3f(t, x(t), x'(t))h'(t)\right| \\ &\le (b-a)\sup_{t\in[a,b]}\sup_{\theta^1_t, \theta^2_t \in [0,1]}\left(\left|\partial_2f(t,x+\theta^1_th, x'+\theta^2_th') - \partial_2f(t,x,x') \right|\left|h(t) \right| + \left|\partial_3f(t,x+\theta^1_th, x'+\theta^2_th') - \partial_3f(t,x,x') \right|\left|h'(t)\right| \right) \quad(\because 平均値の定理) \\ &\le (b-a)M_h\|h\|_{C^1[a,b]} \end{aligned}$$

となる. ここで,

$$M_h = \max\{\sup_{t\in[a,b]}\sup_{\theta^1_t, \theta^2_t \in [0,1]}\left|\partial_2f(t,x+\theta^1_th, x'+\theta^2_th') - \partial_2f(t,x,x') \right|, \sup_{t\in[a,b]}\sup_{\theta^1_t, \theta^2_t \in [0,1]}\left|\partial_3f(t,x+\theta^1_th, x'+\theta^2_th') - \partial_3f(t,x,x') \right|\}$$

としている. これは連続関数はコンパクト空間上では一様連続になることなどを用いることにより, $\|h\|_{C^1[a,b]} \to 0$で$M_h\to0$となることがわかる(と思う. 間違ってたらコメントしてくださると幸いです.).

したがって, 以上のことから汎関数$F(x)$はフレシェ微分できることが示せた. 我々が普段変分と呼んでいる

$$\int_a^b \left( \partial_2f(t,x(t),x'(t))h(t) + \partial_3f(t, x(t), x'(t))h'(t) \right) \mathrm{d}t$$

という式は, $F(x)$のフレシェ微分であると解釈できるのである.

今後の展望

本記事では一般化された種々の微分を導入したわけだが, これらの微分はおそらく読者の方々が想像している以上に普通の有限次元での微分の性質をそのまま受け継いでいる. 第2弾ではその一例としてテイラー展開が可能であることを示そうと思っている. なお, 他にも陰関数定理なども成立するし, そこからラグランジュの未定乗数法なども一般に拡張できることが知られている. 詳しく知りたい読者は下記の参考文献を参照されると良い.

微分の無限次元への拡張の試みとしては他にもマリアヴァン解析におけるマリアヴァン微分がある. これはある意味, 超関数微分の拡張である. 本記事では紹介しないが, マリアヴァン微分は連続でない関数の微分なども考えられるため, ジャンプのある確率過程を扱うときなどによく用いられているようである(勉強したい. 誰か一緒に勉強しませんか. ).

参考文献

コルモゴロフ, フォミーン著. 『函数解析の基礎 下』(山崎三郎, 柴岡泰光訳). 岩波書店, 1979.