2011-12-25

"ユークリッド原論 縮刷版" ユークリッド 著

人類の遺産で最も厳密性を極めた書と言われ、二千年以上も読み継がれるロングセラー振りは聖書に劣らない。ただ、この幾何学の基礎の基礎を義務教育から慣れ親しんできたというのに、いまだ原典的なものに触れたことがない。バイブル的存在としてあまりに早く知ってしまうと、逆に当たり前という意識が定着して疎かになることがある。生涯で一度は、この古典に触れてみたい。

「原論」の最高の意義は、その論法にあろう。自明であって証明の要なしという宣言は、まさに直観の偉大さを示してる。それは、定義、公準、公理で始まる論理スタイルが物語っており、人間能力の限界ひいては言語論の限界を唱えているように映る。また、あらゆる命題とその証明の後で「これが証明すべきことであった(Q.E.D.)」と締めくくる叙述方法は、今では哲学でお馴染みだが、定理の普遍性を強調している。こうした特徴は、ある意味宗教的ですらあるが、確実に宗教と一線を画す。幾何学とは、人間認識の立体的感覚、すなわち精神空間から生じた真理の学問とすることができよう。数学とは言語である。そして純粋な精神の手段である。それを実感させてくれる一冊である。
尚、本書は、共立出版(1996年)から刊行された「縮刷版」である。既に絶版となっているので図書館を利用した。だが、とても貸出期限2週間で読破できる代物ではない。一度は延長させてもらったが、二度となると顰蹙であろうか。てなわけで、アル中ハイマーな能力では斜め読みするぐらいしかできない。おっと、いつのまにか「追補版」が刊行されている。ちと高いが、衝動は抑えられそうにない。

「原論」と言えば、幾何学の集大成という印象がある。その通りであろうが、歴史的には代数的に解釈されてきた部分もある。驚くべきは、全13巻のうちのほぼ半分が無理量を扱うことに費やされることだ。代数的手段をまったく持たない古代ギリシャ数学において、これは由々しき問題である。そこで、数論を導入しながら、量の大小関係から比や比例関係を扱い、更に相似形によって相対的に無理数を説明する。幾何学のみで説明しようとすれば、そうするしかないのかもしれん。近代数学においても、多くの微分方程式が解けない事情から、大小関係から近似的に迫る方法が盛んに行われる。ε-δ論法はその最たるものだろう。そぅ、アル中ハイマーを数学の落ちこぼれにしやがった、あの忌々しいやつだ。得体の知れない対象に迫るには、既に分かっている量と比較しながら近づいていく。これが相対的認識能力しか持てない知的生命体の典型的な思考方法、あるいは合理性なのかもしれない。
無理量を大々的に扱っている第10巻は、なんと全体の1/3を占める。そして、二項線分、余線分、優線分、劣線分とかいう奇妙な言い回しで、無理線分なるものを定義している。そもそも、こんな量を扱う目的とは何か?それは、プラトン立体の正体を暴くための布石であろうか?古代ギリシャにおいて、プラトン立体の存在は哲学的にも大きな意義を持っていたに違いない。「原論」の目的とは、ピュタゴラスの定理とその拡張からプラトン立体に至るまでの道しるべ、すなわち、プラトン宇宙の体系化と解釈するのは行き過ぎであろうか?そう思えるのは、最後の第13巻が正多面体論で締めくくられるからである。
また、議論が盛り上がると、背理法的に命題が組み立てられる。もともと帰謬法と呼ばれた思考方法である。矛盾を仮定しながら、自ら解決するといった記述も目立つ。対話的でもある。当時、弁証法的思考から背理法的思考を進化させたのかもしれない。ユークリッドは、哲学と数学の境界線を明確にしようとしたのだろうか?
「原論」は、厳密性を重視した思考の方法論であるがために、読み辛い書となるのは避けられない。おまけに代数的な記号がまったくないので、プラトン立体が幾何学のみで表現されるのはなかなかの見物だ!ゲーテ曰く、「制約の中にのみ、巨匠の技が露になる。」
それにしてもプラトン立体が二重根号に帰着するとは...知っていたとはいえ、最後の最後に溜息しかでん!

[ 第1巻: 三角形と平行線、ピュタゴラスの定理 ]
三角形の合同条件や平行線の性質が綴られ、ピュタゴラスの定理に辿り着く。その定理が示す直角三角形の性質が知られたのは、「原論」よりもはるかに古く、古代バビロニアや古代中国においてである。だが、証明によって完全なる定理としたのは古代ギリシャであった。それは「ギリシャ人の奇蹟」と言われるそうな。
まず、23個の定義が唐突に始まり、次にあの有名な5つの公準が続く。
  1. 任意の点から任意の点へ直線をひくこと。
  2. および有限直線を連続して一直線に延長すること。
  3. および任意の点と距離(半径)とをもって円を描くこと。
  4. およびすべての直角は互いに等しいこと。
  5. および1直線が2直線に交わり同じ側の内角の和を2直角より小さくするならば、この2直線は限りなく延長されると2直角より小さい角のある側において交わること。
第五公準は平行線公準として知られ、これだけが明らかに異質である。古くから、第五公準は公理ではないかという意見があり、証明の必要性を唱える批判がある。ここに、非ユークリッド空間の可能性を示唆していたと想像するのは、考え過ぎだろうか?まさに、非ユークリッド空間の存在は第五公準の崩壊によって証明されたのだから。

早々、あの「ロバの橋」の証明が登場する。中世の大学生がつまずくことから、落ちこぼれには渡れないと皮肉られるやつだ。

「命題5: 二等辺三角形の底辺の上にある角は互いに等しく、等しい辺が延長されるとき、底辺の下の角は互いに等しいであろう。」

[ 第2巻: 幾何学的代数 ]
「定義2: いかなる平行四辺形においてもその対角線をはさむ平行四辺形のどれか一つは二つの補形と合わせてグノーモーンとよばれるとせよ。」

グノーモーンってなんじゃ?日時計が作る影と棒の関係のようなL字型の図形を言うようだ。
数論では、奇数の和を平方数で表すようなことをする。
 Σ(2k -1) = n^2
あるいは三乗和の公式のようなものもある。
 1^3 + 2^3 + ... + n^3 = (1 + 2 + ... + n)^2
これらはグノーモーンの考えから示される。すべての数は、縦・横の面積で説明がつき、すなわちグノーモーンに通ずというわけか。
ところで、第2巻の命題はすべて代数的な表現に対応するというから凄い!その内容を訳注に従って書き出すとこんな感じ。

 命題1: a(b + c + d + ...) = ab + ac + ad + ...
 命題2: (a + b)a + (a + b)b = (a + b)^2
 命題3: (a + b)a = a^2 + ab
 命題4: (a + b)^2 = a^2 + b^2 + 2ab
 命題5: ab + {(a + b)/2 - b}^2 = {(a + b)/2}^2
 命題6: (2a + b)b + a^2 = (a + b)^2
 命題7: (a + b)^2 + a^2 = 2(a + b)a + b^2、あるいは a^2 + b^2 = 2ab + (a - b)^2
 命題8: 4(a + b)a + b^2 ={(a + b) + a}^2
 命題9: a^2 + b^2 = 2[{(a + b)/2}^2 + {(a + b)/2 - b}^2]
 命題10: (2a + b)^2 + b^2 = 2{a^2 + (a + b)^2}
 命題11: x^2 + ax = a^2
 命題12: a^2 = b^2 + c^2 + 2b(-c cos a)
 命題13: b^2 = a^2 + c^2 - 2a(c cos β)
 命題14: x^2 = ab

こうして羅列してみると、かなりの部分で重複している。「原論」が厳密な書であるならば、必要最小限の命題しかないように配慮されているはず。幾何学的に何か意図があるのだろうか?ある研究によると、円錐曲線論を扱う統一的方法としての見解もあるそうな。尚、命題11と命題14は、二次方程式を解くことに相当する。

[ 第3巻, 第4巻: 円の性質、方べきの定理 ]
第3巻では、弦や接線、円周角と中心角、接弦定理を経て、方べきの定理に辿り着く。方べきの定理では、円と点の関係、しかも点は、円の外にある場合と内にある場合で区別される。これは、代数学と幾何学の抽象レベルの違いを示しているのか?あるいは、位相幾何学の概念を示唆していたと解釈するのは考え過ぎか?
第4巻では、円に三角形や多角形を内接、外接させる作図を扱い、正五角形の作図で盛り上がる。そして、正六角形を経て、十五角形の作図に踏み込む。その方法は、ピュタゴラスの定理の拡張という形で到達している。ここには、すべての平面図形を抽象化すれば、三角形と円の二種類に帰着するという考え方があるように思える。そして、三角形の作図は黄金比に帰着するというわけか。あの神の比だ。んー、やっぱり位相幾何学に通ずるものを感じる。

[ 第5巻, 第6巻: 比例論 ]
第5巻では、比と比例に関する基本定理が扱われる。無理量を扱うための準備といったところであろうか。ただ、比例の定義はかなりややこしい。比や比例は初等的な問題であるが、これを一般化して言及すると案外難しいようだ。

「定義5: 第1の量と第3の量の同数倍が第2の量と第4の量の同数倍に対して、何倍されようと、同順にとられたとき、それぞれ共に大きいか、共に等しいか、または共に小さいとき、第1の量は第2の量に対して第3の量が第4の量に対すると同じ比にあるといわれる。」

「定義10: 4つの量が比例するとき、第1の量は第4の量に対して第2の量に対する比の3乗の比をもつといわれる、そして何個の量が比例しようと常につぎつぎに同様である。」

定義5は、なんとなく言わんとしたことが分かるが、定義10は難解だ。4つの量による列の関係を示しているようで、ベクトル的な解釈もできそう。近代になって、この比例論が重要視されるのは、通約量、不可通約量の如何にかかわらず、一般量として成立することだという。不可通約量とは、現代では無理数に対応するもの。ユークリッドの時代、無理数の存在をどのように感じたかは知らん。ただ、ピュタゴラスの「万物は数である」という信仰が強ければ、表現できない数字があることに危機を感じたことだろう。数自体が明確にできないとなれば、相対的に扱うしかない。これが比や比例の意義であろうか。
第6巻では、その応用として三角形の相似や相似図形の基本問題を扱い、相似となる平行四辺形の作図、面積作図の定理が証明される。

[ 第7巻, 第8巻, 第9巻: 数論 ]
第7巻では、約数や倍数、最大公約数や最小公倍数、素数、互いに素な数の性質が扱われる。

「定義21: 第1の数が第2の数の、第3の数が第4の数の同じ倍数であるか、同じ約数であるか、または同じ約数和であるとき、それらの数は比例する。」

この定義は、第5巻の比例論から引き継がれる。ただ、ここではまだ無理数に適応されていないようだ。
最大公約数を求める方法では、いわゆる「ユークリッドの互除法」が登場する。

「命題1: 二つの不等な数が定められ、常に大きい数から小さい数が引き去られるとき、もし単位が残されるまで、残された数が自分の前の数を割り切らないならば、最初の2数は互いに素であろう。」

第8巻と第9巻は、連続比例する数がテーマで、現代風に言えば等比数列といったところか。そして、第9巻では、エレガントさで知られる「ユークリッドの素数定理」が登場する。

「命題20: 素数の個数はいかなる定められた素数の個数よりも多い。」

つまり、素数は無限に存在するというわけだが、その証明を要約するとこんな感じか。
...
定められた個数の素数をA, B, Γ とせよ。A, B, Γ よりも多い素数があると主張する。A, B, Γ で割り切れる最小数ABΓ をとり、これに単位(=1)を加えたとせよ。そうすれば、ABΓ+ 1 = Hが素数であるかないかである。まず、素数であるとすれば、素数A, B, Γ よりも数の多い素数A, B, Γ, H があることになる。素数でないとすれば、H は素数のどれかで割り切れなければならない。しかし、Hは、ABΓ+ 1 でしか割り切れないのでこれまた素数であると主張する。したがって、定められた素数A, B, Γ よりも多い数の素数A, B, Γ, Hが見出された。
...
んー...思考がエレガントでも、言い回しが馴染めない。

第9巻の後半は、偶数と奇数に関する基本的な命題が扱われ、最後に完全数が証明される。完全数とは、約数の和がその数自身と等しくなる数で、例えば、6 = 1 + 2 + 3, 28 = 1 + 2 + 4 + 7 + 14 がある。古代の歴史では、神が6日間で世界を創った天地創造、月の公転周期は28日、などの解釈で知られている。

「命題36: もし単位から始まり順次に1対2の比をなす任意個の数が定められ、それらの総和が素数になるようにされ、そして全体が最後の数にかけられてある数をつくるならば、その積は完全数であろう。」

「単位から始まる」というのは、1から始まることを意味する。そして、素直に書いてみると。
...
まず、順次に 1 : 2 の比をなす数、A, B, Γ, Δ があるとすると、1 + A + B + Γ + Δ = E が素数ならば、E x Δ = ZH となるようにすると、ZHは完全数になるとのこと。
...
現代風に書けば、「2^n - 1 が素数ならば、2^(n - 1)・(2^n - 1)は完全数」となるが、随分と違った景色が広がる。

[ 第10巻: 無理量論 ]
第10巻は命題が115個もあり、もう気が狂いそう!歴史的にも最も難解とされるところである。ここでは第2巻や第5巻から続く、無理量の詳細な理論が展開される。無理量とは通約できない量である。例えば、正方形の対角線など比の値が無理数になる量のこと。定義では、「いかなる共通な尺度ももちえない量は通約できない量」としている。通約できないということは、明確な数値で表せないことを意味し、比で相対的に扱うしかないというわけだ。そして、有理線分と無理線分、有理面積と無理面積の概念が出現する。比は方形の面積で扱われる。有理面積とは、長さにおいて通約可能な有理線分で囲まれた方形の面積のこと。無理面積とは、有理線分で囲まれても、平方においてのみ通約可能となる場合の面積のこと。
また、x^2 = ab から定められる辺xは無理線分であり、これを中項線分と呼んでいる。これは第2巻の命題14に相当する。更に、重要な概念として、二項線分、余線分、優線分、劣線分という奇妙な用語に振り回される。

「命題36: もし平方においてのみ通約できる二つの有理線分が加えられるならば、全体は無理線分であり、そして二項線分と呼ばれる。」
その証明では、次のように設定される。
「平方においてのみ通約できる二つの有理線分AB, BΓが加えられたとせよ。AΓ全体は無理線分であると主張する。」

「命題73: もし有理線分から全体と平方においてのみ通約できる有理線分がひかれるならば、残りは無理線分である。それを余線分とよぶ。」
その証明では、次のように設定される。
「有理線分ABから有理線分BΓがひかれ、BΓは全体と平方においてのみ通約できるとせよ。残りのAΓは余線分とよばれる無理線分であると主張する。」

「命題39: もし平方において通約できず、それらの上の正方形の和が有理面積で、それらによってかこまれる矩形が中項面積である2線分が加えられるならば、この線分全体は無理線分であり、そして優線分とよばれる。」
その証明では、次のように設定される。
「平方において通約できないで、与えられた条件をみたす2線分AB, BΓが加えられたとせよ。AΓ全体は無理線分であると主張する。」

「命題76: もし線分からその線分全体と平方において通約できない線分がひかれ、全体とひかれた線分との上の二つの正方形の和を有理面積とし、それらによってかこまれる矩形を中項面積とするならば、残りは無理線分である。そして劣線分とよばれる。」
その証明では、次のように設定される。
「線分ABから線分BΓがひかれ、BΓは全体と平方において通約できず与えられた条件をみたすとせよ。残りのAΓは劣線分とよばれる無理線分であると主張する。」

命題36と命題第39では点Γが線分ABの延長上にあるのに対して、命題73と命題76では点Γは線分AB上にある。気になってしょうがないのは、直線や点の名前の付け方に一貫性がないことである。命題41の補助定理あたりからの流れによるもののようだが、実にらしくない。二項線分や無理線分、あるいは、余線分や劣線分といった用語の使い方は、平方根を幾何学的に記述した結果であろうが、今日では当たり前とされる無理数の存在を認めないと、こうも複雑になるものか?この言い回しが、第13巻の正多面体論にも影響を与えるから頭が痛い。
尚、第10巻の目的は、現代風に書くと √(√a ± √b) の二重根号の形で表される無理量の一般化を考察しているらしい。

[ 第11巻と第12巻: 立体幾何学と取尽くしの方法 ]
第11巻では、立方体が扱われ、平面と点、平面と直線、平面と平面の位置関係が述べられた後に平行六面体が議論される。

「命題33: 相似な平行六面体は互いに対応する辺の3乗の比をなす。」

第12巻では、角錐、円柱、円錐、球の体積を扱い、「取り尽くし方法」と呼ばれる手法が用いられる。取り尽くし方法とは、図形の面積や体積を求める手法の1つで、ある図形に内接する多角形を描き、その面積から元の図形に近づけていく方法だという。現代で言う微積分の感覚であろうか。その方法が使われているのが、6個の命題だという。

「命題2: 円は互いに直径上の正方形に比例する。」
「命題5: 同じ高さをもち三角形を底面とする角錐は互いに底面に比例する。」
「命題10: すべての円錐はそれと同じ底面、等しい高さをもつ円柱の3分の1である。」
「命題11: 同じ高さの円錐および円柱はそれぞれ互いに底面に比例する。」
「命題12: 相似な円錐および円柱は互いに底面の直径の3乗の比をなす。」
「命題18: 球は互いにそれぞれの直径の3乗の比をもつ。」

[ 第13巻: 正多面体論 ]
正四面体、正六面体、正八面体、正十二面体、正二十面体を作図し、それぞれの辺と球の直径を比較する。つまり、プラトン立体で締めくくられるわけだ。そして、第10巻で準備された無理線分、あるいは劣線分や余線分との関係が述べられる。

「命題12: もし円に等辺三角形が内接するならば、三角形の辺の上の正方形は円の半径の上の正方形の3倍である。」
つまり、円に内接する正三角形の辺の2乗は円の半径の2乗の3倍であるとしている。
すなわち、s3 = (√3)r の関係。ただし、rは半径。

「命題13: 角錐をつくり、与えられた球によってかこみ、そして球の直径上の正方形が角錐の辺の上の正方形の2分の3であることを証明すること。」
つまり、球の直径の2乗は内接する正四面体の辺の2乗の2分の3であるとしている。
すなわち、k4 = {2√(2/3)}r の関係。

「命題14: 正八面体をつくり、先のように球によってかこみ、そして球の直径の上の正方形が正八面体の辺の上の正方形の2倍になることを証明すること。」
つまり、球の直径の2乗は内接する正八面体の辺の2乗の2倍であるとしている。
すなわち、k8 = (√2)r の関係。

「命題15: 立方体をつくり、角錐の場合のように球によってかこみ、そして球の直径上の正方形が立方体の辺の上の正方形の3倍になることを証明すること。
つまり、球の直径の2乗は内接する立方体の辺の2乗の3倍であるとしている。
すなわち、k6 = (2 / √3)r の関係。

「命題16: 正二十面体をつくり、先の図形のように球によってかこみ、そして正二十面体の辺が劣線分とよばれる無理線分であること証明すること。」
すなわち、k20 = {√(10 - 2 √5) / √5}r、これは劣線分との関係。

「命題17: 正十二面体をつくり、先の図形のように球によってかこみ、そして正十二面体の辺が余線分とよばれる無理線分であること証明すること。」
すなわち、k12 = (√15 / 3)r - (√3 / 3)r、これは余線分との関係。

最後に劣線分と余線分との関係が示されるということは、二重根号からは逃れられないということか。平方根は方形の面積で記述できるが、その面積の大小関係に踏み込めば、それも必然であろうか。はぁ~!

2011-12-18

"ユークリッド「原論」とは何か" 斎藤憲 著

雑念を払い、ひたすら厳密性に傾注した記述とはどんなものか?到底手の届かない領域にあることは想像に易い。それでも、生涯で一度は触れてみたい古典がある。アル中ハイマーな知識では、いきなり読んでも退屈するだろう。そこで、心の準備となる書を漁ってみた。

「原論」は、紀元前3世紀頃に成立したと言われるギリシャ語で書かれた数学書である。そして、9世紀にはアラビア語に、12世紀にはアラビア語からラテン語に翻訳されたという。
言語の優位性を眺めれば、その時代の文化や学問の勢力を読み取ることができる。8世紀頃、数学はイスラム世界を中心に発展し、ルネサンス期には科学論文はラテン語で書かれた。18世紀頃、文化の中心がパリへ移ると王侯たちはフランス語を学び、あのフリードリヒ大王までもフランスかぶれになった。20世紀以降、留学先はイギリスやアメリカが中心となり英語が世界語となった。よって、母国語の優位性を主張したければ、その言語圏で文化や学問を世界の最高水準に高めればよかろう。尚、ユークリッドの名は英語読みで、ギリシャ語ではエウクレイデスとなる。

「原論」は全13巻で構成される。だが、数々の写本が残されるものの原本は現存しないらしい。現在出版される各国語訳は、デンマークのハイベアが1880年代に出版したギリシャ語校訂版に基づくという。これは、19世紀初頭、フランスのペイラールが発見したヴァチカン図書館所蔵の9世紀の写本を基にして、他の写本を参考にしながら作られたものだという。そして、数々の修正を繰り返しながら今日に至る。
本書には、その第V巻までの概要が紹介される。このあたりが初等数学として一番多く読まれる箇所であろう。三角形や平行線、あるいは円や多角形の考察は、幾何学の基礎として数学入門者の間でも人気が高い。最初の6巻だけの簡略版も多く出回っているようだし。
ところで、ユークリッドは実在したのだろうか?集団説もあるが、今ではあまり顧みられることはないようだ。プトレマイオス朝の時代、アレクサンドリアで活動したという説はよく耳にする。ちなみに、「数学には王のための道はありません」と答えたという逸話もあるとか。ユークリッドに言及している最初の数学者はアポロニウスだという。
それにしても、古代ギリシアで、なぜ厳密性を問うような文献が誕生したのだろうか?霊感や占星術の盛んな時代にもかかわらず。ピュタゴラス教団でさえ宗教結社とされるのに。当時、ソフィストたちが、政治的、社会的影響力があったのは間違いなかろう。弁論術や処世術を教えて喰っている自称教育家たちである。ソクラテスは彼らを詭弁家として思いっきり批判したとされる。彼らの存在が、逆に主観性を極力排除すべし!という認識を急激に育てたのかもしれない。現在ですら、論理性に主観性が結びつくと、しばしば議論が迷走するのだから。主観性の強すぎた哲学が論理性を取り入れながら変化し、更に純粋な客観性としての数学が分離していく時代だったのかもしれない。

科学では、命題を検証や証明によって記述し、その命題の連鎖によって定理を積み重ねていく伝統がある。逆に言えば、一つの命題が否定された途端に脆くも崩れるという危険性を孕んでいる。客観性を強調するために、純粋な証明以外のメタ的見解を排除しようと努力してきた。まさに「原論」の示す形式である。
しかし、本書は意外な面を紹介してくれる。線や円など図形の名前のつけ方に一貫性がまるでないこと。命題参照で命題番号を付けずに代名詞で扱っていること。そして、暗黙的な表現が多く、一部の識者の共通認識を前提として書かれている節があるというのだ。数学の文献として整えられたのは、ずっと後になってからのことらしい。
また、図版では特殊なケースを扱っていて、一般化の配慮がまったくなされていないという。三角形を扱うのに二等辺三角形や直角三角形は特殊なケースだが、見映えがいいのも確かである。だが、紹介される写本の図版は現在の見慣れた図版とは大きく違い、わざわざ難しくしているようにも見える。実に奇妙だ。記述をパピルスや岩に残すことができたとしても印刷術のない時代、知識を伝えるには主に言明を手段にしていたことが推察されるという。代名詞を多用するのも、図版よりも言明を重視した結果ではないかと。この時代、まだ言明と文献の区別があまりなかったのかもしれない。そのために説明不足も生じる。同時に、最小限の命題とともに最小限の物言いで研究者たちの想像力を掻き立ててきたとも言えそうだけど。論理学では、余計な解釈や余計な形容を用いないという鉄則がある。アル中ハイマーの最も苦手とするところだ。
カント曰く、「多くの書物は、これほど明晰にしようとしなかったら、もっとずっと明晰になったろうに。」

1. 定義、そして公準と公理
原論には序文がなく、唐突に点や線の定義から始まるという。こんな具合に。
「点は部分のないものであり、また線は幅のない長さであり、また線の端は点である。直線とはその上の諸点に対して等しく置かれている線である。...」
その前の時代でも、アリストテレスの著書「自然学」のように、序文で前提や立場などが語られる慣習があったらしいが、唐突に始まるのは珍しいようだ。ちなみに、「自然学」は当時の物理学書のようなもの。
では、なぜ原論は唐突に始まるのか?実は、もっと前の紀元前5世紀、「原論」なるものがキオスのヒポクラテスによって編集されたという。尚、医学のヒポクラテスとは別人。それも完全に失われているので、ユークリッドのものが最古ということになるそうな。通説ではユークリッドはプラトンやアリストテレスの影響を受けたことになっているが、「原論」は哲学的議論を避けるようにできているという。論証スタイルも、アリストテレスの哲学論法とはまったく違うそうな。自明な事象を淡々と羅列する形式は、哲学の入り込む余地などないと宣言しているのか?そして、哲学なんぞに頼らなくても、最低限の公準や公理だけで宇宙は説明できるとでも言っているのか?
最初の点や線の定義は20数個からなり、次に証明なしで承認を要求するという。それぞれ「要請」「共通概念」とし、今日では「公準」「公理」と呼ばれるものである。いわば自明というわけだ。
ところで、有名な5つの公準のうち、第五公準はだけが長文でややこしいのはどういうわけか?いわゆる平行線公準である。ここに、非ユークリッド空間の可能性を示唆していたと想像するのは、考え過ぎだろうか?非ユークリッド空間が証明されたからといって、ユークリッドを蔑む気にはなれない。その本質的意義は論法にあるからだ。宇宙を説明する時、自明だが証明できないものがあるという前提は、天地を覆す発想である。これぞ、人類の最高の知的財産ではなかろうか。客観性と同じくらい直観の偉大さを示しているわけだが、ある意味宗教的ですらある。だから批判にも曝されるのだけど。科学と宗教の違いは紙一重ということであろうか。少なくとも、神の存在と死後の世界を具体的に提示するよりは、はるかに進んだ思考である。

2. 論理スタイル
定義、要請、共通概念の次に命題がくる。命題は伝統的に定理と問題に分けられるという。なんらかの性質を証明するのが定理である。なんらかの条件を満たす対象を得るのが問題で、図形ならば作図法を、整数論ならば数を求める手続きを示す。命題は六つの部分に分けられるのが慣例だという。それは、言明、提示、特定、設定、証明、結論。まず、命題を一般的に「言明」し、点や図形などを導入して「提示」する。次に、命題に即して少し言い換えて「特定」する。そして、具体的な作図手順を「設定」する。最後に、「証明」して「結論」を述べる。...といった具合。
おもしろいのは、命題の最後の最後に「これがなされるべきことであった」と締めくくられるという。それが、定理だったら「これが証明されるべきことであった」となる。そのラテン語文は、前者が Quod Erat Faciendum. 後者が、Quod Erat Demonstrandum. 略して Q.E.F. や Q.E.D. となる。哲学書でもお馴染みのフレーズだ。
ところで、古代、あらゆる運動や変化を否定したエレア派という学派があったそうな。ユークリッドは点や線から生じる物理現象を説明していることから、エレア派への対抗意識があったという意見もある。それを強く主張したのがアルパッド・サボーという人だそうな。エレア派の始祖パルメニデスの言葉に、「あるものはある、あらぬものはあらぬ」というのがあるという。あるというのは存在を意味し、存在することと存在しないことは違うこととして、存在から存在しない状態に変化することは矛盾すると考えるそうな。その解釈が拡張されると、物体の変化や運動の存在すら否定される。その対抗意識で、なにかと批判や文句を言う奴の顔を思い浮かべながら書くと、無味乾燥的な書になるのかもしれない。すなわち客観性に訴えることになろう。「原論」は、それを実践した結果なのかもしれない。

3. 幾何学的代数
第II巻には、ちょっと変わった歴史があって、20世紀に激しい論争が巻き起こったという。歴史的には、アポロニウスの「円錐曲線論」の研究で、「原論」の第II巻が本質的に代数であると主張したあたりから始まり、20世紀にはノイゲバウアーの「幾何学の衣をまとった代数」という解釈が通説になったという。
この論争で注目すべきは、命題5と命題6だという。
今、2つの線分 a, b で囲まれる長方形を r(a, b) と表し、線分aで囲まれる正方形を q(a) と表す。そして、面積公式から、r(a, b) = ab, q(a) = a^2 と書ける。

「命題5: 直線ABが点Gで二等分され、別のAB上に点Dが取られているとき、AD, DBに囲まれる長方形 r(AD, DB) に2つの分点G, D間の直線GD上の正方形 q(GD) を加えたものは、全体の半分上の正方形 q(BG) に等しい。」

この命題は、r(AD, DB) + q(GD) = q(BG) が成り立つと言っている。
ここで、AG = GB = a, GD = b とすると、次の展開式に対応する。

 (a + b)(a - b) + b^2 = a^2

実は、命題6も同じ展開式に対応する。命題5との違いは、点Dの位置で、命題5が線分AB上にあるのに対して、命題6では線分ABの延長上にあること。
そして、r(AD, DB) + q(GB) = q(GD) となり、展開式では次のようになる。

 (b + a)(b - a) + a^2 = b^2

つまり、命題5と命題6は代数的解釈では同じというわけだ。では、なぜ重複する命題が存在するのか?幾何学的に配置が違うことに意味があるのか?これが論争の焦点である。
従来の定説では、2数の和と積から求める連立方程式の解法に結びつけるものだったという。x + y = p, xy = Q の連立方程式が命題5に対応し、x - y = p, xy = Q の連立方程式が命題6に対応する。
作図問題が代数学と結びつくことは近代数学ではよくある話だが、はたしてユークリッドの時代にそこまで意図されていたのか?和や積が代数と結びつく幾何学的問題は、紀元前10世紀のバビロニア数学に遡るという。そして、バビロニア数学がギリシアに伝わり、「原論」に影響を与えたという説があるそうな。
なぜ代数学を幾何学で表したのかというと、ギリシア人は無理数というものを持たなかったので、平方根を表すのに幾何学的な手段を用いざるをえなかったという。ギリシア数学では、非共測量の発見後も無理数という形を用いなかったそうな。「原論」では、やたらと比や比例という概念を用いているらしい。幾何学的に言えば相似である。しかし、バビロニアの方程式の解法が「原論」に影響したという証拠はないらしい。
いずれにせよ、第II巻の命題が後述にどのように利用されるかを見ていけばよかろう。だが、あまり利用されていないというから困ったもんだ。強いて言えば、円錐曲線の理論で使われるぐらいだという。ちなみに、アルキメデスの業績のかなりの部分は、円錐曲線とその回転体に関する面積と体積の決定だという。ユークリッド自身も「円錐曲線原論」なる著作があったと言われているとか。では、第II巻の命題は、円錐曲線の理論のための補助定理だったかというと、そう単純でもなさそうだ。
本書は、「原論」で後述される「方べきの定理」で幾何学的な意義の可能性を説明してくれる。方べきの定理では、似たような定理でも巧妙に配置を変えることによって様々な形をとることが見て取れる。要するに、議論の対象とする点を円の外に置くか、円の内に置くかの違いで量的関係も変わってくるということのようだ。

4. 正五角形の分析
第III巻では三角形や多角形と内接、外接する円の問題が扱われ、続いて第IV巻では正五角形に関する命題が検討される。正五角形に関する命題は、「原論」の中でも屈指の成果だという。その本質的な作図は第IV巻の命題10にあり、それまで展開された多くの理論や技法が集中的に利用されるという。第I巻から第IV巻までの山場というわけか。尚、正五角形を円に内接させる作図は、続く命題11で行われる。
ギリシア数学では、作図すべき図形が描けてしまったと想定して、そこから何が成り立つかを探求する技法が使われたという。その技法は、「アナリュシス(分解)」と呼ばれるそうな。analysis の語源か。だが、当時の文献で解析手順を記したものは珍しいという。命題10でも、解析がなされたと推測されている程度のものらしい。
本書は、この命題の逆順を追っていくと、三角形の作図は黄金分割に帰着するという。その重要な概念は、比例と相似である。正五角形の作図には、三角形の相似と辺の比例がつきまとう。だが、これを巧みに回避しているらしい。命題10の議論は、比例と相似という言葉を回避することに大半が占められるという。
また、よく知られる「比例の内項の積は外項の積に等しい」という定理に相当するのは、第VI巻の命題17に現れるという。ただ、原論には線分の積という概念はなく、代わりに長方形や正方形の面積が使われているようだ。
更に、第IV巻では、命題16で正十五角形の作図法が記される。プロクロスは、この命題を天文学に関係すると指摘したという。正十五角形の一辺に対する中心角24度は、天文学で重要な黄金傾斜にほぼ等しい。ただ、命題16はその表現や形式から後世の追加であることがほぼ確実で、プロクロス以前の追加と考えられているそうな。

5. 比例と非共測量(無理量)
相似関係は初等的な問題であるが、比というものを非共測量と絡めると、これを言明するのは意外に難しいかもしれない。正方形の辺をs、その対角線をdとした時、その比である d/s = √2 となるのは、三平方の定理で簡単に導ける。しかし、無理数だ。ピュタゴラスの「万物は数である」という信仰が根強くあれば、数学の危機を感じたことだろう。近代数学で言えば、不完全性定理の発見と似たような状況にあったのかもしれない。数自体が明確に表現できないとなれば、比較によって相対的に記述するしかない。これが、比や比例の意義であろうか。となれば、相対的な認識しか持てない人間にとって、比較するという行為は本質的なもの、あるいは本能的なものかもしれない。
ところで、「原論」の比例の定義はヘンテコだ。ガリレオもかなり不満を持っていたという。

「第V巻、定義5: (4つの)量が、第一が第二に、第三が第四に対して、同じ比にあるといわれるのは、第一と第三の等多倍が、第二と第四の等多倍とを比較して、それらが何倍であっても、各々が各々に対して、同時に超過するか、同時に等しいか、同時に不足するときである。」

なんじゃこりゃ?4個の量において常に大小関係が一定で、しかも等多倍であるときに比例するということだけど。「原論」の比例の定義は難解とされ、16世紀になって正しく解釈されるようになったという。だからといって、この定義が非共測量の比例までも扱える一般性を具えた見事な記述だと賞賛する者はいないだろう。

6. ユークリッドの他の著書
ユークリッドの著作と思われるものに、こんなものがあるそうな。
「デドメナ」は、解析という問題探求の方法の基礎定理を提供した。
「オプティカ」は、今日の応用数学と呼べるもので、視覚すなわち物の見え方を幾何学的作図によって探求した。
「カトプトリカ」は、鏡による反射を扱った。
「ファイノメナ」は、天文現象を星が地球を中心とする球面の上にあるとして議論した。
「カノンの分割」は、音程や協和音を数の比で分析した。

2011-12-11

"フラクタル" 高安秀樹 著

前記事の山口昌哉氏の入門書でフラクタルな世界に魅せられた。そこでもう一冊。本書は1986年版と、ちと古いが、一歩踏み込んだ数学的な解釈がなされる。また、コッホ曲線やレビのダスト、あるいはローレンツ系などプログラムの具体例も多く紹介される。ただ、コードがN88-Basicというのが時代を感じる。

現象を細かく調べれば調べるほど、かえって実体を見失い理解が遠のく場合が往々にある。距離を置きながら大雑把に眺めてこそ、自然の美しさとその意味を素直に読み取ることもできよう。フラクタルとはそうした世界ではなかろうか。フラクタルの根源である非整数次元は、実は100年前から知られていたそうな。脚光を浴びるようになったのは、コンピュータによる可視化によって、複雑なフラクタル図形を感覚的に捉えることができるようになったからである。当時、フラクタル次元に明確な定義がなく、非整数次元を総称して呼んでいたところがあったらしい。本書は、フラクタル次元の様々なアプローチを紹介してくれる。
ところで、次元が非整数とは何を意味するのか?通常の図形ならば特徴的な長さや幅といった物理量がある。球ならば半径、人間の形ならば身長といった具合に属性なるものがある。幾何学で一般的に扱う対象は、このような属性を持った図形であろう。その特徴は、線や面が滑らかで連続的、すなわち微分可能ということである。だが、フラクタルは対極的で、特徴的な長さを持たない図形である。その重要な性質は、自己相似性である。一部を砕いていみると全体と同じような形をしているわけだ。フラクタルの語源は、ラテン語の「fractus」で、壊れて不規則に小さな破片になった状態という意味があるらしい。
フラクタルは、滑らかさを否定し連続性が保てないので、いたるところで微分が定義できない。現象を分析しようとする時、微分が否定されては解析学的に絶望に見える。そこで、自己相似性という単純な規則性によって近似するような、まったく違った発想が試みられる。ここでは、特徴的な長さを持った基本図形から粗視化の度合いを変えながらアプローチする方法、測度の関係から積分的にアプローチする方法、相関関数から統計量として捉える方法、分布関数から統計的にアプローチする方法、スペクトルからアプローチする方法が紹介される。自己循環にも陥りそうな自己相似性は、コンピュータが得意とする再帰的処理が威力を発揮しそうな予感がする。ここで注目したい概念は、「フラクタル次元」,「くりこみ群」,「安定分布」である。

本書は、フラクタルに馴染んでいくと、フラクタルもどきに惑わされると注意している。「通称フラクタル病」というものだそうな。複雑系を眺めれば、どんなものでも自己相似性に思えてくるものらしい。例えば、中華料理などの表面に浮かぶ油が大小様々な大きさになる様子は、その直径を調べてみると、べき分布ではなく指数分布に近いことが分かるという。人口分布も、べき分布でなく指数分布だという。都市社会学では、都市人口密度の法則というものがあって、大都市への人口集中が非常に強く、都市の中心から距離rにおける人口密度は、exp(-r/r0) に比例するという。カビの生え方も、指数分布だそうな。これらの例は、名古屋大学フラクタル研究会が調査したものらしい。そして、いまだデータ不足のために決着のつかないものが、蟻の軌跡、地磁気の反転、DNA配列などがあるという。古い情報なので、もう少し解明されているかもしれないが。ただ、べき分布に近づくということは、飽和過程においてロングテール現象のような傾向があるのは確かなようだ。
一方で、フラクタルを拡張して、どんな複雑系も、フラクタル的に当て嵌めて解決しようという試みもあるという。フラクタル次元を位相次元で補うような、トポロジー的な思考なども紹介してくれる。その意味では、フラクタルと複雑系の境界線も曖昧なのかもしれない。
ところで、全体が部分の相似であるという世界観は、はるか昔からあった。国家や民族といった集団を、まるで個人の性質のごとく一緒くたに語ることがよくある。日本人は論理的思考に弱いといった具合に。また、社会構造、権力構造、精神構造が、トップダウン的なピラミッド構造を見せるのも相似性と言えよう。宇宙空間も、原子核を取り巻く電子軌道から、太陽系や銀河系などの形状的な相似性を想像する。部分から全体を把握しようとしたり、全体から部分を推定しようとする考え方は、経験的思考であり、人間社会にある種の合理性を与えてきた。自己相似的思考は、一種の抽象化理論と言ってもいいだろう。解析学は客観的思考を強調するが、フラクタルは主観的感覚を重んじるといった感じであろうか。

1. フラクタル次元
通常の次元は整数で扱い、次元が増えれば自由度を増す。これが力学の基本である。線は1次元、面は2次元、空間は3次元と捉える経験的次元がある。
ところが、1890年、二次元であるはずの正方形上の任意の点を、たった一つの実数によって表されることが証明された。その代表例がペアノ曲線である。これが自己相似形で、いたるところで微分不可能であることは一目瞭然である。これを曲線と呼んでいいのか?という抵抗感もあるけど。一つの実数で表現できるということは、n次元空間を一次元とみなすことが可能というわけだ。
この次元の矛盾を解決するために、相似性次元という概念が生まれた。線分、正方形、立方体の各辺を二等分すると、線分は2個、正方形は4個、立方体は8個に分断される。それぞれ、2^1, 2^2, 2^3 で表され、その指数が経験的次元と一致する。これが相似性次元というものか。一般的には、こういうことらしい。
「ある図形が、全体を 1/a に縮小した相似図形 a^D 個によって構成されているとき、この指数Dが次元の意味をもつ。」
そして、ペアノ曲線の相似次元は、二次元(2^2)となり、正方形の次元と一致する。ある図形の全体を 1/a に縮小した相似形が b個によって成り立つ場合、相似性次元は以下のようになるという。

 D= log b / log a

例えば、コッホ曲線は、全体を 1/3 にした相似形4個によって全体が構成されているので、こうなる。

 D = log4 / log3 = 1.2618...

一次元と二次元の間に次元が存在するとは奇妙な話だが、一次元よりは複雑で二次元ほどには自由度がないと捉えれば、それなりに合理性がありそうだ。ただ、このままの定義では、適用範囲が限られている。厳密な相似性を有する規則的なフラクタル図形だけにしか、定義できないからである。そこで、ランダムな図形まで含めたものが用意されている。その代表がハウスドルフ次元だという。他にも、コルモゴロフによって導入された容量次元というものもあるらしい。

2. 悪魔の階段
カントール集合は、フラクタルの紹介で必ず顔を出すものだそうな。その応用範囲も広い。まず、線分 [0, 1] を3等分し、真中の区間 [1/3, 2/3] を消去する。残った部分をそれぞれ3等分して、真中の区間を消去するという操作を無限回繰り返し、極限に残った点がカントール集合である。このフラクタル次元は、こうなるという。

 D = log2 / log3 = 0.6309...

この密度分布を表す関数は、いたるところで微分が0になるような階段状になっていて、「悪魔の階段」と呼ばれるそうな。

3. くりこみ群
くりこみ群の目的は、観測における粗視化の度合いを変えたときの物理量の変化を定量的にとらえることである。あるスケールで粗視化した時の物理量を p とし、そのスケールの2倍で粗視化した物理量を p' とすると、変換関数 f において、次の関係が成り立つだろう。

 p' = f(p)

これを、更に2倍の粗視化の度合いを変えていけば、次のようになる。

 p'' = f(p') = f・f(p)

ここで、f は逆変換をもたないという。つまり、粗視化した状態を与えても一意的に元の状態に戻らないわけだが、このような性質の変換を数学では「半群」と呼ぶという。そして、物理学では粗視化による変換を「くりこみ」と呼ぶという。よって、f の変換を「くりこみ半群」と呼ぶのが正確だという。
「フラクタルとは、粗視化をしても変化しないようなもののことであるから、くりこみ群の変換 f に対して不変なものがフラクタルであるといってもよい。」
くりこみ群を用いれば、フラクタル次元や臨界指数を比較的簡単に求められるという。あくまでも近似だろうけど。

4. 安定分布
レビによって考案された「安定分布」という概念があるそうな。それは、次のような和に対する分布の不変性を意味する。X, X1, X2, ..., Xn を共通な分布Rをもつ互いに独立な確率変数とした時、その和が次式になるような定数 c, r が存在する場合、分布Rは安定であるという。

  X1 + X2 + ... Xn = cX + r

多くの場合、ある分布に従う確率変数の和は元と異なる確率変数となりそうだが、適当な一次変換によって元と同じ分布になるようなものが安定分布ということのようだ。このような分布でよく知られているのがガウス分布だという。ガウス分布の和もまたガウス分布というわけか。これは、統計学的に解釈した相似性の例ということができそうだ。

2011-12-04

"カオスとフラクタル" 山口昌哉 著

図書館を散歩していると、ある本に嵌ってしまう。本書はブルーバックス版(1986年)。尚、ちくま学芸文庫からも発刊(2010/12)されていることを後で知った。なるほど、復刊するにふさわしい入門書である。

カオスという言葉が文献に登場したのは、紀元前700年頃ヘシオドスの「神統記」にまで遡る。一方、数学界にこの言葉が登場したのはずーっと後のことで、1975年リーとヨークの定理が最初だという。その頃、ブノワ・マンデルブロが、フラクタルという言葉を持ち出す。当時、カオスの方は、決定論的プロセスと非決定論的プロセスの境界がなくなるとして研究者たちが群がったが、フラクタルの方は、あまり反響がなかったそうな。フラクタルに注目され始めたのは70年代末、コンピュータグラフィック技術の進化によってである。
カオスは、複雑系を確率論的にしか捉えられない不規則な世界である。関数もすっきりとした連立方程式から導かれるのではなく、波動的あるいは集合論的な関数によって導こうとする。対してフラクタルは、単純な基本図形から自己相似形を繰り返していくと、極めて不規則な、いや不規則そうに見える図形を形成するという摩訶不思議な世界である。どちらも混沌に向かってそうに見えるが、フラクタルは数学的に計算できるのが、その違いである。本書は、この二つは別々のものではなく、実はカオスのプロセスを逆に観察するとフラクタルが見えてくるという。その共通概念は非線形である。
ところで、線形という言葉の定義も難しい。線形やリニアとは、グラフで描けば直線になるもの、すなわち一次関数と習ったものだが、縦軸の目盛を対数にとれば対数関数や指数関数も直線になる。目盛を任意の関数にとれば、どんな曲線も直線になるだろう。線形とは、原因と結果が何らかの形で連続性を示す予測可能な関係とでも言おうか。
しかし、線形を求めたところで、あらゆる物理現象は非線形に見舞われる。世間では未来を予測するために法則というものを考えるが、実際には初期条件や境界条件なるものを前提しなければならない。電子工学でリニア素子と呼んだところで、限られた範囲の周波数特性において線形性を見せるだけだ。そう、非線形な現象の中から線形に見えるところだけを都合よく用いているに過ぎない。したがって、非線形な市場経済では、市場動向の予測可能な範囲で参加すればいいだけのこと。人生も非線形的で、成長著しい10代からやがて老化して飽和していく。なによりも生まれて死ぬという特異点がある。おまけに、その二大特異点で連続性が保たれるのか?と問えば、宗教しか答えてくれない。神は、人間が特異点に出会う度に想定外だと言い訳する態度を、滑稽に眺めているに違いない。

微分とは、物理現象を解析する上で、その瞬間をスナップ写真のように映しだす便利な道具である。微分方程式とは、未知の関数とその導関数との間に成り立つ関係である。ただ大きな問題は、微分方程式の多くが解けないことである。だから、ε-δ論法なんて近似的な思考を持ち出して、せっかくの数学愛好家を落ちこぼれにしやがる...と愚痴る。
近似と言えば、ニュートン時代からの古典的な思考に差分方程式がある。連続性を映しだすには、差分区間を無限小に近づけることになり、極めて微分の思考と似ている。
ところが、だ!本書は、その微小dtが差分Δtになった途端に奇妙な現象が起こるという。すなわち、限りなく小さい区間を、大雑把に小さい区間にすると、たちまち非線形性が現れるというのだ。ニュートン力学では物理現象を連続性で捉えるが、差分的思考では離散的に捉えて近似する。要するに近似とは、人間の認識能力を誤魔化す巧みな方法論なのだ。
本書は、カオスを引き起こす原因は離散力学系にあるとしている。電子工学では、滑らかで連続的なアナログ波形に対して、デジタル波形となると、たちまちオーバーシュートやアンダーシュートが起こる。いわゆるギブス現象というやつで、急激な変化点では発散する。この現象は、三角関数で連続的に微分できるにもかかわらず、フーリエ変換ですんなり証明できてしまう。となると、連続性よりも離散性の方に真理があるのか?と思えてくる。電子スピンはどういうわけか、離散的な軌道を描きやがるし。連続性を前提にした微分とは、永遠に近づけない真理への無駄な努力ということか?人間認識の本質が近似にあるとすれば、誤魔化しのきく人間ほど幸せになれるということか?いや、救いは離散系におけるランダム性に求めて、そこに真の純粋性があるに違いない。そう、精神分裂的な気まぐれこそ純粋哲学というわけだ。

1. ランダムとカオス
連続であっても非線形性で分かりやすいのは折れ線グラフであろう。滑らかな曲線だってサンプル数を減らせば折れ線グラフになる。コンピュータグラフィックでは、画素をドット単位で離散的に表示する。そして、最小サンプル数で描くと基本的な形が三角形ということになろう。フラクタル図形の基本は三角形の自己相似性にありそうだ。
また、ランダム性の最も単純な現象は、コイン投げのような確率であろう。その現象は、区間[0, 1]で三角形のようなグラフを描く。これが離散力学系の基本的な現象であろう。
グラフが直線ということは、微分不可能を意味する。次元が下げられない上に上げられない現象の正体とは?カオスの正体とは、微分不可能な領域にあるのかもしれない。
さて、ランダムもカオスに含まれるのであろうが、その違いとは何か?ランダムは事象が平等に現れるのに対して、カオスは事象がすべて現れるとは限らない。ランダム性は確率論的決定論と言えるのかもしれない。だが、実験すると極めてカオス的な現象を示す。おもしろいのは、決定論的な方法で非決定論的な結果が得られるということだ。そうなると、決定論と非決定論の境界も曖昧になっていく。
本書は、カオスはある区間に閉じ込められた時に生じるもので、もし区間が解放されれば、カオスは絶対に起こらないという。カオスが生じるということは、宇宙空間が閉じていることの証しなのか?エントロピーの正体は閉じた宇宙にあるのか?
「嵐の前の静けさ...という言葉があるが、静けさの時間が予言できれば、嵐も予言できるわけである。」

2. ロジスティック方程式
個体群生態学では、ベルハルストが考案したロジスティック方程式というものがあるらしい。生態の増殖モデルとして考案された微分方程式である。変化率を人口Nの関数になると考え、環境収容能力をK、増加率をrとすると、次式になるという。

 dN/dt = f(N) = rN (K-N)/K

その解は、初期値をN0とすると、こんな感じらしい。

 N(t) = K N0 exp(rt) / ( N0 exp(rt) + K - N0 )

ここでは、最初増加率が低く比例的に変化するものが、突如指数関数的に増加し、そして頭打ちになる例を紹介してくれる。数学的には簡単でも、その意義となると極端に理解が難しい。ゼロから存在が生じることは説明できないし、そもそも環境に依存する数値が客観的に得られるのか?という疑問がある。この方程式は、なんとなく数学と社会学の境界線、もっと言うなら客観性と主観性の境界線を暗示しているように映る。
ちなみに、ロバート・メイの離散的な数値実験では、パラメータrが3以下の場合、初期値が0と1との間のどんな値でも、1 - 1/a に収束し、予測可能になるという。だが、rが3.57...以上になると、初期値の微小な差で大きな差が生じて、たちまち予測できなくなるという。これが、カオスの所以ということらしい。

3. ローレンツアトラクタ
ストレンジアトラクタとは、「奇妙な引きつけるもの」いや「奇妙に終焉するもの」と言った方がいいだろうか。結局、どこかの状態に落ち着くことはよくある。カオスに対して逆行するような現象である。
本書は、二次元におけるカオスの数理からホモクリニックな点を紹介してくれる。カオスの抽象化は幾何学的にはトポロジーに通ずるものがありそうだ。
二次元の力学系であればまだ数値解析ができそうだが、三次元となるとたちまち複雑系へと迷いこむ。ローレンツの乱流モデルがそれで、あの奇妙な引力圏を描くやつだ。1963年、地球物理学者ローレンツは、三つの未知関数で流体運動を示したという。X(t)は対流の強さに比例、Y(t)は対流で上下する流れの温度差に比例、Z(t)は上下方向の温度分布が線形性から乖離する量、といった具合に。

 dX/dt = -σX + σY, dY/dt = -XZ + rX - Y, dZ/dt = XY - bZ

σは流体の拡散係数と熱伝導係数の比(プラントル数)。rとbは容器の形や流体の性質に関するパラメータ。本書は、ローレンツが示した連立微分方程式が三つの未知関数から成り立つことが重要であって、二つ以下の連続な力学系ではカオスは起こらないという。これは、三体問題と何か関係があるのだろうか?
ちなみに、ジャパニーズアトラクタというものもあるそうな。1961年、京都大学の上田睆亮教授によって発見された。上田教授の話によると、当初アナログコンピュータの故障かと思ったそうな。それは、二次元力学系のダフィングの方程式を写像した時に起こる現象である。ダフィングの方程式は次のようなもので、解は初期値の連続関数になるという。

 dx/dt = y, dy/dt = -ky - x^3 + B cosτ

連続力学系を離散力学系に写像した時に、たちまちカオス現象が生じるということらしい。

4. ファイゲンバウムの分岐ダイアグラム
物理学者ファイゲンバウムは、現事象の差分と次事象の差分の比に注目したという。

 (αn+1 - αn) / (αn+2 - αn+1)

そして、この比の極限を計算すると、次のようになるという。

 lim (αn+1 - αn) / (αn+2 - αn+1) = δ = 4.6602...

これがファイゲンバウム定数というやつか。分岐に関する事象では、普遍的な定数δによる法則性があるという。そして、その図形は「くまで型」になるという。こうなると、カオスにも法則性があると信じたくなるが、ほんまかいな?

5. カオスからフラクタルへ
ここで、おもろいパラドックス紹介してくれる。
「二等辺三角形の二辺の長さの和と底辺の長さは等しい???」
その証明は...二等辺三角形ABCでABの中点をB0、BCの中点をB1、ACの中点をC0として、底辺ACを二つの二等辺三角形AB0C0とC0B1Cに分ける。すると、AB = AB0 + B0C0, BC = CB1 + B1C0 となる。それぞれの三角形は相似で、これを繰り返すと分けられた三角形はジグザグな折れ線グラフを示す。そして、折れ線幅がだんだん小さくなり、やがて底辺の直線に近づいていく。なんと AB + BC = AC になるではないか。確かに、線分とは点の集まりであり、三角形も極小に近づけば点になるのだけど...
ところで、海岸線や国境線が正確に計測できないことは、広く知られている。例えば、スペインとポルトガルの国境線や、オランダとベルギーの国境線の長さは相互の国で公表値が違う。マンデルブロは、海岸線や、樹木の形、川の形などをシミュレートするためにフラクタルという概念を提案し、フラクタル次元なるものを提示した。その名前の由来は、フラクション = 分散という言葉だという。それは、普通の図形の次元は、1や2や3などの自然数であるが、コッホ曲線のように整数ではないところからきているそうな。ちなみに、コッホ曲線は、位相次元が1で、フラクタル次元は、log4/log3 = 1.36....となる。普通の次元は位相次元で示されるが、フラクタル次元が位相次元より高いものをフラクタルと呼んでいる。その性質は、全体はそれを縮小した部分から成る自己相似集合で形成される。ある部分の図形が全体の縮小された像になっていて、原型の入れ子構造となっているわけだ。
複雑な自己相似集合の例では、ジュリア集合とマンデンブロ集合を紹介してくれる。複素平面上で、以下の漸化式において、Znが無限大に発散しないような初期値Z0を持つような集合らしい。

 Zn+1 = Zn^2 + μ

その軌道は、μの値によって収束が決まる。マンデンブロ集合は、更にZ0を原点0にとって、nが無限大になってもZnが無限大にならないようなμの集合だという。その違いは、μを固定するか、初期値Z0を固定するかの観点の違いであろうか。

6. カオスの定義とは?
九鬼周造の著書「偶然性の問題」では、「必然とは、存在がそれ自身に根拠を持つ場合であり、そうでない存在を偶然」と呼んだという。この書には、他の学問は必然性のみを論じているが、形而上学のみが「偶然」に対して学問的に迫ることができると記されるそうな。形而上学を持ち出せば、学問は精神的方法論となり、それこそカオスの定義はメチャクチャになりそう。人間精神とは、自ら自己相似形によってメチャクチャにしているのか?
けして確率論も量子論も偶然そのものを研究しているわけではない。フラクタルとは、超経験的な直観的方法論にも見えてくる。これも決定論ということであろうか。
「カオスの研究は、偶然性そのものの研究といってはならないが、ある種の偶然性が必然性と近づく場面を、必然性の側から眺めているというべきではないだろうか。」

2011-11-27

"On Lisp" Paul Graham 著

前書きには「既にLispに親しんでいることを前提としている」とある。「けして泥酔した初心者は手を出さないでください!」と聞こえてくるが、これも怖いもの見たさというものか。慣れない言語を読んでいると不思議な感覚に見舞われる。それは、片言の外国語を喋る時の感覚に似ていることだ。文法を考えずに、とりあえず知っている単語を並べてみる。これぞリスト型言語の極意というものか。プログラミング言語を学習するのに、構文を意識せずに読んでいるのも珍しい。これぞ構文のない言語と言われる所以か。
まずは、立ち読みから始める。釘付けになったのは、後方で紹介される実装例で、継続、マルチプロセス、非決定性アルゴリズ、そしてオブジェクト指向言語を装うCLOSである。しかもマクロで実装してやがる。驚くべきは、この古典言語がこれらの機能を具えられるほどの拡張性が既にあったということだ。これは、Lispを度外視してもじっくり読んでみたい。ついに衝動には勝てず、買ってしまうのであった。

本書の特徴は、半分以上がマクロ機能に割かれることである。これはプログラミング言語の書籍では珍しいのではないか。Lispはマクロ機能が強力だと聞くが、なるほど、なかなかの感動ものだ。関数型言語なのでもちろん関数についても書かれているが、あくまでも基本という位置づけでしかない。
「あるプログラミング言語のエッセンスを一文で伝えるのは難しいが、John Foderaroの言葉はかなりそれに近い。: Lispはプログラム可能なプログラミング言語である。」
独自の言語をLispで書いて、その言語でプログラムする。まさに「On Lisp!」というわけか。この本の不思議なところは、コードがたくさん埋め込まれているわりには、抽象的に眺められることである。ユーザ定義のマクロや関数が、あたかも組み込み構文や組み込み関数であるかのように映る。逆に言えば、ネーミングのセンスが悪ければ、たちまち読みづらいプログラムになる。それは、どんなプログラミング言語でも同じだけど...
Lispが強力なのは、様々な機能が集合体となっているからだという。動的メモリの割り当て、ガベージコレクション、実行時型指定、オブジェクトとしての関数、リストを生成する組み込みパーサ、リスト表現を受け付けるコンパイラ、インタラティブな環境などなど...しかし、これらの機能は切り売りされる。近年のプログラミング言語はLispの特徴を多く取り入れている。

マクロと言えば...アセンブラ言語から馴染んできたアル中ハイマーな古代人は強力な武器として崇めていた。もう20年ぐらい前になろうか、おいらは小規模なマイコン用プログラムを書いていた。16KBから32KB程度のもので、リアルタイムOSを導入するには大袈裟な規模だ。当時は「組込み系」なんて言葉も使っていなかった。この世界でもC言語が台頭しつつあったが、コンパイル効率が悪いために冗長度が大きく、メモリ資源に制約のある小規模システムでは致命的となる。構文解析や最適化の癖に合わせてコーディングルールを決めたりしたものだ...
アセンブラ言語の経験があれば、関数とマクロの実装の違いはすぐにイメージできるだろう。関数の実装は、変数の退避などが割り込み処理と似ていて結構面倒だ。CPUが持つ汎用レジスタに役割の規則を作ったりと、なにかと神経を使う。引数はC言語ユーザが嫌うポインタで渡す方が楽だったりする。その点、マクロは単純に展開されるだけなので、関数呼び出しのオーバヘッドがない。だが、呼ばれるたびに展開され、メモリを消費するので頻繁には使えない。また、余計な姿を隠蔽するのが得意なだけに、変数の束縛範囲まで曖昧にしてしまう。ただ、関数を呼び出すためのメッセージ役を与えると癖になる。要するに、マクロの主な役割は翻訳としての機能であった。
この点、Lispは呼び出し側から見てマクロと関数を区別しない。これだけでも強力な要因となりうる。おまけに、マクロ内の変数名が重複しないように、ローカル変数の生成機能(with-gensyms)まである。マクロでは変数名でいつも悩まされるので、うれしい機能だ。
更に、アセンブラ言語レベルでオブジェクト指向っぽいこともやっていた。オブジェクト指向なんて言葉も知らない時代だ。クラスのような雛形を関数で実装するとインスタンスになってしまうので、マクロの方が相性がいい。それは、本書で紹介されるCLOSでも味わえる。変数のアクセスは、マクロメッセージを経由し、set/get系で抽象化できる。カプセル化の概念も知らずに自然に変数を隠蔽していたような気がする。上位階層から眺めると、マクロメッセージが並んだ独自の言語に見える。まさに「On アセンブラ!」というわけだ。
しかし、アセンブラ言語はCPUのシリーズよって方言があるのが厄介である。そして、時代はC言語系へと流れていった。それでも、プリミティブな部分だけ言語に依存させ、マクロで隠蔽するやり方を好むのは変わらない。ちなみに、その頃からの弊害か?いまだに継承の概念は実装のイメージがしずらく、好きになれないけど。
...アル中ハイマーのマクロのイメージとは、こんなもんだ。しかーし、Lispのマクロ機能はそんな比ではない。頭は既にKernel Panic !!!

1. ボトムアップデザイン
どんなプログラミング言語を使ってもボトムアップで記述することはできる。ただ、Lispはそれをこなせる最も自然な器で、開発当初から拡張可能なように設計されてきたという。言語の大半は関数の集合体であるが、それらはユーザ定義のものと区別しない。関数もまたデータと区別されず、Lisp全体がリスト型データ構造となっている。
「ユーザがLispコードを生成するLisp関数を書けるということだ。」
ところで、人間が思考する上で言語の役割は大きい。思考を明確にしたければ、自己を操る言語で書き下ろしてみることだ。分かっているつもりでも、実際に記述してみると、案外分かっていなかったことに気づかされる。自然言語には、思考を整理し客観的な視点を与える役割がある。それは、プログラミング言語でも原理は同じであろう。実装できないものを仕様に盛り込んでも空論に終わる。ならば、プロトタイプを実際に書いてみる方が手っ取り早い。ウォーターフォール・モデルのような思考の一方向性が行き詰まりやすいことは、多くの設計者が知っている。デザインは書いているうちに進化していく。計画で最も重要なのは柔軟性ということになろうか。
本書は、Lispを柔軟性に最適な言語としながら、同時にLispユーザが堕落する可能性を指摘している。それは、言語とアプリの相性に敏感になり過ぎて、他の言語では柔軟性が得られないと思い込んでしまうことだ。なるほど、言語を宗教的に崇めると、逆に思考の柔軟性が奪われるというわけか。人類が絶対的な価値観に到達できないからには、万能で完璧な言語を編み出すことはできないだろう。誰もが英語かぶれになれば、人間社会の思考は英語的になる。言語は手段に過ぎないが、精神と結びつくとこれほど強力な武器もない。よって、個人の肌に合った言語を模索するしかあるまい。

2. 関数型プログラミング
関数型プログラミングが抽象化の可能性を大きくするのは、関数型を返り値とすることができ、関数型を引数に渡せるという特徴があるからであろうか。だから、無理やり一行に収められる。暗号文っぽくなるけど。関数がデータオブジェクトになりうるからには、オブジェクトはそれを呼び出す方法も提供される。Lispでは、それをapply関数が担うようだ。定義した関数をオブジェクトに対応させるために通常 #'オペレートを使うという。

 > (apply #'(lambda (x y) (+ x y)) '(1 2))

apply関数は、引数にリストを渡している。これが気に入らなければ、funcallを使えばいい。
 > (funcall #'+ 1 2)

「関数プログラミングとは、副作用ではなく、値を返すことで動作するプログラムを書くことだ。」
関数の基本的な思想は、副作用を期待するのではなく、返り値のためにあると考えるという。そして、引数に変更を加える関数を「破壊的」と呼び、意識的に区別される。普通のプログラミング言語では返り値は基本的に一つであろう。多値を返す場合はポインタで参照することになる。これが副作用を使う理由になる。破壊的にしたくなければ、ポインタを入力用と出力用で分けるといった面倒なことをやる。
一方、Lispはリスト型データ構造をしているので、もともと返り値に多値が想定されている。しかも、破壊的思想を避ける方向にあるという。尚、「多値」という言葉が使われるが、ここでは集合体のようなデータ構造を意味し、論理学的な多値と意味が違うので注意されたし。
また、関数型プログラミングは命令型プログラミングの裏返しだという。
「関数型プログラムでは、それが欲しがるものを求める。命令型プログラムでは、何をすべきかの指示を求める。」
自分で目的を考えるか、指示されないと動けないとの違いか?まるで現代社会を皮肉っているような。ただ、Lispにだって命令型のように書くことができる。それが幸か不幸かは別にして。
関数型では、一般的に初期値を与えない変数を書く習慣がないという。それだけでも危険度は違う。命令型では、初期値のない変数を書くのは普通に行われる。初期値を与えるように努力したところで、抜けてもエラーが起こるわけでもない。だが、Lispでは問題が起こるという。関数型で最初にトラブることは、命令型では最後にトラブると指摘している。関数の呼び出しは、その呼び出し自身が支配するオブジェクトを完全に書き換えることができるという。
「関数呼び出しは、返り値として受け取るオブジェクトを支配するが、引数として渡されるオブジェクトを支配しない。」
これがLispの慣習だという。ここでは副作用を持つ関数を作ってはならないと言っているのではない。そういう習慣がないというだけで、必要ならば意識して作るということだ。破壊的な関数がトラブルの元になりやすいのも事実で、破壊的にしたければ、setqなどで確実に明示すればいい。

3. マクロ
「マクロ定義とは実質的にLispコードを生成する関数だ - つまりプログラムを書くプログラムだ。」
Lispコードがコンパイルされる時、パーサがソースを読んで出力をコンパイラに送る。パーサの出力は、Lispのオブジェクトのリストから成るという。
驚くのは次だ!なんとマクロはパーサとコンパイラの間の中間形式を操作できるというのだ。コンパイラが読む情報を書き換えられるということは、コンパイラを書き換えられるのと同じではないか。マクロを展開するプログラム自身がマクロであってもいいわけだ。Lispの正体とはマクロ言語なのか?なんとも自己矛盾に陥りそうな再帰的仕組みにも映る。だから、再帰的アルゴリズムと相性がいいのか?多くのプログラミング言語でマクロ機能は搭載されるが、これはマクロの概念を超越していそうだ。実際、Lispのマクロは式を返すし、関数のように振舞う。
構造化プログラミングの推進者は、マクロを避ける傾向にあるという。それは、マクロがどこででも使われることと、その不可視性にあろうか。そういえば、C言語を導入した頃、マクロよりも構文を強く意識するようになり、まず関数で実装することを考えるような気がする。実際、ハウツウ本の例題が関数の実装で溢れている。関数とマクロの使い方が違うとなれば、分けて管理したくもなる。
だが、その区別がなくなりメモリ消費などの制約から解放されるとなれば、話は変わる。とはいえ、マクロにだって欠点が少なからずある。気になるのは、単に展開される仕組みなだけに、再帰的処理では自己矛盾を引き起こすことと、変数の束縛である。関数はレキシカルな領域に独自の世界を作るが、マクロは展開されるだけなので呼び出し側の環境を破壊する恐れがある。本書は、マクロを使って再帰的処理の書き方も紹介してくれるが、そこまでしなくても...変数の束縛では、letやprogなどの特殊形式を用いれば、恐れるほどではない。

4. 継続
継続とは、動作中のプログラムを凍結すること。Lispには、プログラムの状態を保持し、後に再開できる能力があるという。デバッグのための拡張機能が、この古き言語に既にあったというのか。
Schemeが、Common Lispと大きく異なる点の一つに、継続を明示的にサポートする機能があるそうな。Schemeでは、継続は関数と同格のファーストクラスオブジェクトで、クロージャの一般化と解釈できるという。ここでいうクロージャとは、関数とそれが生成された時点で見えていたレキシカル変数へのポインタをまとめたもの。
もしかして、継続の実装はガベージコレクションと同格なのか?などと想像してしまう。具体的には、call-with-current-continueation という組み込みオペレータで継続にアクセスできるらしい。

 (call-with-current-continueation
   (lambda (cc)
  ...))

関数と同格だから、どこにでも埋め込めそう。パフォーマンスも落ちるんだろうなぁ...

5. 非決定性アルゴリズム
日常生活における非決定性とは、ごく自然体である。ほとんど目的もなく気まぐれで行動しているのだから。これぞ人工知能の世界か。尚、Lisp開発者のマッカーシー先生は、「人口知能」という言葉の提唱者でも広く知られる。1980年代、AIブームが起こった。その代表的言語といえば、Prologであろうか。大学のゼミでも専攻している奴らがいた。もっともソフトグループと称しながら、ソフトボールに励んでいたようだが...
本書は、埋め込み言語としてPrologの実装例が紹介される。しかし、プログラムというものは目的意識から生じるものだ。非決定性という不確実性にどう立ち向かうのか?そのアルゴリズムは極めて単純で、その基本機能は、選択と失敗、そして未来計算で抽象化される。具体的には、chooseとfail、あるいはcutというオペレータの実装だ。そして、失敗と判断された経験の蓄積情報のデータ構造が鍵を握る。その処理は、蓄積情報が繰り返し検索され、パターンマッチングとその再帰的処理が根幹となることが想像できる。まさにLispの得意技か。データのツリー構造がパターンマッチングと適合することも味合わせてくれる。だが、経験が多く蓄積されるほど、判断に要する処理時間も長くなり、実用性から遠ざかるだろう。そこで、未来計算をいかに合理的に行うかが問題となる。経路検索を合理化するならば、情報はある程度まとめたい。プログラム的にはメモリを解放したい。では、どのタイミングで情報を捨てるのか?これは確率的な問題であり、用途に応じて決定されることになろう。つまり、cutとは「直感」の実装なのか?人間の思考なんて二分岐の繰り返しであって、その要素は、選択と後悔、そして未来への期待ぐらいなものか。

6. CLOS (Common Lisp Object System)
Common Lispには、オブジェクト指向プログラムを書くためのオペレータが揃っているという。それが、CLOSだ。もともとLispには、オブジェクトの属性でカプセル化の性質があり、ポリモーフィズムも、親から属性とメソッドを継承する性質も備わっているという。なのでLispをオブジェクト指向言語だと説く風潮があるそうな。その時代に名前がなかっただけのことか?
CLOSは、素のLispにオブジェクト指向の流れを組み込んで、形を整えたものだという。ただ、多重継承となると厄介なようだ。オブジェクト指向でも多重継承は混乱の元となる。
本書は、オブジェクト指向言語Lispを強調するために、わざわざCLOSを使わずにオブジェクト指向の実装例を披露してくれる。だが、酔っ払いは素直にCLOSに目を奪われる。
クラスの定義にdefclass、インスタンス生成にmake-instanceを使う。インスタンス変数やメソッドに相当するものにスロットがあるが、CLOSでは、スロットとメソッドを区別するようだ。defclassでスロットをセットで宣言し、メソッド定義にはdefmethodを用いる。なるほど、まったく違和感がない。

 -- GNU CLISP 2.48 での実行例 --
 :accessor は、スロットへのアクセスメソッド
 :initform は、初期値の指定
 :initarg は、引数シンボルの指定

 [1]> (defclass circle ()
        ((radius :accessor circle-radius :initform 1 :initarg :radius)
          (center :accessor circle-center :initform '(1 . 1) :initarg :center)))
 [2]> (defmethod area ((c circle))
        (* pi (expt (circle-radius c) 2)))
 [3]> (defmethod move ((c circle) dx dy)
        (incf (car (circle-center c)) dx)
        (incf (cdr (circle-center c)) dy)
        (circle-center c))
 [4]> (setf ins_circle (make-instance 'circle :radius 2 :center '(2 . 2)))
 [5]> (area ins_circle)
  12.566370614359172954L0
 [6]> (move ins_circle 2 3)
  (4 . 5)

==== ちょっと気になる技をメモしておく ====
1. 複数の返り値を受け取る方法
multiple-value-bind を使うと、複数の返り値を受け取ることができるという。

 > (multiple-value-bind (int frac) (truncate 26.21875) (list int frac))
 (26 0.21875)

2. コンパイルの過激なテクニック
Lispの関数は、個々でもファイル単位でもコンパイルできるという。必要に応じて関数を個別にコンパイルできるというのだ。λ式ですら。こんな過激な行為はやらないだろうけど、ちょっと感動してしまう。

 > (compile 'bar '(lambda (x) (+ x 2)))

3. ダイナミックスコープ
Lispの特徴として、ちょっと気になるのにダイナミックスコープがある。それは、前記事に「初めての人のためのLISP」でも取り上げた。だが、本書の印象はちょっと違う。
Lispコミュニティでは、ダイナミックスコープを廃止する傾向にあるようだ。Common Lispでは、普通はレキシカルスコープになるらしい。クロージャを実現するには、関数と変数束縛がセットになっている必要がある。Common Lispでもクロージャが浸透していると言ってくれる。これは安心させてくる。前記事は、古典的な流れを紹介していたのかもしれない。
また、マクロで弱点になる変数捕捉の対策として、with-gensymsという便利なマクロを紹介してくれる。その実装まで記されるが、既に組み込まれているようだ。ただし、clispとCommon Lispでは仕様が違うみたい。
 Common Lisp : (defmacro with-gensyms (syms &body body) ...)
 clisp : (defmacro with-gensyms (prefix syms &body body) ...)

4. 末尾再帰のテクニック
再帰関数で関数呼び出しの後に行うべき作業が残っていない場合、すなわち、再帰呼び出しの値が即座に返される場合の関数を末尾再帰と呼ぶそうな。再帰関数でよくやるのが、再帰呼び出しの後、何か処理をして値を返すといったことである。しかし、Common Lispコンパイラは、末尾再帰の関数をループに変換するので、末尾再帰を使うのが望ましいという。これでパフォーマンスも向上しそうな予感がする。現在のCommon Lispコンパイラは、C言語と同等かそれ以上の速いコードが得られるそうな。

5. SchemeとCommon Lispの相違点
  1. Common Lispが、symbol-valueとsymbol-functionを区別するのに対して、Schemeは区別しない。Schemeでは、変数は関数でもオブジェクトでもいいので、#'やfuncallが必要ない。
  2. Schemeの名前空間は一つ。だから、代入オペレータが個別にdefunやsetqのように存在しなくていい。代わりに、definとset!がある。グローバル変数は、definで定義しないと、set!で値を設定できない。
  3. Schemeでは、関数はdefinで定義される。defvarだけでなくdefunの役割もある。
  4. Common Lispでは関数の引数は左から順に評価するが、Schemeでは評価順は意図的に未定義。
  5. Schemeでは、tとnil の代わりに、#tと#fがある。
  6. condやcaseでデフォルト節は、Common Lispではtを使うのに、Schemeは、elseを使う。
  7. いくつかの組み込みオペレータの名前が違う。conspは、pair?、nullは、null?、mapcar は、ほぼmapに対応。ちなみに、Lispでは判定文の末尾にpを付ける慣習があるらしいが、「初めての人のためのLISP」では、Schemeのような新参者はpの代わりに?を使うと書かれていた。
...ちょうど目の前にGuileがあるので触れてみたが、道は遠い!

6. メソッドの結合
CLOSでは、基本メソッドと補助メソッドで区別している。基本メソッドとは、普通にユーザが定義するメソッドのこと。補助メソッドには、before, after, around がある。なんとなく、awkのBEGIN ENDの構文に似ているような。

例題)
「Perhaps ... in some sense」の中に任意の文字列を埋め込む。
「Does the King believe that...」の後ろの任意の文字列を埋め込んで、yes/noで答える。
----------------------------------------------------------
#! /usr/bin/clisp

(defclass speaker nil nil)
(defmethod speak ((s speaker) string)
  (format t "~A" string))

(defclass intellectual (speaker) nil)
(defmethod speak :before ((i intellectual) string)
  (princ "Perhaps "))
(defmethod speak :after ((i intellectual) string)
  (princ " in some sense") (terpri))

(defclass courtier (speaker) nil)
(defmethod speak :around ((c courtier) string)
  (format t "Does the King believe that ~A? " string)
  (if (eq (read) 'yes)
    (if (next-method-p) (call-next-method))
    (format t "Indeed, it is a preposterous idea.~%"))
  'bow)

;(speak (make-instance 'intellectual) "life is not what it used to be")
(setf ins_intellectual (make-instance 'intellectual))
(speak ins_intellectual "life is not what it used to be")

;(speak (make-instance 'courtier) "kings will last")
(setf ins_courtier (make-instance 'courtier))
(speak ins_courtier "kings will last")
----------------------------------------------------------
まず、aroundメソッドを評価し、その中で、next-method-p と、call-next-method が評価される。続いて、beforeメソッド、基本メソッド、afterメソッドの順に評価される。関数の返り値は、aroundメソッドの返り値となる。一番外側にaroundメソッドの殻があって、その中にbeforeとafterメソッドがあって、核の部分に基本メソッドがあるような三重構造のイメージか。これを「メソッドの結合」と呼ぶそうな。なかなかおもしろい機能だ。対話式プログラムを書く時に使えそう。
また、あるクラスにおいて、すべての基本メソッドの返り値の和を求める例が紹介される。ほぉぉ...

2011-11-20

"初めての人のためのLISP[増補改訂版]" 竹内郁雄 著

先月(2011年10月)スティーブ・ジョブズが亡くなって、世間の話題をさらった感があるが、同月に言語界の巨匠が亡くなって、それなりに業界を賑わしている。C言語の開発者デニス・リッチーと、Lispの考案者ジョン・マッカーシーである。カーニハンとリッチー共著の「THE C PROGRAMMING LANGUAGE」(原書)が、本棚に懐かしく並ぶ。
さてLispだが、ずーっと前から触れてみたいと考え、ようやく今年になって少し触れてみた。ポール・グレアム氏の著書「ハッカーと画家」の影響である。そこには、Lispを学べば実際にLispプログラムを作ることがなくても良いプログラマになれると熱く語られていた。だが、いまいち踏み切れない。いかんせん他のプログラミング言語と見た目が違う。S式とかいうヘンテコな宣教師が「カッコカッコ...コッカコッカ」と呪文を唱えれば、カッコの奥からletとかいう控えめな教職者がlambdaとかいう名もない浮浪者に見返り(返り値)をねだってやがる。鬱陶しい奴らだ。今日ではプログラミング言語も多様化しているし、わざわざこの古い言語に立ち返らなくても...という意識がどこかにある。プログラマでもないし。
そんなある日、本屋を散歩していると、一つの宣伝文句に目が留まる。
「道はnilを生ず。nilはアトムを生じ、アトムはS式を生じ、S式は万物を生ず。」
これは、老子の言葉「道は一を生ず。一は二を生じ、二は三を生じ、三は万物を生ず。」をもじっている。nil(ニル)とは、煮ても焼いても食えないやつだ。それは一般的なプログラミング言語のnullに相当し、空っぽを意味する。哲学風に言えば、無形化したもの、空虚なもの、実体を失ったもの、とでも言ってやるか。つまり、無から実が生じると言っているわけだ。孫子の兵法の基本原理「虚実の理」を匂わせれば、泥酔者はイチコロよ!

人間社会が仮想化へ邁進すれば、人間の価値観までも実体から乖離していく。ものづくりの世界では、あらゆるハードウェアがソフトウェア化し、いまや何に価値が生じるかも想像できない。そして、自己の実存にすら確信が持てなくなり、何にすがって生きればいいのかも難しくなる。高度な利便性と溢れる情報量が人々を惑わせ、無形化した何かに恐怖する羽目になろうとは。精神は実体である肉体から離れていく。まるで現実逃避するかのように。いや、仮想化社会だからこそ、逆に精神の内に見出す実体的な何かが必要なのかもしれん。実際、周囲の若い技術者たちには哲学的な観点からシステム思想を考える人が増えてきた。その一方で、システム思想に適合しない流用資産を持ち込んで、開発期間が短縮できるなどという夢想を押し付けるオヤジたちにうんざりする。まさにLispは、データの本質とは何か?とデータ構造の観点から哲学的実体を問うているような気がする。

かつて、プログラマはコードの書き方にエレガントさを感じ、そこに生き甲斐を求めてきた。今日では、データ構造のエレガントさがコード効率を高める。おいらは、データ型の宣言が厳格なものを好む傾向がある。昔は、適度に厳格な仕様がなかったからだ。近年の動的言語では、型宣言がそこそこ緩やかで、ダックタイピング的な特徴があるのはありがたい。
こうして振り返ってみると、無意識にデータとコードを区別して思考している。例えば、関数の構文では、関数本体と引数を区別している。むかーし、メモリ管理方式にセグメントという概念があり、コードセグメント、データセグメント、スタックセグメントで分けていた。おまけにエクストラセグメントなんてものもあったけか。こうした時代に生きた人間には、コードとデータを分けて思考する慣習がどこかに残っているかもしれない。
しかし、だ。Lispは、もっと古い時代から存在するにもかかわらず、プログラムとデータを区別しない。Program as data !これは、いかに実装されるかを想像してみれば当たり前のことだけど。プログラムだろうがデータだろうが、メモリに格納された状態は「アドレス + データ」という単純な構造をしている。関数をcallしたところで、関数の実体が存在するポインタを参照するだけのこと。関数の中身の逐次処理は、順序付きのデータコンテナで構成されたリスト型データと捉えることができる。引数では、値そのものを格納するか、値の存在するポインタを格納するかの違いがあっても、同じくリスト型で抽象化できる。ちょっと視点を変えて、関数が返す値はデータなのだから、関数自体をデータの一種と捉えても不都合はない。データにしても、データそのものを返すquote関数の結果と捉えれば同じく抽象化できる。
そして、リスト型データを配列風にカッコで表現すれば、関数も引数と同列にカッコの中に含まれ、データの多重構造は必然的にカッコの多重記述になる。なるほど、S式はLispポインタに他ならないというわけか。カッコカッコ...コッカコッカという呪文そのものが、リスト型データの合理性を表しているということか。Lispはよく関数型言語と言われるが、その特徴はリスト型データ構造の方がはるかに本質的なのかもしれない。
...と結論づけるのは浅はかで、別の書籍を読むと、実は命令型プログラムの裏返しとして重要な意味があるらしい。それは次回扱うとして、今宵はリスト型を味わうことに主眼を置くとしよう。理屈が見えてくれば、呪文への抵抗感が薄れていく。ありがたや!ありがたや!

本書は、プログラムとデータが相互に立場を変え得ることが、フォン・ノイマン型アーキテクチャの本質だと主張する。その思考は機械語的ですらある。なるほど、Lispはハードウェアと相性が良さそうだ。実際に、機械語でどのように振る舞うか想像しながらプログラムを書く人も少なくなかろう。特に、組み込み系ではそういう傾向が強い。
余談だが、電子回路設計では、ソフトウェア化が進みハードウェア記述言語(HDL)を用いる。そして、更なるシステム設計の効率化を進め、C言語系と連携した上流設計を目指す。ただ、昔からハード屋さんがソフトウェア化を叫べば、やたらとC言語化するものだと考えがちだ。特にC++系を崇める風潮がある。動作合成ツールでは、ひたすらC言語系を用いて動作レベルを記述しようと躍起になる。おまけに、回路の知識がまったくない人に、"Hello world !"プログラムが書ければ回路設計ができると勘違いさせて、現場を混乱させる。
その一方で、システム業界では言語の多様化が進み、C言語系にこだわる事例が減っている。そもそもC言語とHDLの相性がいいのかも疑問だ。Lispの方がはるかにHDLと相性がいいのではないか、と思う今日この頃であった。

1. 動的束縛の言語
「Lispはプログラムの実行時まで呼び出すべき変数のデータ型や関数の実体が決まらない動的束縛の言語である。」
動的束縛は、解釈実行型かつ program as data であることとほぼ同義だという。コンパイラでは速度性能の観点から、プログラム形式に静的な宣言を取り込もうとする傾向がある。そうなると、Lispのような動的言語は時代遅れとされるかもしれない。だが、ハードウェア性能が向上すると、その場で解釈しながら実行できる言語がもてはやされる。そういえば、インタプリタという用語をとんと聞かなくなった。実行ニュアンスがちょっと違うかなぁ。
また、ソフトウェアが大規模化すれば、トップダウンで要求仕様をしっかり決めないとプログラムが書けないという風潮がある。しかし、ボトムアップでプロトタイプをすぐに書けるというのは大きな魅力だ。トップダウンで構成された大規模なプログラムを、アップデートすることは面倒である。近年、システムを停止しないままアップデートすることが求められ、プログラムを動的に管理する必要がある。
ところで、動的といえば、Lisp言語の歴史そのものがまさに動的であるという。ようやく、Common Lisp と Scheme の二大方言に落ち着きつつあるようだが、永久に動的であり続けるのかもしれない。ちなみに、ガベージ・コレクションを最初に実装したのが、Lisp1.5 だそうな。現在では、Java, Python, Rubyなど多くの言語システムで実装されている。いわばゴミ集めの機能だが、これを言語システムで持つ必要があるのは、動的言語の宿命であろうか。

2. S式とM式
言語の最大の目的は、意味論的な機能を果たすことであろう。自然言語の優位性は、人間の感情を取り込むところにある。一方、コンピュータでは、感情を排除し一義的に処理する能力が求められる。しかも、コンパクトに記述するとなれば、そのほとんどの機能は数学的な表現となろう。
初期のプログラムは、関数表記に近いM式(Meta Expression)で書くものとされたらしい。M式とは、S式(Symbolic Expression)を引数として扱う表記で、例えばこんな感じ。

 length[x] = [null[x] → 0; t → add1[length[cdr[x]]]]

んー、見る気がしない!
もともとS式は、データやプログラムの内部表現を書くための低レベルの表記法だったという。例えばバイナリダンプのような。やがてM式は廃れるが、カッコだらけのS式が一般受けしなかったのは言うまでもない。
「Lisp嫌いは、S式をLispのよい特徴を覆い隠す必要悪と考えているらしい。」
S式は前置記法によく適合するだけでなく、言語意味論を簡単に乗せることができるという。それは二つのデータ、すなわちリストとアトムで構成される。リストはデータのペアを表わし、アトムはその素材である数字や文字列を表す。アトムはこれ以上分解できない物質の原子のようなもので、リストはアトムのペアで構成される分子のようなものというわけ。リストの表現は、アトムを羅列してカッコでくくったもので、コンマなどの区切りはない。リストの基本は二進木構造にあり、並べられたアトムはその順番に意味を持つ。そして、S式だけが yes か no を答える。もっとも、yesは T(true)、noは nil となる。言語学的には、必要最小限の情報量を与えているということはできそうだ。人間の判断力の根幹とは、まさに素材と選択肢、つまりはアトムとリストにあるのではないか!ちと大袈裟か。

3. ちょいとリスト型を味わう!
Lispの発明者マッカーシー先生は、リストの一番目の要素を、car と呼んだそうな。そして、1個以上の要素を持つリストから car を除いた残りのリストを cdr と呼んだそうな。
carとは、Contents of the Address part of Register number の略、
cdrとは、Contents of the Decrement part of Register number の略。そんなウンチクはどうでもええ。ちなみに、car を head 、cdr を tail と呼ぶ人もいるそうな。
それでは、ちょうど目の前に、GNU CLISP 2.48があるので遊んでみよう!
car関数を評価すると...

 (car (goo choky pah))
 *** - EVAL: undefined function GOO
 The following restarts are available:
 USE-VALUE :R1 Input a value to be used instead of (FDEFINITION 'GOO).
 RETRY :R2 Retry
 STORE-VALUE :R3 Input a new value for (FDEFINITION 'GOO).
 ABORT :R4 Abort main loop

goo が評価できる関数ならば答えが返ってくるのだろうが、そうは問屋が卸さない。関数の引数が関数であってもいいのだ。
 (car '(goo choky pah))
と引用符を付けると、リスト(goo choky pah) に対するcar が評価されて、gooが返ってくる。んー、引用符の使い方に意義があるのかぁ。
引用符を用いるのは記法上の便法で、Lispがデータの皮を食ってしまうという。なんじゃそりゃ!
 (+ 1 2 3 4 5) は、 (+ '1 '2 '3 '4 '5) と書いても同じ。
 (car '(a b c)) を評価すると、aを返す。
 (cdr '(a b c)) を評価すると、(b c)を返す。
リストを作る時は、cons関数を使う。
 (cons 'x '(y z)) を評価すると、(x y z)を返す。cons関数は carや cdr の逆関数と解釈できそうだ。
アトムの判定には、atom関数を使う。
 (atom '(x y)) を評価すると、nilを返す。アトムではなくリストというわけか。
 (atom nil) を評価すると、Tを返す。nilはアトムというわけか。
また、辞書の語彙を増やすのに、set関数がある。
 (set 'A 'aho)
A と aho に引用符を付けて関数の引数と評価している。
よく見かけるのに、setq(set quote)という関数もどきがある。
 (setq A 'aho)
Aに引用符を付けずに関数の引数と評価させて、自動的にうまいことやっているわけか。尚、このような評価を特別扱いするものを、「特殊形式」と呼ぶらしい。
関数が数値や文字と同じようにアトムとして扱われるだけに、その評価も統一性がある。ただ、直観的に左側のアトムの評価が鍵を握っている。更に、第一引数に特殊な意味を持つ場合があることにも注意したい。感覚的には、他の言語では文法に注意するが、Lispではアトムの評価の順番に注意すればよさそうだ。
ちなみに、CLISPを終了する時も(exit) とカッコを付けないと終了しない。(quit)も同じ。
 (atom 'exit) を評価すると、Tを返す。コマンドもアトムというわけか。
これだけでもリスト型言語であることが味わえる。

4. 再帰的思考に威力あり!
ここで、リストの長さ(アトムの数)を求める関数を作ってみよう。

 (defun lengthc (x)
   (cond ((null x) 0)
     (t (1+ (lengthc (cdr x)))) ))

 (lengthc '(aa bb cc)) を評価すると、3を返す。

リストの長さは、空リストなら0、そうでなければcdrの長さに1を足していく。これが、Lisp風の再帰的思考だそうな。
これを通常のプログラム風に思考すると、次のようになる。
(1) カウンタ値をリセット。
(2) リストが空ならば、そのままカウンタ値を返す。
(3) xを元のx のcdrに置き換えてカウンタに1を足す。そして、(2)に戻る(loop)。
これをLispでも書けなくはない。

 (defun lengthd (x)
   (prog (count)
        (setq count 0)
  loop  (cond ((null x) (return count)))
        (setq x (cdr x))
        (setq count (1+ count))
        (go loop) ))

尚、Lispには、progという特殊形式が用意されていて、(prog(x y z)...)で、ローカル変数を宣言できる。loopから抜ける時の値は、returnで返す。
更に、do文を使えば軽快になる。

 (defun lengthe (x)
   (do ((count 0 (1+ count)))
     ((null x) count)
     (setq x (cdr x)) ))

こうして比較してみると、Lispは再帰的思考に威力を発揮することが見えてくる。しかし、昔から計算機的な思考は再帰法なんか使わずに、BasicやFortran風に goto, do, loop が主流であった。Lispの基本的な思考は再帰的であるために数学の匂いを強く感じさせ、これが敬遠される理由だったという。それだけではないだろうけど。再帰が深まるとリストの長さに比例したメモリを消費するが、従来のプログラム思考では、変数count だけの領域でいい。かつてはハードウェア資源に制約がある場合がほとんどだった。物理的な制約からも、再帰的な思考は避けられていた。そういえば、オブジェクト指向という言葉が登場したあたりからであろうか。gotoプログラム撲滅運動が始まった。単純な繰り返しならば、loopラベルで明記できるが、ラベルが乱立すれば、たちまちスパゲッティ状態になる。検証も思いっきりやりずらく、ブランチカバレッジを真面目に見ようものなら頭が痛い。ただ、人間の一般的な思考方法において、再帰的思考は馴染まないかもしれない。再帰だろうがloopだろうが、精神ってやつは自己循環論に陥りやすく、おまけに自己矛盾に悩みながら精神病を患うのは同じか。

5. lisp の核はコンパクト!
  1. nil、数、文字列は、評価するとそれ自身を返す。
  2. シンボルの評価値はその時点での環境によって決まる。
  3. シンボルの評価値は、第0要素を関数、第1要素以下を引数と見なし、左から順に評価する。ただし、次の、4. 5. を除いて。ちなみに、関数を引数リストに適用(apply)すると言うらしい。まさしく、apply関数はこれをやっている。
  4. リストの第0要素が次のものであった場合、第1要素以降をどう処理するかは、第0要素により異なる。quote, cond, setq, prog, progn, go, let, let*, if, do, do*, defun, defmacro, functionなどは、第1要素以降を闇雲に評価せず、引数の評価を各自がきめ細かくコントロールする。例えば、quoteは第1要素を評価しないでそのまま返す。
  5. リストの第0要素がマクロであった場合、第1要素以下を評価せずにマクロの本体に渡す。そして、マクロ本体が返してきた値をその場でもう一度評価する。
実は、4.の中の特殊形式にも、Common Lispではマクロとされるものがあるそうな。例えば、condやdoなど。

6. ちょいと気になるスコープルール
動的スコープが用意されているのにちょっと警戒する。これは言語仕様の根本的な問題となろう。動的スコープを野放しにすれば、他の言語派から迫害を受けるに違いない。そこで、しかるべき非局所的な変数に限るという意図があるという。letやdoは変数を束縛する機能を持っている。
確かに、システムの中で常識的な変数をグローバルに参照できる方が、効率が良い場合がある。変数を参照するだけのメッセージ関数を用意するのも面倒だ。
動的スコープの変数は、special変数と呼ばれ、非局所的に宣言して、*で囲む慣習があるそうな。例えば、*standard-input* といったもの。最初から動的スコープと分かっているやつは、宣言する必要もないらしい。静的スコープの良さは、分かりやすさを求めるというより、ミスを防ぐことを重点に置く。ミスを回避して分かりやすくなるのであれば、動的スコープもありか。実は名前空間が適度というのは非常にありがたい。ただ、適度というのがくせものだけど。いずれにせよ、自由が野放しにされるのは危険であろう。その意味で大人の言語と言えるかもしれない。
Common Lisp では、名前空間をシンボル・パッケージ、あるいは単にパッケージと呼ぶそうな。標準装備されているパッケージは、lisp, user, keyword, sysytem の4つだという。lisp にはcarやcondなど一般的に使われるシンボルが、user にはユーザ定義のシンボルが入っている。system にはLispの言語処理系が内部で使用するだけで一般公開されないシンボルが入っている。ほんで、残りがkeyword。
lisp:car に対して、ユーザが、user:car や keyword:car を作ってもいい。文脈がはっきりしていれば、パッケージ名は省略できる。ただし、keywordだけは特別扱いされ、例えば、keyword:direction は、:direction と書けるそうな。

7. prog と let
progは、4つの基本機能を統合した特殊形式だという。、
(1) ローカル変数を宣言する。
(2) goによって繰り返しや飛び越しを可能にする。
(3) 計算の途中でreturnで強制的に値を返す。
(4) 不定個の式を上から順に評価する。

(4)の機能は、progn という形式も用意されている。
 (progn 式1 式2 式3)
ただ、頻繁に複数式が用いられるので、progと書いてもprognと解釈されるのが一般的だという。
(4) だけなら、progn と書けば複数式が強調される。
(1) と(4) だけなら、letを使うとよい。変数宣言と式の逐次評価機能だけに的を絞ったのがletで、return不要で気分爽快!

8. Lispの得意な分野
Lispは、データ構造が配列や連想リストなどで構成されている場合に威力を発揮するであろう。すぐさま思い浮かべるのは、行列式などの数値演算や、画像処理などの空間処理を扱うような分野である。本書は、自然言語やプログラミング言語の言語処理、あるいはデータベースのような分野でも威力を発揮するとしている。
ちなみに、配列では、setqよりも抽象化されたsetfを使うのがよいという。Common Lispで推奨されるのは、setfだそうな。配列要素へのアクセスには、aref(array reference)が用意されている。
本書は、データ構造が伸び縮みする例題として、キューとスタックの実装を取り上げている。キュー(待ち行列)はFIFO構造、スタックはLIFO構造をしている。キューの制御例では、DeQ/EnQ、スタックの制御例では、Push/Popがお馴染みで、通信系の回路設計に携わると必ず登場する技術だ。
また、ツリー構造の例題として、Jpegなどの圧縮フォーマットで用いられるハフマン符号化を取り上げている。そういえば、むかーしFAX系の通信システムでハフマン符号の回路設計にも携わった。
...などと、Lispを初めて使うはずなのに、なにやら懐かしいものを感じる。これがデジャヴってやつか?

2011-11-13

"通信の数学的理論" Claude E. Shannon 著

情報理論の父と呼ばれるクロード・E・シャノン。コンピュータ工学や通信工学に携わる人で、この名を知らない人はモグリだろう。この業界の設計をやっているにもかかわらず、彼の書籍に触れたことがないのは面目ない!言い訳するなら、チューリングやノイマンに比べると、ちょっと地味な印象があるかなぁ...

1948年、シャノンは記念碑的論文「通信の数学的理論」を発表した。本書は、その論文にワレン・ウィーバーの解説文を付して刊行されたものである。シャノンが工学の分野に貢献したことは言うまでもないが、ウィーバーは一般的な情報としても抽象化できると指摘している。つまり、情報の本質である信憑性や意味性においても、この理論が適合できるというわけだ。確かに、シャノンが提唱する情報エントロピーの概念は、通信技術のみならず情報社会の哲学的意義にも影響を与えてきた。情報量といえば、単純にメッセージの長さで捉えがちであるが、シャノンは伝達における情報量を、選択肢の自由度あるいはあいまい度で定義した。情報量は、選択肢の数に依存するのではなく、選択肢の確率に依存するということである。いくつかの選択肢の確率が公平に近づけば、結果予測が困難となる。それは、選択する側から見れば自由度が拡がることを意味し、予測する側から見ればあいまい度が増すことを意味する。これが情報エントロピーの基本的な考え方である。
また、情報の誤りを是正するための冗長性は、伝送系の能力に依存するとした。これは、伝送系の能力を超える符号化は不可能ということを意味し、ひいては符号理論の意義を唱えていると言えよう。
情報理論は、情報伝達という観点から言語学や社会学との関わりも深い。いや、あらゆる学問において専門に特化した合理的な表記法が考案され、表現に関わるものすべて情報理論に関わると言っていい。実際、プログラムの逐次処理が分岐構造を基礎とし、あらゆるリスク管理や社会政策などが現象の確率と優先度によって構築されている。マスコミ報道や風評流布の類いが世間を惑わす原理も、基本的には誤り訂正やノイズの原理と同じである。この時、選択肢の確率は情報の信憑性と捉えることができるし、欺瞞や誤謬あるいは精神不安など、判断を歪ませるものすべてがノイズと捉えることができる。更に、伝送系の能力は解析能力に通ずるところがあり、能力を超えた情報量はむしろ有害となろう。情報は多すぎても少なすぎても混乱を招く。そして、情報理論には「知らぬが仏」の原理が働くというわけさ。

本書に示される通信システムのモデルは6つの要素で構成される。あのお馴染みのやつだ。
 「情報源 → 送信機 → 通信路 + 雑音源 → 受信機 → 受信者」
シャノンの思考には、基本的に「通信とは、本質的にデジタルである」というのがあるそうな。ここでいうデジタルとは、情報の離散的性質を意味する。コンピュータやインターネットなどで扱うデータはデジタル量であり、その周辺を取り巻く伝送路や記憶媒体には必ず誤り率を有する。この性質は自然法則として受け入れられ、今日のデジタル技術は標本化定理や符号理論によって支えられている。通信システムの保証は誤り訂正能力で決まり、通信路の限界はビットの概念を指標としている。
しかし、人間が認識する情報は、本来的に音声や映像といった連続性であり、極めてアナログ的である。人間は、現在の瞬間的現象に対して未来予測と過去の経験から認識能力を発揮する。つまり、線形性であることが望ましい。数学的に言えば、時間の関数とエネルギー分布として捉えることができる。本書は、このアナログ的な連続量を重ね合わせの原理で、関数の集合と関数のアンサンブルとして波動的に捉える。そして、原理的には連続情報も離散情報と同じ形で抽象化できると結論づけている。

1. ビットの概念と情報エントロピー
選択肢で最も単純な形は二者択一である。複数の選択肢は二択の多重化と考えればいい。二つの状態は、工学的には、回路の開閉、リレーの接点、トランジスタのオンオフなど電流が流れるか流れないかで実現でき、数学的には、0と1で符号化できる。したがって、選択動作を繰り返せば状態は2のべき乗で増加し、情報量を2を底とする対数で扱うと便利である。ジョン・W・テューキィは、2進数情報の単位として、binary digit を縮めた語「bit」を提案した。
ビットの概念では基本的にあらゆる状態が公平に扱われるが、現実には確率的に捉える必要がある。例えば、言語システムでは最初の単語に続く単語が文法的にある程度決まっている。次に続く状態の確率が高い場合は省略もできるが、逆に確率が低い場合は単語を増やしてでも明示する必要がある。これは伝送系にノイズが紛れる原理と似ていて、受信側は正確な情報を予測することになり、ノイズの確率過程を分析することになる。よく知られる確率過程には、現在の状態だけで予測できるようなマルコフ過程がある。例えば、コイン投げで表と裏の出る確率が5割で予測できるようなもの。あるいは、標本数を適当に増やすことによって予測できるようなエルゴード過程がある。例えば、世論調査のようなもの。これらには離散的な記号を続けて選ぶという原理がある。こうした確率的傾向による情報量の変化が符号理論の概念を生んだ。すなわち、情報量とは、情報の正確性やあいまい度といったエントロピー的な量であるということが言えよう。自由度が増せば、それだけ符号化も複雑になる。
実際のエントロピーとエントロピー最大値との比は、情報源の「相対エントロピー」と呼ばれるという。例えば、相対エントロピーが0.8だとすると、メッセージを構成する記号の選択に関して、情報源が80%の自由を有するということである。そして、1から相対エントロピーを引いた量が冗長度ということになる。
ちなみに、本書は英語の冗長度を約50%と推定している。ただし、8文字の文字列の統計的構造について調べたもので、実際の英語の冗長度はもう少し高いらしい。満足のいくクロスワードパズルを作るためには、言語が少なくとも50%の自由度、または相対エントロピーを有しなければならないという。自由度が少なければ、単純なパズルしか作れないからおもしろくないというわけだ。
しかし、工学と言語学では考え方に大きな違いがある。それは、情報の意味するもの、意図するものに関係なく、すべての情報に対して公平に扱うという難題に立ち向かうことになる。そして、情報の効率性から、可変長データなどのデータ構造自体にも工夫が必要となる。

2. 情報量
各状態がそれぞれ、P1, P2, ..., Pn の確率で選ばれるとすると、情報量Hは次のようになるという。

 H = -[ P1 log(P1) + P2 log(P2) + ... + Pn log(Pn) ] = -Σ(Pi log(Pi))

ここで、logの底は本質的にはなんでもいいのだろうが、デジタル量として扱うには底を2とすればいい。例えば、二つの確率(P1, P2)があるとすると、二つの確率が等しければ情報量Hは最大値となるが、二つの確率が偏れば情報量Hは小さくなる。
 H = - {1/2 log2(1/2) + 1/2 log2(1/2)} = 1
 H = - {1/4 log2(1/4) + 3/4 log2(3/4)} = 0.81128
社会的認識と照らしあわせれば、公平とは自由を意味し、選択を誘導するということは自由を迫害するということであろうか。だが、政治の世界では、平等と自由はすこぶる相性が悪い。

3. 伝送能力
通信路の容量は、記号の数ではなく情報量によって表され、それは伝達能力と言うことができる。そして、通信効率を高めるために符号理論がある。
ここで、ノイズが存在しないと仮定し、情報源からの信号をH(bit/s)、通信路の容量をC(bit/s)とすると、次の定理が導かれる。

「送信機が行う符号化法を適切なものにすることで、ほぼ C/H の平均伝送速度で通信路を通して記号を送ることができる。しかし、どんなに符号化を工夫しても、伝送速度が C/H を超えることは絶対にない。」

したがって、通信路の設計では、伝送速度の経済性と符号化時間の損失とのバランスをとること考え、C/H を指標としながら折り合いをつけることになる。更に、ノイズの存在が符号理論を複雑化させ、冗長度を増加させる。ただ、ノイズも確率として扱うことによって、情報の全体を相対エントロピーとして扱うことはできそうだ。
ここで、H(x)を情報源のエントロピーまたは情報量、H(y)を受信信号のエントロピーまたは情報量とする。そして、Hy(x)を受信信号が分かっている時の情報源の不確かさ、Hx(y)を送信信号が分かっている時の受信信号の不確かさ、とすると次式が成り立つという。

 H(x) - Hy(x) = H(y) - Hx(y)

この式で注目したいのは、情報の不確かさも重要な情報になるということである。例えば、ノイズフィルタを設計する時、ノイズ特性を強調して、その反転をフィルタ特性として用いることがある。逆の視点から眺めれば、ノイズ自体が貴重な情報源となりうるわけだ。
通信路の容量が意味するものは、有益な情報を伝送できる最大能力、あるいは最大転送速度ということになろうか。そして、符号効率は、有害な不確かさ、H(x) - C を上回る性能が求められることになる。H > C ならば符号化は不可能ということは明らかだが、これが符号理論の概念を根本的に支えている。したがって、符号能力は確率分布から計算されるエントロピーから得られ、符号の冗長性は誤り率とのトレードオフの関係にある。

4. 連続情報
これまでは記号や文字などの離散的な情報を扱ってきた。では、音楽や映像のようなエネルギーが連続的に変化するような情報については通信理論はどうなるのだろうか?拡張された理論は数学的に非常に複雑にならざるを得ないが、本質的なことは変わらないという。まず、連続情報は時間的変化をともなうので、その基本形は次のようになる。

 f(t) = sin (t + θ)

この時、正弦波か余弦波かは位相で抽象化できるのでどちらでもいい。むしろ連続で押し寄せる波と位相の関係が重要なのだ。連続情報では、この形の関数がほとんど無限に存在するという極めて複雑な事情がある。つまり、fk(t) = {f1(t), f2(t), ...} といった関数の集合体として扱わなければならないという絶望的な状況だ。よって、工学的には、周波数帯域を限定して有限体として捉え、離散基底に持ち込むのが現実的ということになろうか。この集合体の中で、位相のずれになんらかの法則性を見出すことができれば、基本関数の巡回性と見なして、ガロア理論的な思考も試せるかもしれない。複雑系をエネルギー分布として統計量で扱う思考は、社会学が風評や世論の変化を近似的に分析するのと似ている。つまり、群(群集)分析だ。
今、fk(t) (k = 1, 2, ..., n) の確率分布関数を p(x) = {P1(x), P2(x), ..., Pn(x)} とすると、連続分布のエントロピーは連続区間の積分で定義される。

 H = -∫p(x) log p(x) dx (ただし、積分区間は±無限)

この形は、離散情報と基本的に同じである。更に、連続信号の通信路の理論は、周波数帯における重ね合わせの原理で周波数スペクトラムとして扱い、通信機の平均電力Pで議論される。そして、シャノンが定義したホワイトノイズ電力をNとすると、周波数帯域幅Wでの通信路の最大容量Cを与える公式が導かれる。

 C = W log( (P + N)/N )

ここでも、logの底は本質的にはなんでもいいのだろう。この公式は、離散性から連続性に抽象度を高めたというよりは、現実的な解を示したという印象が残る。まさに、現実の世界を生きる工学という分野の醍醐味と言えよう。

2011-11-06

"ガロア理論入門" Emile Artin 著

線形代数と出会ったのは大学の初頭教育であろうか。落ちこぼれスプレーを浴びせかけられた、あの忌々しい記憶が蘇える。おまけに、この書が入門レベルというからイヤになる。
ところで、「線形」ってなんだ?学生時代から疑問を持ち続け、いまだ答えが見つからない。用語辞典をググれば、それなりの答えが氾濫するが、どれもしっくりとしない。連続体と関係がありそうなことや、写像関係が維持されそうなことは、なんとなく分かる。過去とのしがらみを持つもの、あるいは予測可能なもの、こうしたものは、すべて線形なのだろうか?そもそも人間は、過去、現在、未来の流れの中でしか認識能力を発揮できない。では逆に、非線形ってなんだ?カオスのような現象のことか?人間には予測できない、あるいは認識できない領域にあるということか?だとすると、人間の能力で、認識できる領域と認識できない領域を区別するとはどういうことか?認識能力の境界を認識する???...などと思考が自己循環を続けたままなのだ。本書はまさに自己循環論を語っているように思えてならない。

ガロア理論と言えば、体論や群論の世界である。それは代数学の延長上にあり、線形代数と集合論が結びついた世界とでも言おうか。代数学とは、その名が示す通り数を文字に置き換えて抽象化する学問である。その対象は数(かず)であり、それは自然数から始まった。だが、減算や除算を行うと、自然数の体系からはみだすという欠点を曝す。算術によって系が閉じられない現象は、数の概念を自然数、整数、有理数、実数、複素数へと拡張させてきた。そして、方程式を解きたいという欲望が、いっそう抽象度を高める。代数学は、結合法則や交換法則、あるいは単位元や逆元を持つか、といった性質を考察する方向へと舵をとるのだった。連立方程式は、変数の数だけ方程式の数が存在しなければ解けない。その係数の羅列をベクトル空間や行列式で捉えた時、多次元の概念と結びつく。こうして線形代数が構築されてきた。そこには、非可換な世界が広がる。つまり、交換法則すら成り立たないものまで抽象化したのだ。この現象が意味するものとは、そぅ、物事を掛ける(賭ける)順番、やる順番が違うと、おのずと結果も変わってくるということである。したがって、酔っ払いの目には、非可換性は非可逆性、つまりはエントロピーに通ずるものを感じる。抽象化の波はまだまだおさまらない。体や群が登場すると、ベクトル空間や集合体までも呑み込んだ。もはや数の概念を超越している。四則演算に支配される構造ならば、なんでもありだ。
本書には、拡大体、分解体、部分体、可換群(アーベル群)、巡回群、可解群など、頭痛のしそうな用語で埋め尽くされる。そして、累乗根を考察しながら円周等分多項式の既約性を証明し、方程式を解くための必要十分条件に迫る。その結果、5次以上の方程式の累乗根はない、という「アーベルの定理」が導かれる。更に、幾何学の問題「コンパスと定規による作図」に対する代数学的解釈が示される。
ここにはガロア群の正体なるものが明かされるわけだが、一度や二度読んだぐらいでは頭の中に入ってこない。ほとんどの定理を鵜呑みする羽目になり、酒飲みの域に達っするには程遠い...

物事の本質を解析しようとすれば、それを構成する基本成分に分解してみようと試みるだろう。自然数では素因数分解し、方程式では既約多項式に因数分解する。そこで問題になるのが、どこまで純粋な要素に分解できるか?どこまで既約となりうるか?である。ちょうど物理学が、どこまで素粒子なのか?を問うかのように...
例えば、この方程式は、実数系ではこれ以上因数分解できない。
 f(x) = x^2 + 1
だが、複素数系であれば、更に因数分解できる。
 f(x) = (x + i)(x - i)
つまり、扱う系によって既約の定義も変わってくるわけだ。そして、四則演算の可能な系における最も抽象度の高い既約とは何か?が問われることになる。その抽象レベルで語った時、はじめて方程式を解くための必要十分条件が見えてくる。しかし、体論や群論を扱う才能豊かな人たちは、そんな定義は暗黙のうちに議論を進めやがる。数学者たちには、共通の抽象認識といったものが見えるのだろうか?
ところで、四則演算を習ったのは小学校であった。第五の演算とも言われるモジュロ演算を学んだのは、それよりずっと先で高校だったか?大学だったか?割った余りという観点から除算の一部と言えなくもないが、その本質はむしろ巡回性にあるだろう。日常を支配する暦は永遠に一週間を繰り返す。人間は10進数で物事を考えながら金の計算に執心し、商品の値段が桁上がりした途端に目くじらを立てる。コンピュータは2進数で四則演算を抽象化し、数字列をシフトするだけで乗算や除算をこなす。これらすべて巡回性で説明できるのだ。ちなみに、コンピュータ技術者は16進数で年齢を誤魔化すらしいが、モジュロ演算が人類の永遠の夢を叶えるだろう。
さらに、モジュロ演算は、暗号アルゴリズムや符号理論などで大活躍している。解析学で登場するフーリエ変換も、数学の直交性を利用した巡回性の成分で分解する。いずれにせよ、巡回範囲は、それぞれの世界で合理的に、あるいは都合よく設定されているに過ぎない。
では、巡回性を抽象化するとどうなるのか?本書では、自己同型群が巡回群になるという議論が盛んに行われる。人間社会で四則演算が馴染むというのは特異現象であって、宇宙法則では巡回演算の方がはるかに自然的なのかもしれない。もしかして、ガロア理論は抽象化の果てに自己循環論があると主張しているのか?

1. 体
体とは、ひとことで言えば、乗法と加法の二つの演算が定義されている集合である。これだけなら単純だが、その概念は意外とイメージしづらい。本書は、初心者に「複素数体の部分集合で、四則で閉じたものをモデルにして読みはじめてもよい」と助言してくれる。ということで、複素数系のベクトル空間を思い浮かべてみよう。
実数系も体の一つと言えそうだが、異質な点が二つあるという。それは、乗法の可換性を仮定しないことと、有限個の要素からなる場合もあるということである。非可換性については行列式でイメージできる。すなわち、乗法において交換法則が成り立たないということだ。有限個の要素というのがイメージしずらいが、先へ進むと見えてくる。線形従属や線形独立によって決定される次元(行列の階数)との関係を意識する必要があるが、やがてモジュロ演算のような巡回性を想定することになる。この有限体というあたりにガロア体の正体が隠されていそうだ。
そして、体とは、正確にはこういうことらしい。

「体とは、まず加法についてのアーベル群をなし、次に零を除いた残りが乗法について群をなし、しかも2つの群演算が分配法則によって結びつけられている集合である。」

アーベル群とは、可換群のこと。ちなみに、乗法が可換であるような体を「可換体」と呼び、可換性が成り立たない場合を「斜体」と呼ぶそうな。アーベルは可換群だけを想定したようだが、ガロアは非可換群もあると考えたようだ。

2. 拡大体と分解体
体Eの部分集合Kが、Eで定義された加法と乗法で体をなす時、EをKの「拡大体」と呼び K ⊂ E で表す。また、拡大体の次数を (E/K) で表す。そして、三つの体において K ⊂ B ⊂ E ならば、(E/K) = (B/K)(E/B) が成り立つという。Bを「中間体」と呼ぶ。
更に、K ⊂ E の時、Kの代数的なEの要素αの既約多項式 f(x) を定義して観察すると、おもしろい性質がある。

「(K(α)/K) = deg f(x) = nであり、K(α)はK上の 1, α, α^2, ..., α^(n-1) によって生成される」
ただし、degは多項式の次数を表す。

ここには、拡大体や部分体と多項式との重要な関係があるというわけか。つまり、体における要素の関係を考察するには、多項式、特に同型写像を考察すればいいということらしい。また、K内の多項式 f(x) の根をすべてKに付加した体を、f(x) の「分解体」と呼んでいる。要素が増えるのに分解体なの?既に拡大体と分解体の言葉の綾で混乱している。...挫折の予感か?

3. 群の指標
本書は、体の定義は明示されるのに、群となると途端に難しくなる。それも定義ではなく指標として示される。

「体Eから体E'の中への相異なるn個の同型写像 σ1, σ2, ..., σn があり、Eの部分体Kの要素 a に対してはつねに σ1(a) = σ2(a) = ... = σn(a) であるとき、不等式(E/K) ≧ n がなりたつ」

特に、Kのすべての要素を不変にするEの自己同型写像の全体が群になるという。これが群の指標ということらしい。
ここで、「不変」という言葉が気になる。恒等写像を仮定すると、Eの要素 a がそのまま a に対応するのだから、自己同型写像になるのは自然だろう。
σi(a) = σ1(a) = a (ただし、i = 0, 1, ..., n) となるところから、不変という名が付けられたという。おまけに、恒等写像でもないのに、Eの部分体となる σ1, σ2, ..., σn の要素の集合を「不変体」と呼んでいる。ちょっと無理がないか?
更に、乗法群における自己同型写像の条件が示される。
例えば、乗法群G、体Kとすると、GからKへの写像σが、Gの任意の要素α, βに対して以下を満たすとしている。

 σ(αβ) = σ(α)σ(β) (ただし、Gの任意の要素aに対して、σ(a) ≠ 0)

自己同型写像が群であるというのは分かるような気がする。だが、それで体に対して抽象度は上がっているのか?それは、次の正規拡大体で薄っすらと見えてくる。...そんな気がするだけかも。

4. 正規拡大体
群の指標を不変体と絡ませて進化させる。

「σ1, σ2, ..., σn が体Eの自己同型写像の群Gをつくるとき、Kをそれに関する不変体とすれば (E/K) = n である。」

体Kの拡大体Eがあり、KがEの自己同型写像をつくるような有限群Gの不変体になっている時、「正規拡大体」と呼んでいる。有限群GはKの自己同型群ということか。ガロア理論の基本定理とは、「正規拡大体の中間体と自己同型群の部分群との間に一対一の対応がある」ということらしい。体の拡大を群に結びつけるという意味では、群の方が抽象度が高そうだが、これって自己循環に陥っていないか?
また、EがKの正規拡大体であるための条件は、EがK内のある分離多項式の分解体になっていることだという。自己同型写像はその根の対応によって定まるという。
ここで示される例題は分かりやすい。

Kを有理数体とし、Eを多項式 x^4 - 2 の分解体とする。
この多項式は有理数体では解を持たないが、複素数体においては四つの解を持つ。
 4√2, -4√2, i4√2, -i4√2
ただ、分解体をつくる時は、これらの根を用いる必要はないという。
まず、x^4 - 2 は、Kにおいて既約であるので、次数4から次のようになる。
 (K(4√2) / K) = 4
次に、K(4√2) は実数体であり、これを中間体として用いる。
多項式 x^2 + 1 は、K(4√2) において既約であるので、同じく次数2から次のようになる。
 (E / K(4√2)) = 2
よって、こうなる。
 (E / K) = (K(4√2) / K)(E / K(4√2)) = 8

分離多項式の分解体ということでEは正規拡大体であり、8個の自己同型写像を持つことが分かるというわけだ。ここには、K上の多項式の解が拡大体Eの中に見つかれば、すべての解が拡大体に含まれるという思考がある。すなわち、方程式の解を見つけるためには、正規拡大体において自己同型写像があるかどうかを考察すればよさそうだ。...勝手な解釈だけど。

5. 有限体と巡回群
有限次元では、分離拡大体は単純拡大体になるという。そして、中間体が有限個であることが単純拡大体であるための必要十分条件だという。単純拡大体とは、なんのことはない、1つの要素を付加して得られる拡大体のこと。
有限体Kにおける多項式 f が重根をもつための必要十分条件は、その分解体Eにおいて多項式 f とその導関数 f' とが共通根を持つことだという。この条件は、f と f' が有限体Kにおいて、1以上の次数を持つ共通因数をもつことと同値だという。そりゃ、もとが有限体であれば、その拡大体も中間体も有限体であろうし、そうでなければ同型写像とはならないだろう。ただ、おもしろいことに、有限体の正規拡大体である自己同型群は巡回群になるというのだ。
「体の乗法群の任意の有限部分群Sは巡回群である。」
そこまで単純化できるとは、にわかに信じがたい。この定理は、アーベル群の二つの性質がもとになっているという。
一つは、「位数 c が最大になる要素Cが存在すれば、任意の要素の位数は c の約数である」ということ。位数とは元の個数。
もう一つは、「有限生成のアーベル群の基底定理」である。
有限生成のアーベル群とは、部分群 G1, G2, ..., Gk の直積という極めて単純な構造をしている。なるほど、有限部分群は巡回部分群の直積ということになりそうだ。...確信はないけど。

6. 1の累乗根と円周等分多項式
今、任意の体K、その拡大体の要素εを多項式 x^n - 1 の根とする。
「1の累乗根」とは、x^n - 1 = 0 の解のことで、次数n個の解を持つことになる。ちなみに、自然数体において、n乗するまで解が得られない場合、1のn乗根はεのn乗根となり、特に「1の原始累乗根」と呼ぶそうな。まさしく原始的というわけか。
しかし、複素数体においては、次のように解が得られる。
 ε = exp(2πi/n) = cos(2π/n) + isin(2π/n)
これは、{1, ε, ε^2, ..., ε^(n-1)} の有限巡回群である。
円周等分多項式とは、1の累乗根に関する多項式で、ここでは、Φn(x)とする。d が n の約数とすると、x^d - 1 は、x^n - 1 の約数である。よって、1のd乗根は1のn乗根の中に含まれる。そして、しばしば次の形で表されるという。
 x^n - 1 = ΠΦd(x)
つまり、多項式 x^n - 1 は、有理数体において円周等分多項式の積として既約分解されるということらしい。特に、標数nが素数pのとき、1の累乗根の個数は「オイラーのφ関数」で与えられるという。すなわち、円周多項式Φn(x)は、オイラーの関数Φ(n)の次数を持つということになる。そして、次の結果を得るという。
 (E/K) ≦ Φ(n)
位数 p-1 の巡回群になるというわけか。
...ここは、オイラーのΦ関数の知識がないと読みづらいところか、とりあえず鵜呑みにしておこう。だが、もうヤバい!脳は飽和状態へと達し、ネーター等式、クンマー体と流しながら、鵜呑み量(酒飲み量)が増えていく。

7. 方程式の可解性とガロア群
方程式を代数的に解くということは、累乗根を得るということである。ここでやっと、方程式におけるガロア理論の自己同型群の役割が明らかになる。

「f(x)が累乗根で解けるために必要十分な条件は、そのガロア群Gが可解なことである。」

可解群とは...
「群Gの部分群の減少列、G = G0 ⊃ G1 ⊃ G2 ⊃ ... ⊃ Gs = 1 が存在して、Giは、Gi-1の正規部分群の有限列で、i = 1, 2, ..., s に対して商群 Gi-1/Gi がアーベル群である」

そして、素数の累乗 p^n を位数に持つ群は、すべて可解であるという。
ここで、体Kにおいて、Kiを体の増加列、最終の体がFであるとする。
 K = K0 ⊂ K1 ⊂ K2 ⊂ ... ⊂ Ks = F
Kの拡大体Fが累乗根による拡大体であるとは、i = 1, 2, ..., s に対して、Ki = Ki-1i) であり、多項式 αが、x^ni - ai の形の Ki-1 内の根であることだという。
すなわち、Ki-1 上で Kが正規拡大体で、その自己同型群がアーベル群であれば解けるということのようだ。
更に、f(x) をK内の多項式で重根を持たないとし、Eを f(x) の分解体とする。
 f(x) = (x - α1)(x - α2)...(x - αn)
α1, α2, ..., αn は、Eの生成要素。
K上のEの自己同型群をGとすると、Gの要素σは、α1, α2, ..., αn で定まる。
だが、σは、α1, α2, ..., αn の並べ替えに写像し、Gはn個の要素の置換群になると考えてよいという。この時の群Gが「ガロア群」と呼ばれるものらしい。そして、次の定理が導かれる。

「K上n次の一般多項式のガロア群は、対称群Snである。Kが標数0で n ≧ 5ならば、n次の一般方程式は累乗根で解けない。」

素数次の既約方程式のガロア群Gが可解ならばGは線形であり、更に、任意の線形群は可解ということのようだ。...んー、置換群になるまでの仮定が、にわかに信じがたい。雰囲気だけだなぁ...

8. コンパスと定規による作図問題に対する代数的解釈
ユークリッド幾何学の作図問題が議論される。それは、「正多角形が作図できるための条件」と「角が三等分できるための条件」と「デロス島の問題」である。コンパスと定規によって作図可能ということは、有限回の操作で直線や円弧に分解できるということである。言い換えれば、ベクトルにおけるスカラー(ベクトル空間におけるノルム)と、円周等分多項式で分解できるということである。さすがにここまでガロア群を議論すれば、作図の対象は必ず有理数体でなければならないので、その限界を予感させてくれる。
例えば、半径1の円に内接する正n角形を作図する場合。
体Kは有理数体Qで、ε = cos(2π/n) + isin(2π/n) を解くのと同じである。つまり、正規拡大体である E = Q(ε) の次数を調べればいいということになる。そして、作図可能な正多角形の条件が素数を絡めて示されるのだが。...んー!ここまできてもやっぱり鵜呑みかぁ。
同じように、角の三等分とデロス島の問題も作図は不可能ということが導かれる。デロス島の問題とは、「アポロ神は、それまでの立方体の祭壇を、立方体状のままで倍の量にせよと要求された。」これは、立方体の一辺の長さを1として、3√2 を作図しなければならない。つまり、拡大体 F = Q(3√2) において解くことになる。だが、x^3 - 2 は有限体Qで既約であるから (F/K) = 3 であり、そのような作図は不可能となる。...おぉー!やっと鵜呑みから酒飲みの領域を見つけた。

2011-10-30

"電子回路の基礎" 北野正雄 著

前記事の「新版 マクスウェル方程式」では、新たな視点を与えてくれたことに感謝したい。そして、本棚を眺めていると...なんと北野正雄氏の本がもう一冊あるではないか。何かの講座で買わされたのか???この機会に、基本に立ち返るのも悪くない。我が家の本棚を秘密の宝庫にしてしまうところに、アル中ハイマー病患者の幸せがある。
「回路方式を天下りに与えるのでなく...」と前置きされるところに、なんとなく共感を覚える。三角関数と複素数の関係、すなわちオイラーの公式の実践の場として、電子回路ほど適した分野は珍しいかもしれない。それを学生時代に感じられなかったことが悲しい。

電子回路の世界は、ほとんど実践の場と言っていいだろう。技術者の中には、実践できなければ意味がない!といった理論に対して懐疑的な風潮がある。職人の世界でありながら、小学生の科学の延長のような、動きゃええ!みたいなところもあるのだけど。今でこそコンピュータ技術の進化によって、手軽にシミュレーションしながら理論的な解析も盛んだが、ちょいと前までは、ハンダゴテを握らずして回路技術もあったもんじゃなかった。パラメータを手探りで設定しながら、ひたすらカットアンドトライ!という伝統的思考がある。そして、我武者羅にやっているうちに、いつのまにか自己流の法則に辿り着き、それが有名な法則の変形だったりすることがよくある。参考文献では実践例がもてはやされ、理論を扱う教科書となると補助的な意味合いでしかないのは、今も大して変わらないか。
しかし、本書は、その実践の場にあえて数学的理論を持ち込む。その厳密性には感服する。コンデンサやコイルなどの受動素子は、その特性に時間成分や位相成分を持ち、微分方程式を抜きにしては語れない。おまけに、オペアンプや半導体などの能動素子ともなれば、電子の振る舞いという不確定性という物理現象までも扱う。そぅ、電子回路理論とは、応用数学や物理数学を避けては通れない世界なのだ。だから、とっとと逃げ出し、論理的な、いや屁理屈的なデジタル技術に駆け込んだ。それでも、論理回路の集積化が進めば複雑なアルゴリズムと対峙することになる。結局、数学からは逃れられず、落ちこぼれる運命は変えられないのであった。
ところで、電子回路において最も基本的な物理量と言えば、電流と電圧である。ただ、電流は電子の流れる量として物理的にイメージしやすいが、電圧となるとイメージしずらい。おまけに、電圧が生じたからといって電流が流れるとは限らない。数十ボルトで感電死するかと思えば、1万ボルト近い肩こり治療器があるとは、これいかに?
電流が流れる状態とは、電子の活性化状態と捉える。対して電圧の状態は、潜在的なポテンシャルエネルギーと捉えればよかろう。人間社会には様々な電磁の場があり、電子の活性化状態を体感することができる。ホットな女性に囲まれれば、心の電子が騒ぎだし微力な磁場が形成される。この段階では、心に期待が膨らむだけで刺激はいまいち!いわゆるモヤモヤ気分、これがある種の電圧状態なのだ。そこに女性がちょいと熱視線を注げば、ソレノイドが形成され、たちまち体中に電流が走る。これがイチコロというやつだ。この磁場を、ある業界の専門用語で「夜の社交場」と呼ぶらしい。そして、電流と電圧の違いとは何か?と問えば、それは、シビレるかシビレないかの差なのさ。

本書が最終的に扱う物理現象は、非線形性である。だが、想定した入力に対して予測した出力を得るためには、ほとんど線形性を必要とする。そこで、用途に合った範囲内で線形性が得られる素子や技を選んで組み合わせることになる。すべての周波数や振幅の範囲をカバーできるような特性を持った素子は存在しないし、万能な増幅特性が得られる夢の技も存在しないだろう。もし存在すれば、電子回路技術は技術ではなくなりそうな気がする。電子回路技術者は、それが数学的な厳密性などではなく勘であったとしても、無意識に非線形性と対峙している。そして、いかに線形性に持ち込んで議論するかに傾注する。
交流状態では正弦波が対象となり、振幅や周波数や位相で特徴づけられる。実効値の有効性は、平均値を示すことによって直流的な視点を与えることである。もちろん最大値との関係を考慮する必要があるけど。皮相電力とは、実効値電圧と実効値電流の積であり、名前どおり表向きの電力というわけだ。直流成分を扱うならば、キルヒホフの法則やオームの法則が使える。だが、交流成分となると複素振幅や複素インピーダンスといった概念を導入する必要がある。周波数や位相を扱うには複素空間が便利だからだ。
また、伝搬遅延や媒体特性が無視できなければ、時間や空間に関する微分方程式が必要となる。周波数特性の解析には、ラプラス変換などを用いた伝達関数や、フーリエ変換などの重ね合わせの原理を使う。雑音のような不規則な特性では、振幅の2乗平均、相関関数、パワースペクトルなどを統計量として扱い、確率論的に眺める。
こうした思索や技は、厄介な非線形の現象に対して線形性の視点を与えようとしてきた努力である。人間社会にとって、非線形性よりも線形性の方が居心地がいい。だからリニア回路という用語がもてはやされるが、どんなに頑張ってもリニア区間は限定される。宇宙原理にとって、線形性よりも非線形性の方が自然ということであろう。

1. 半導体
いまや、半導体は電子機器の中心的存在である。ちなみに、半導体業界の景気動向は経済指標としても用いられるほどだ。
発明当初は、電子の流れを制御しようというのだから、尋常な発想ではなかっただろう。今日、電子スピンの位相を制御しようとする量子素子なるものが話題になっているが、これまた尋常な発想ではない。
半導体デバイスの基本構成はpn接合であり、その特徴は結晶とバンド構造にある。シリコンやゲルマニウムといったIV族元素は、隣接する4つの原子と共有結合で結ばれ、ダイヤモンド構造の安定な結晶を作る。最外殻電子に対応するエネルギー準位は2組のバンド構造、すなわち価電子帯と伝導帯に分かれる。それぞれの準位に対応する電子の状態、すなわち波動関数は、特定の原子近傍に局在するのではなく、結晶全体に広がる。バンド間の準位のない部分が禁制帯で、そのエネルギー幅がバンドギャップとなる。そして、外部から熱や光あるいは磁場や電圧といった刺激を与えることによって電気特性が得られ、絶縁体や導体になる。pn接合では、空乏層をめぐって、順バイアスと逆バイアス、あるいは拡散電流とドリフト電流が対称性を示す。
半導体には、抵抗やコンデンサやコイルなどの素子はないが、その特性を解析するために等価回路でモデリングする。真空管やトランジスタなどの能動素子では、増幅特性を「制御電源」という抽象化モデルを用いて等価回路が示される。しかし、半導体の特性が理想的な線形性を示すわけではなく、動作領域を考慮する必要がある。想定内の信号が入力されれば、モデルどおりの動作をするだろう。逆に言えば、想定外の信号が入力されると、とんでもない代物になる。いまや、集積回路ではギガスケールのゲート素子が組み込まれ、ほとんど無限に近い多段トランジスタ回路を構成する。となれば、一か所でも想定外のノイズが紛れ込むと、とんでもない怪物に変貌する可能性がある。今日では、自動車から旅客機まで半導体制御されないものは存在しない。つまり、こんな不確定なものに命を預けているわけだ。

2. トランジスタ
トランジスタは、バイポーラトランジスタと電界効果トランジスタ(FET)に大別される。トランジスタにおける電圧と電流の関係もまた非線形で、しかも指数関数的である。
npn型バイポーラのような単純な構造の中に、ベース・エミッタ間のpn接合は順バイアスで、ベース・コレクタ間のpn接合は逆バイアスされるという見事な対称性を示す。この構造はベースの少数キャリアの振る舞いに支配される。
対して、電界効果トランジスタは、バイポーラとはちょっと違った原理で動作する。ゲート電圧の絶対値が大きくなると、pn接合の空乏層の幅が大きくなり、チャネル幅の実効値が狭くなるため、ドレイン・ソース間に流れる電流は減少する。そして、ゲート電極に加える電圧でチャンネル電流を制御できる。逆バイアスのためゲートにほとんど電流が流れないのが、その特徴である。
バイポーラが常に電流を流すのに対して、CMOSはスイッチングの瞬間にしか電力を消費しないというわけだ。その分、静電気のようなものでも誤動作しやく、周辺のバタバタする信号は瞬間ノイズでうるさい。ちなみに、新人時代、CMOS回路の奇妙な不安定動作を突き止めるのに徹夜したものだ。プローブをあてると完全に眠るのだが、放すと微妙に動作しやがる。主信号系のノイズが原因だと思ったら、実は配線されていなかったというオチだ!端子の解放状態とは恐ろしいものだと実感したものだ。
デジタル屋さんは、トランジスタを単なるスイッチと見なすため、遮断領域と飽和領域だけを議論すればいい。そして、ベース電圧の変化にしたがってコレクタ電流が変化する活性領域は、応答時間として考慮する。対して、アナログ屋さんは、本当の意味でのトランジスタ特性を利用して、活性領域を存分に使いこなすだろう。物理数学に蕁麻疹が出るとなると挫折するしかあるまい。

3. トランジスタ増幅回路
安定した増幅特性を得るためには、接地方式やバイアスの原理が役割を演じる。ここではバイポーラ型で議論される。基本的にトランジスタは、電圧制御電流源で、電流源の内部コンダクタンスは十分小さく、ほぼ理想的と見なしていいという。それは、コレクタ電流やエミッタ電流がコレクタ電圧にほとんど依存しないことを意味する。実際には、アーリ効果によって、コレクタ・エミッタ間電圧やコレクタ・ベース間電圧を増加させると、これらの電流もわずかながら増加するのだけど。ちなみに、ベース・エミッタ間電圧は数学的に約0.6Vとなるが、この数値は無意識に叩き込まれ、疑問を感じないほど思考が硬直化してしまっている。
バイポーラ型の欠点は、ベース電流はベース電圧に比例せず、指数関数的に変化することである。ベース電流はエミッタ電流と比例関係にある。その比例係数、すなわち電流増幅率が、あの忌々しい hfe だ。本書は、βで表される。ベース電流をゼロと仮定すれば、βは無限大となり、理想的な増幅素子と見なせる。しかし、実際にはベース電流の存在が、トランジスタの動作を理解する上で大きな障害になっているという。その分、CMOSではゲート電流が無視できるので設計が楽になる。βは、エミッタ電流やコレクタ電圧に依存する。特に、コレクタ電圧の上昇は、コレクタ・ベース間の逆バイアスを深め、空乏層の幅が広がるとベース幅を小さくし、βを大きくする。その変化は小さく、実用上は一定と見なす場合が多いという。βと逆飽和電流は、同じ型番のトランジスタであっても製造条件などでばらつき、特にβのばらつきは回路設計上の問題になるという。
そして、ベース電流を考慮しながら接地方式を検討することになる。ベースが入力でコレクタが出力となるエミッタ接地が最も一般的であろうか。電圧、電流ともに増幅されるし。ベース接地は、ミラー効果が少なく高周波領域で好んで利用されるという。コレクタ接地は、実際には接地ではなく、コレクタに一定の電圧をかける。エミッタ電圧が入力電圧に追従することから、エミッタフォロワとも呼ばれる。

4. バイアス回路
一般的にトランジスタ増幅回路の入出力特性は非線形である。帰還によって線形性が改善されている場合でも、入力が0V近辺では遮断され、そのまま信号を加えると大きく歪む。そこで、バイアスを用いた線形化が必要となる。ただ、温度特性が利得を変動させるという厄介さがある。ベース電圧バイアス法がうまく機能しない理由は、コレクタ電流のベース電圧に対する指数関数的敏感さと、トランジスタ特性の温度依存性にあるという。逆に、コレクタ電流を一定に保てば、安定なバイアスが期待できる。
ここでは、エミッタ側に定電流源を接続するエミッタ電流バイアスと、ベース電流とコレクタ電流の比例関係を利用してバイアスをベース電流として与えるベース電流バイアスの二つの方法が紹介される。バイアス方式の中では、エミッタ電流によるものが安定性に優れているようだ。これらのバイアス回路では、いくつかのコンデンサが用いられるが、直流信号であればコンデンサは解放と見なせばいいし、十分周波数が高い場合は短絡と見なせばいい。しかし、周波数の低い信号に対しては、インピーダンス特性に制限がある。増幅率の安定性は、入力信号に対する周波数特性を考慮する必要があり、どうしても遮断周波数なるものが出現する。

5. 電力増幅
電子回路では、伝統的に電圧増幅と電力増幅という分類がなされるという。前者は、センサー出力のような微小な電圧信号を、ノイズの影響を受けない領域にまで増幅すること。電流を信号として増幅することもあるので、より正確には「小信号増幅」と呼ぶべきだという。一方、後者は、スピーカ、送信アンテナ、モータなどを負荷として、信号電力を送り込むための増幅のこと。増幅方法では、お馴染みのA級、B級、C級がある。
A級増幅は、バイアスを活性領域の中央に設定して、活性領域に動作範囲を限定する。
B級増幅は、過激にバイアスをゼロに設定して、信号の正の領域だけを取り出す。負の領域も同じように増幅して合成すれば、全体で線形性を得ることができる。
C級増幅は、もっと過激にバイアスを負側に設定して、信号のピーク付近のみを増幅する。波形は著しく変形するが、共振回路と組み合わせて正弦波を取り出すことができる。周波数逓倍にも使える。
ところで、素直に増幅するA級では、無負荷でもコレクタ電流が流れ続けるため消費電力が大きくなる。その欠点を補うためにB級増幅では、お馴染みのプッシュプル回路がある。入力が正の場合は上のトランジスタが、負の場合は下のトランジスタが動作するような対称的な構成だ。入力電圧が0の場合はどちらもオフする。そのままだと0.6Vまでどちらのトランジスタもオンしないので、クロスオーバー歪が生じる。そこで、バイアスで無負荷状態でも少しコレクタ電流が流れるように工夫する。
また、電力用のトランジスタは、一般用よりも周波数特性などの点で劣っている。特に電流増幅率が小さい。そこで、二つのトランジスタを多段に構えて一つのトランジスタに見せかけるダーリントン接続という技を用いる。
更に、B級増幅の応用的な発想から生まれたD級増幅がある。B級増幅で振幅が電源電圧に等しい矩形波の場合は効率が100%になる。この場合、トランジスタは遮断と飽和を繰り返すスイッチとして働く。この矩形波の場合の効率の高さを任意の波形に適応する方法が、D級だという。信号よりも周波数の高い三角波を用意してコンパレータを通せば、信号値に応じたパルス幅が変化する矩形波が得られる。いわゆるPWMだ。パルス幅変調された信号でトランジスタをスイッチとして動作させれば、原理的には消費電力を0にできるという。エアコンや洗濯機などのモータを使った家電製品で用いられる可変電圧可変周波数インバータは、D級増幅の原理に基づいているという。

6. オペアンプ
オペアンプは、差動入力の直流増幅器として構成され、外付けのバイアス回路を必要としないように、静止時の入出力電圧が0になるように設計されているという。また、大量の負帰還によって良好な特性が得られるように、大きな利得を持っている。入力インピーダンスを高く、出力インピーダンスを低く設定されているのも特徴だ。IC化によって、差動増幅やカレントミラーに用いるトランジスタ対の特性を揃えることもでき、温度差を小さくしてドリフトの少ない設計が可能となった。電圧利得は非常に高く100dB以上だが、そのまま使うことは稀で、通常は負帰還をかけて利得を小さ目にする。
オペアンプ自体にはグランド端子がなく、入出力の電位の基準は、電源の正負の間にとられる。非常に高い周波数まで利得を持っているので、高い周波数領域まで電源のインピーダンスを低く保つ必要があり、そのためにコンデンサが正負電源端子とグランドの間に挿入されるという。コンデンサは、高い周波数に対する電源として働くわけか。理屈なしで条件反射で挿入していたような気がする。
しかし、実際のオペアンプの利得は周波数特性を持っており、スルーレートと対峙することになる。負帰還は増幅器の特性や改善などに役立つ。そして、一巡利得を大きくすれば、その効果は大きいだろう。だが、一巡利得が大きいと、増幅器の動作を安定させるための負帰還が、逆に不安定要因になることがある。能動素子でありがちな周波数特性に起因する位相のずれが大きくなると、負帰還のはずが正帰還になってしまい、ついには発振しやがる。
ところで、電圧利得が1倍の増幅回路でも馬鹿にはできない。測定器などでは、信号の出力インピーダンスよりも、測定側の入力インピーダンスを十分高くする必要がある。こうした場合にボルテージホロアがインピーダンス変換に役立つ。

7. 発振回路
ここまでは、いかに線形性を保つかに注目したが、非線形性を積極的に利用するのが発振回路である。最も単純な構成は、LC共振回路であろう。コイルの巻数抵抗Rを加えれば、LCR共振回路になる。これは、コイルとコンデンサが、それぞれ周波数成分を持っていることを示している。ちなみに、ファン・デル・ポルの方程式は、もともと真空管の発振回路の解析用として考案されたものだそうな。自律的な発振現象の本質をうまくモデル化しているために、電子回路に限らず幅広く応用されるという。
LC発振器の構成は単純なので、1つのトランジスタで実現できそうなものだが、やってみると意外と難しい。入力電圧を増加した時に、電流を多く流すような電圧制御電流源があるとありがたい。だが、エミッタ接地では、相互コンダクタンスの極性が逆でうまくいかない。ベース接地では、極性が適合しても、入力インピーダンスが低く、共振回路の損失が大きくなる。そこで、コレクタ接地と組み合わせて、入力インピーダンスを高く保つ。
コルビー回路は、ベース接地とコレクタ接地を組み合わせた共振回路の例として紹介される。あるいは、エミッタ接地とトランスを組み合わせたトランス結合発振回路の例が紹介される。更に、コイルの中間から帰還するようなハートレイ発振器は、トランスの直列接続と見なせば、トランス結合の発展型と見ることもできそうだ。また、コイル側ではなく、コンデンサ側を分割したコルピッツ発振器もある。
LC発振器は、LとCの値で決まり、それも電極などの物理的サイズに依存するので、精度はそれほど期待できない。そこで、水晶発振器が、高精度の電子機器の発振回路としてよく用いられる。水晶発振器を等価回路で示せばLCR発振回路となり、コルピッツ発振器のLを水晶に置き換えたものがピアス発振回路である。
本書は、CMOSインバータを増幅素子としたピアス回路の例が紹介される。また、電圧で発振周波数を制御するのがVCOである。ダイオードの接合容量がバイアス電圧によって変化するのを利用したもので、LC発振器のCの一部を可変容量ダイオードに置き換える。水晶発振器においても、Cを可変容量ダイオードに置き換えれば、若干の周波数を変化させることができる。これがVCXOである。VCOやVCXOのよく利用される方法はPLLといったところであろうか。

2011-10-23

"新版 マクスウェル方程式" 北野正雄 著

マクスウェルと言えば電磁気学...おぞましい赤点の記憶が甦る。当時の大学の講義では、電界や磁界を扱うための数学の道具としてベクトル解析から始まり、ガウスの定理やストークスの定理を経由して、クーロンの法則やビオ・サバールの法則が中心的な存在であった。ちなみに、電子工学では電界や磁界と呼ぶが、理論物理学では電場や磁場と呼ばれる。電子回路の実践という立場からすると、これらにオームの法則やジュールの法則を加えるぐらいでほとんど説明できるだろう。マクスウェルやローレンツとなると、最後の方でちょろっと登場しただけであった。
しかし、これらの偉業がおまけの存在では、科学や哲学の観点からすると不幸であろう。しかも、ひたすら複雑な演算過程が黒板に示され、それが正しいかなどアホな学生に検証できるはずもなく、有無を言わせず暗記科目に仕立てられた。科学が単なる暗記科目になり下がると悲劇だ!いや、喜劇だ!おかげで、電磁のスピン的現象を、数学の複素空間で角周波数的特性と適合することを感じる間もなく、ひたすら数式の霧の中をさまようしかなかった。著者の言葉を借りるならば、「天下り的な」思考ということになろうか...

本書は、そんな赤点小僧にも新たな視点を与えてくれる。その試みは感動モノだ。
マクスウェル方程式から始まり、大学の講義とは逆向きのアプローチがなされる。従来の講義では、電磁場の記述がスカラーとベクトルの範疇に留まるために本質的なことが見失われがちだと指摘している。そして、「テンソル」「双対空間」という概念を積極的に導入している。特に、数学的な意味と物理的な意味を区別することに注意が払われ、「物理的次元」というものをかなり意識している。スカラー積やベクトル積で演算が規定できればありがたいが、そのために物理的次元が無視され、変換系の整合性がとれないということらしい。そもそも物理的次元が違えば、演算そのものが成り立たないような気もするけど...
まず、「計算的経済性よりも概念的合理性を重視する」と宣言される。電磁場を記述するには、その位置によって様々なエネルギー現象が生じるので厄介である。そこで電磁ポテンシャルを解析することになるが、反対称性が線形性を維持しながらうごめきやがる。反対称性の演算となれば、直観的には行列式のような記述が向いてそうだ。演算表記では、添え字で多次元が表現できるテンソルが有効であろう。変換行列の直交性が空間を同一視できるという考えは、データ解析の基本的な思考である。なるほど、点電荷のような3次元空間の物理現象を扱うには、2階のテンソルで記述するのが適しているというわけか。反対称性にもよく適合するようだ。
また、ベクトル表記にこだわれば直交基底の制約を受けるが、現実には非直交基底と対峙しなければならない。そこで、抽象度を高めるために双対基底を導入している。ある線形のベクトル空間に線形関数によって作用を施せば、新たなベクトル空間が形成される。更に、同じ線形関数によって作用を施せば、元のベクトル空間に戻る。これが「双対空間」というものらしい。双対とは、2回対称性という意味のようだ。
有限次元において線形的な作用が認められれば、系の変換もイメージしやすい。MRI(磁気共鳴画像装置)のように体内が撮影できるのは、磁場という物理量で空間の方向や位置を測定できるからであり、それも双対性のような関係によって系の変換ができるからである。反対称性テンソル場は、電磁気学の数学的、幾何学的側面において中心的存在であるという。そして、反対称テンソル場は微分形式ということになる。微分形式とは、微分方程式を幾何学的に捉えようとした共変テンソル場といったところであろうか。よって、幾何学的にイメージさせてくれる grad, curl, div といった微分演算子との関係が重要となる。こうした幾何学的思考が、マクスウェル方程式をエレガントに魅せてくれる。

マクスウェル方程式が生まれた当時は、まだ電磁波が発見されておらず、ましてや光が電磁波の一種などという認識もない。だが、マクスウェルが導入した変位電流密度項 ∂D/∂t は、波動的な解を与える。その伝搬速度 1/√(ε0μ0) が、光速の実測値とよく符合したことから、光が電磁波であることが確信されたという。ε0, μ0 は、それぞれ電気的、磁気的な定数であり、光とはまったく無関係に見える。しかし、マクスウェル方程式には光速の不変性が示され、後に相対論との間で論争を繰り広げることになる。
運動の相対性と光速の不変性の矛盾を解決する原理では、ローレンツ変換がその役割を果たす。光速が不変と主張したところで、現実には赤方偏移や青方偏移といったドップラー効果が観測される。となれば、相対論との矛盾を回避するために、変数を別に求めなければならない。そこで、別の慣性系において時間の進み方が変わるということになる。いわゆる「同時性の破れ」というやつだ。「ローレンツ短縮」とは、運動する物体の長さが、別の静止系から眺めると、運動方向に短縮して観測される現象である。光速に近づけば、時間が短縮し、空間が歪むというわけだ。この統一見解の立場から、電磁気学はローレンツ短縮に帰着するという考えが広くあるようだ。本書は、ローレンツ変換の近似であるガリレイ変換を用いて直観的な考察を味あわせてくれる。

1. 天下り的な概念
「廃棄されるべき概念」として紹介される永久磁石の例は興味深い。磁化をつくる要素は小さい環状電流である。しかし、一般的には、電気双極子のアナロジー的発想から正負の磁荷の対、すなわち磁気双極子なるものを想定する。その最たるものは、小学校の理科で習うアレだ。N極とS極は色分けまでされて、別の物質が存在するかのような印象を与える。子供の頃、N極とS極の境界はどうなってるんだ?って考え込んでしまった覚えがある。思考の節約という単純な動機で用いられる物理モデルの典型である。これを脱却することはできまい。小学校の理科の象徴のようなものだから。だが、電磁気学の立場から、環状電流モデルで示されるべきだと指摘している。永久磁石の中で、電荷がサイクロトロン運動をしている様子は、とても磁極モデルなどでは説明ができないというわけだ。
また、電場と磁場を対称的に捉える立場として、電荷に対して磁荷を持ち出すケースが多いが、本書は相補的に捉えるべきだという立場を通している。

2. マクスウェル方程式
 div D = ρ
 curl H - ∂D/∂t = J
 div B = 0
 curl E + ∂B/∂t = 0
 (E:電場, B:磁束密度, D:電束密度, H:磁場の強さ, ρ:電荷密度, J:電流密度)

分極P, 磁化Mを用いると、
 D = ε0E + P
 H = (1/μ0)B - M
 (ε0:磁気定数または真空の誘電率, μ0:電気定数または真空の透磁率)

真空中(ρ = 0, J = 0, P = 0, M = 0)で方程式を解くと、
 c = 1/ √(ε0μ0)
これが電磁場の擾乱(変化)する速度で、真空中の光速ということになる。
真空のインピーダンスは、Z = √(μ0/ε0) で定義される。
速度vで運動する電荷qが、電場、磁場から受ける力Fは、
 F = qE + qv × B
これがローレンツ力である。

3. 電場と磁場
物理量が空間の各点に割り当てられた状況が「場」であり、それが室内の温度分布であれば温度場ということになる。ちなみに、ホットな女性の熱視線が渦巻くところは「夜の社交場」と呼ばれる。
ある点における場の量は、その点における微小変位ベクトルとして捉える。それは、点、線、面積、体積...などの次元に相当する、点スカラー場、力線ベクトル場、束密度ベクトル場、電荷密度場、密度スカラー場を対応させるイメージである。
領域の境界を∂で表すと、曲線Lの両端(P2, P1)では、P2 - P1 = ∂L、曲面Sの周辺の曲線では、L = ∂S、体積Vの表面では、S = ∂V となる。
∇ = ∂/∂x は、場の性質を持ったナブラ演算子で、何かのベクトル場を掛けることによって結果が得られる。こんな感じで...
  • ナブラにスカラー場φ(関数)を掛けると,関数の勾配場が得られる。
     ∇φ = grad φ
  • ナブラとベクトル場Aのスカラー積をとると,場の湧き出しや吸い込みがあるかが得られる。
     ∇・A = div A
  • ナブラとベクトル場Aのベクトル積をとると,場の回転量(rot, curl)が得られる。
     ∇×A = curl A
渦は回転(rot, curl)、湧きだしは発散(div)といったイメージであろうか。ちなみに、ラプラシアンは、∇^2 (2階の偏微分)をΔと表記して一般化したものである。ラプラス変換と聞いただけで蕁麻疹が...
マクスウェル方程式には、4つの場(E, D, B, H)が含まれている。D, Hは、純粋な電磁的な量だけではなく、媒質にも関係したハイブリッドな量である。4つの場は、電荷密度によってDが生じ、電磁場中のEによって力が生じる、あるいは電流密度によってHが生じ、電磁場中のBによって力が生じる、という関係がある。この場合、D, Hを「源場」、E, Bを「力場」と呼ぶことがあるという。電場のエネルギーは、コンデンサのように電場に逆らって電荷を移動させるのに要する仕事で、磁場のエネルギーは、コイルのように磁場を増加させる際に電流を維持するにの必要な仕事、ということはできそうだ。なるほど、回転楕円体の媒質で生じる磁場を眺めれば、帰還回路が形成される様子やループ利得が見えてくる。

4. ガウスの定理とストークスの定理
ベクトル解析の中心は、ガウスの定理とストークスの定理である。
力線ベクトル場の空間変化は、スカラー場として表される。
 ∫A・dL(境界は∂S) = ∫∇×A・dS(境界はS) ... ストークスの公式
力線ベクトル場Aから導かれる ∇×A は「渦場」と呼ばれる。渦場は束密度ベクトル場である。これは、2形式場 ∇ΛA (Λ: 反対称積)と見ることもできるという。
また、束密度ベクトル場Bの空間変化は、体積場として表される。
 ∫B・dS(境界は∂V) = ∫∇・B dV(境界はV) ... ガウスの公式
束密度ベクトル場Bから導かれる ∇・B は「湧き出し場」と呼ばれる密度スカラー場である。これは、3形式場 ∇ΛB と見ることもできるという。
こうして眺めていると、階数が1だけ異なる場が、微分積分によって関連づけられる。こんな感じで...
  • 点スカラー場は階数0で、式φ(x) = ∫grad φ・dL によって、力線ベクトル場の階数1となる。
  • 力線ベクトル場は階数1で、式∫A・dL = ∫curl A・dS によって、束密度ベクトル場の階数2となる。
  • 束密度ベクトル場は階数は2で、式∫B・dS = ∫div B dV によって、密度スカラー場の階数3となる。
gradは、点スカラー場に作用するが、密度スカラー場に作用させることはできない。同様に、curlは力線ベクトル場、divは束密度ベクトル場のみに作用させることができる。

5. デルタ関数
点電荷とは、小さい領域に局在する電荷分布を理想化したもので、原点で電荷密度が無限大になるという特異性を持つ。この特性は超関数のデルタ関数を用いると、うまく適合する。あの忌々しいインパルス応答だ。
デルタ関数は、ディラックによって量子力学の定式化のために導入されたという。原点で連続な関数f(x)に対して、
 ∫f(x)δ(x)dx = f(0)
を満たすものと定義される。インパルス応答のように、∫δ(x)dx = 1 を満たす適当に滑らかな関数であれば、デルタ関数でモデル化できるというわけだ。これを電磁気学で用いるには、三次元に拡張する必要があるという。

6. クーロンの法則とビオ・サバールの法則
電場、磁場に関する基本法則は、それぞれクーロンの法則とビオ・サバールの法則である。点電荷が電場に対応するならば、点電荷の運動が磁場に対応すると考えればよさそうだ。ただ、点電荷といってもあくまでも概念的なモデルであって、それに相当する運動、すなわち点電流なるものも物理的に存在しないから厄介である。電流は導線の中を電荷が移動している状態である。よって、電束密度の変化量を積分するようなイメージになる。電荷の積分を統計的に用いるとでも言おうか...
クーロンの法則では、磁場が生じない「静電場」を想定する。電荷分布が時間的に変化しない時、磁場は存在せず、時間的に変化しない電場だけが存在することになる。
一方、ビオ・サバールの法則では、電場の生じない「定常電流による磁場」を想定する。電流分布が時間的に変化しない場合の磁場を考えて、電荷分布を0と仮定する。この状態は、しばしば「静磁場」と呼ばれるそうな。しかし、「磁場は運動する電荷に付随するもので、本質的に動的なものであり、相応しい呼び方とはいえない。」と指摘している。
電荷が一定速度で運動すれば、やはり電場を形成するだろうし、磁場だけが存在するような状況を想定することは難しい。そこで、電流の流し方を工夫する。面の閉路に沿って電流をループさせることを考え、微小面積の総和(積分)として捉える。点電荷が閉路で等速運動すると考えれば、運動の慣性系で捉えることができそうか。マクスウェル方程式の時間依存部分は、静電場と定常電流の磁場の二つの系から眺めることができそうだ。

7. 電磁気学と量子論の関係
マクスウェル方程式は、量子論の発見に貢献した。アインシュタインの光量子仮説からディラックの量子電気力学に至るまで。本書は、量子論との深い関係として、荷電粒子を量子論的に扱うために必要なハミルトニアンとアハラノフ - ボーム効果を紹介してくれる。
ハミルトニアンとは、全エネルギーに対する物理量を抽象化するようなもので、通常の物体では運動エネルギーとポテンシャルエネルギーの合計として想像できる。だが、量子の世界となると、波動的な要素が加わり、想像もできない現象が生じる。量子論の解析では、このハミルトニアンが重要な役割を果たすそうな。
電磁場の解析では電磁ポテンシャルを調べるわけだが、量子力学における電磁ポテンシャルの重要性を示す典型例が、アハラノフ - ボーム効果だという。なんと!荷電粒子が存在する領域において、電場や磁場が存在しないにもかかわらず、電磁ポテンシャルの影響を受けるというのだ。磁気単極という状態が存在しうるというわけか。

2011-10-16

"世界でもっとも美しい10の物理方程式" Robert P. Crease 著

「展覧会の絵のように鑑賞する!」シリーズ第二弾、科学実験に続いて物理方程式の登場だ。しかし、原題は「偉大な方程式 - 科学で起こったブレークスルー、ピタゴラスからハイゼンベルクまで」とある。著者ロバート・クリースの選択基準は「美しい」ではなく「偉大な」であったわけか。優れた方程式というものは数学的な美を具えているもので、本書の邦題でも違和感はない。但し、シュレーディンガー方程式は、波動関数で抽象化しなければ美しく見えないけど...
「美しい」とはいっても、数学的な知識とセンスがなければ味わうことすらできない。その感覚は主観性の領域にあり、科学が得意とする客観性と真逆に位置するところに面白さがある。偉大な科学者には、世界を知ることのできる方程式に驚嘆の念を保ち続ける知性と感性があるのだろう。羨ましい限りだ!

あらゆる現象を数学で説明できれば、感情的になりやすい精神に平静をもたらし、真理へと向かう力を与えてくれるだろう。ただ、数学は無味乾燥な学問と蔑む意見も少なくない。あるいは、科学は自然法則の発見であって、発明ではないという意見も聞かれる。その通りかもしれない。発見を成し遂げた人も、既にそこにあったものにたまたま出会ったと感じるものらしい。
しかし、だ!方程式の美を探究する過程を観察すれば、これほど情緒的で創造的なものがあろうか。偉大な科学者たちは、狂気じみた思考を好む。というより、難題に遭遇すれば、極端に逸脱した発想を試みるところまで追い詰められるのだろう。天才たちには、科学への信念と宗教的な感情との間になんら障壁もなく、矛盾すら感じないのかもしれない。いや、矛盾を自然に受け入れながら楽しんでいるのかもしれない。狂信者でもなければ、人生を賭けてまで結論があるのかも分からない研究に没頭することはできまい。そして、宇宙原理のもとで誰からも強制されない独自の神を構築する。こうしてみると、科学もなかなかの宗教だ!
数式は単なる記述である。しかし、不確定性原理に到達する過程は、もはや単なる記述だけでは片づけられない。世代間を超えた純粋な知への渇望によって獲得した結果は、芸術の喜びを味あわせてくれる。方程式には、現象を簡潔に記述するところから詩と似た性質があって、多くの原理や哲学的な意味が内包されている。偶然一般化された方程式であっても、後に本質的な解釈が施される。したがって、数学は哲学だ!と強く主張したい。
あらゆる学問において体系化が試みられるが、数学における体系化の純粋さは格別だ。
ガリレオ曰く、「自然の書物は数学の記号によって書かれている。」
概念とは、決定的なものではない。せいぜい方向性を示すぐらいなものか。科学者たちは、概念的理論を数式で武装し、単なる空想で終わらせないように努力してきた。ここに、精神領域に留まった哲学と、数学的に解放された哲学との違いがある。しかし、ハイゼンベルクが不確定性原理を発見すると、科学は再び精神領域へと引き戻される。むしろニュートン力学や相対性理論が適応される世界の方が、自然界において特殊なケースだったのだ。
人類は、重力の存在をその概念が発見されるずーっと前から、なんとなく感じてきただろう。これほど存在を意識させる物理量もあるまい。古典物理学が重力を中心に発展してきたのも道理というものだ。やがて、アリストテレス的エーテル説をめぐっての論争が激化すると、ニュートンの「運動の相対性」とマクスウェルの「光速の一定性」が矛盾するように見えてくる。ならば、光速を一定量と仮定し時間と空間の方を可変量にすれば、相対性にも矛盾しないんじゃないか、とアインシュタインが時空の曲率で統合した。ここまでは、認識空間が歪んでいるとはいえ、まだ古典物理学風の存在認識は保たれている。
ところが、量子の存在を確率論でしか説明できないとし、不確定性が普遍の原理だとすれば、シュレーディンガーの猫と似たような状況となる。つまり、あらゆる存在の可能性は重ねあわせでしか説明できなくなり、自己の存在も疑わしくなる。哲学は古くから実存認識に疑いを持ってきたが、ここにきて...科学よ、お前もか!
もはや、科学は感受性のないドライな世界などとは言ってられない。人間の客観的能力は、いまだ精神の檻に幽閉されたままなのだ。科学の目的は技術を裏付けして社会を豊かにすることになっているが、実は人間の認識能力の限界を教えようとしているのか?人間の持つ合理性は、主観性と客観性の調和によってのみ実現できるというわけか。

さて、どんな分野でもトップテンを選ぶとなると揉めるものだ。ここに選出されたものにまったく異論はない。ただ、革命的な思考をもたらしたゲーデルの不完全性定理も挙げたいところだが、方程式で表現するにはちょっと苦しいか。物理学への影響もいまいちか。また、数学の未解決問題「リーマン予想」が証明されたならば、ゼータ関数がランキングしてくるだろう。なにしろ、素数の法則と純粋ランダム性を解く可能性があるのだから。
となれば、代わりにどれかを除外せねばならんが...んーそれも難しい!マクスウェルの四つの方程式をセットにしているから、ニュートンの運動法則と万有引力を一つにまとめるという手もありか。
更に、トップワンを選ぶとなると、知名度の高い E = mc^2 という意見が聞こえてきそうだ。歌姫マライア・キャリーにいたっては「E=Mc2」なんてアルバムもある。さりげなくイニシャル(MC)を埋め込んで。
しかし、おいらはオイラーを推したい。複素空間における指数関数と三角関数の関係は、急激に増大し発散する世界を周期的な閉じた世界に等しいとしたのだから。おかげで、記憶のない虚時間の概念によって千鳥足でぐるぐる回る店間経路を説明できるし、アルコール濃度が急激に増大すると同じ台詞を繰り返しながらホットな女性を口説く現象も説明できる。

1. ピタゴラスの定理 : c^2 = a^2 + b^2
「ピタゴラスの定理」の発見者は不明だそうな。その時期もピタゴラスよりもはるか昔だとか。直角三角形の辺の比がピタゴラス数になる三角定規の存在を古代の職人たちは経験的に知っていた。航海術や天文学で用いられれば、たちまち宗教と結びつく。宗教は宇宙の真理に飢えているのだろう。石工のギルドから生まれたとされる秘密結社フリーメイソンは、この定理をシンボルに用いて真理の象徴とした。
古代インドでは、「シュルバスートラ(縄の経)」という書にブッタの「聖なる数」というものがあるという。この書は祭場を設営するための指示書で、幾何学的知識が満載でピタゴラスの定理の応用例まで記載されるそうな。
また、中国最古の天文学と数学の書「周髀算経(しゅうひさんけい)」にも、ピタゴラスの定理らしきものが記されるという。この書は、「地球は平らだとする宇宙観を、論理的に基づき完全に数学的に説明した唯一の書物」として有名だそうな。
「シュルバスートラ」が宗教的目的で、「周髀算経」が天文学的目的で書かれたが、証明がはっきりと示されるわけではないらしい。そして、定理として証明してみせたのが「ピタゴラスの定理」ということになる。知識を知っていることと、それを証明することでは意味が違う。結果よりも真理に辿り着くプロセスこそ信頼を裏付ける。無条件に信じるかどうか、ここに宗教と科学の隔たりがある。ピタゴラスの定理は、人類史上最初の科学だったのかもしれない。

2. 運動の第二法則 : F = ma
学生時代、「力の概念」とエネルギーは何が違うのか?と困惑したものだ。この方程式には、質量とエネルギーが等価であるという洞察は含まれない。実際の現象についてではなく、抵抗がまったく存在しない架空の世界を記述している。それでも、あまりの単純さゆえに批判的な意見をも黙らせてしまう。「力の概念」の意味とは、説得する力なのか。ニュートンは、力、質量、運動を定義すると同時に、経験によって発見した検証可能な関係を述べた。
運動とは、人間が生まれながらにして体験する最も身近な物理現象である。押したり引いたりすれば自然に筋肉が動き、なによりもそこに居るだけで体重を感じる。女性の嫌がる現象のようだ。人間は、あらゆる現象を説明する時に、本能的に力関係を想像するところがある。政治の力学しかり、金銭の力学しかり。
だが、力の概念は分かりやすいようで、いまいち捉えどころがない。ガリレオは「力」を何と呼んでいいか分からず、インペトゥス、モーメント、エネルギー、フォースなどの用語を使ったという。ガリレオ著「天文対話」でも慣性の法則らしきものが語られるが、いまいち自信なさそうで、質量についても、おぼろげな認識しかなかったようだ。一方、ニュートン著「プリンシピア」は、力、質量、加速度を体系的に述べ、いまや運動の存在論の基本要素となっている。

3. 万有引力の法則 : F = G・m1・m2/r^2
「すべての物体は、質量の積に比例し、距離の二乗に反比例する力によって互いに引き合う。」
ニュートンは、あらゆる物体には普遍的な引力が存在するとして、地上の物理学と天空の物理学を統合した。当時、物体の運動はなんらかの接触媒体によってもたらされるとして、エーテル説のような思想が支配的であった。ガリレオ以前からアリストテレス的世界観への疑いはあったが、具体的に反証してみせたのが万有引力の法則である。落下運動は日常の当たり前の現象で、重力の存在が科学的に証明されなくても直感的に認識できる。だが、干潮現象や天体の円運動とは無関係だと信じられてきた。そこに、統一見解を示したのだから科学的大革命と言えよう。あの有名なリンゴが落ちる物語が、聖書のエデンの園で「知恵の樹」の果実であるリンゴを人間が初めて手に取った物語と重ねながら伝説化するのもうなずける。
ニュートンは、重さと質量を区別する思考から、引力の概念に到達したという。物体の力は内部から強制的に動かすインペトゥスのようなものという考えから、物体の運動は外部から作用する力によって起こるという考えに変わったという。力が距離とともに変化することから、重さと質量を区別する必要があったわけだ。重さは、地球の表面からの距離に応じて変化するが、物体が本来的に運動を決定づける質量は変化しない。ニュートンの研究はケプラーの法則によって動機づけられ、ガリレオの実験の舞台を法則の舞台へと押し上げた。
ただ、曲線軌道運動の解析における求心力と慣性に分解する方法は、ロバート・フックの影響によるものだという。ちなみに、ニュートンはフックを毛嫌いして王立協会でしばしば対立したとか。フックはこの方程式を先に導いたと主張したが、相手にされなかったという。フックは逆二乗法則を提案したが、それは特定の場合であってニュートンはその普遍性を示したというから、抽象度ではニュートンの方が優っているようだ。

4. オイラーの等式 : e^iπ + 1 = 0
これほど、「展覧会の絵のように鑑賞する!」に相応しい数式があろうか。ネイピア数と円周率を含みながら、気味が悪いほど単純化してやがる。
ただ、個人的には、e^iπ = -1 の形の方が説得力を感じる。なにしろ、無理数と虚数を組み合わた指数関数が、その成分がうまいこと相殺し合うと整数と等価になると主張しているのだから。自然界では、有理数、無理数、虚数が、調和の中で存在しているというわけか。
ガウス曰く、「オイラーの等式を見て、自明と感じない人は数学者ではない」
尚、e^iθ = conθ + i・sinθ の形で学んだ印象が強いが、θ = π とすれば同じだ。この形も哲学的意味は大きい。指数関数的な増大が、三角関数の無限周期と等価であると主張しているのだから。オイラーは、あらゆる現象を周期的なもので扱うことができれば、どこかに収束する可能性を示した。まさに解析学の思考原理だ。近似法において数学の直交性を利用して三角関数などの周期性を利用するのも分かる。近似法とは、複雑な現象の中から無理やり法則性を見出して、抽象化の概念に押し込んで誤魔化す方法論というわけか。
無理数を扱う必要性から「虚数」という名称を提案したのはデカルトだという。連続体の研究では微積分学でライプニッツやニュートンが功績をあげているが、更に、解析学として体系化したのがオイラーだ。彼は「ケーニヒスベルクの橋の問題」を解決して、位相幾何学も先駆けている。もっとも位相幾何学という分野が認めらたのは、その百年後であるが。

5. 熱力学第二法則 : S' - S ≥ 0
S'はしばらく時間が経ってのエントロピー、Sはある時間におけるエントロピー。
「エントロピー増大の法則」としても知られるこの法則は、世界のあらゆる現象において本質的な意味を持っている。アインシュタインは、「エントロピーはすべての科学にとって第一の法則」と言ったとか言わなかったとか。
エントロピーは、よく「乱雑さ」と訳されるが、その意味するものは簡単には片付けられない。金属のように一つの物質内では熱の伝搬が一応に広がり均衡化していくが、社会現象では均衡化というより複雑化を示す。それが、エネルギー保存則と深い関わりがあることは、なんとなく感じる。だが、エネルギーの正体も様々で、熱エネルギーであったり、運動エネルギーであったり、はたまたポテンシャルエネルギーであったりと捉えどころがない。熱がエネルギーに変換されることが分かっても、いつ、どのように変換されるのか?そして、変換効率が議論される。
理想の可逆サイクルとしてカルノーサイクルは有名だが、実現不可能とされる。そして、熱機関の立場はカルノーの「熱の保存論」とジュールの「熱の変換論」で割れた。クラウジウスは、ギリシャ語の「変換」を意味する言葉をもとに「エントロピー」と名付け、次のように定式化したという。
「世界のエネルギーは一定である。そして、世界のエントロピーは最大値に向かって常に増加し続ける。」
学生時代、熱力学の第一法則と第二法則は直感的に矛盾しているように見えたものだ。第一法則はエネルギー保存則であり、必ず系における状態が一定ということは、なんとなく可逆性をイメージさせる。だが、第二法則の左辺がプラスになるということは、不可逆性を宣言している。なんと気持ち悪いことか。となれば、不可逆現象を元に戻すには、時間を逆転するしかない。これが「時間の矢」の原理だ。つまり、熱力学第二法則の意味するものは、「後悔先に立たずの原理」というわけだ。

6. マクスウェルの方程式 : 電磁気学を完全に記述する四つの方程式
 ∇・E = 4πρ : 電磁がどのように生み出されるか
 ∇ × B - (1/c)∂E/∂t = (4π/c)J : 電流と変化する電場がどのように磁場を生じるか
 ∇ × E + (1/c)∂B/∂t = 0 : 変化する磁場がどのように電場を生み出すか
 ∇・B = 0 : 磁気単極子は存在しない

マクスウェルは、空間を通って伝搬する電磁波の存在を予言し、ニュートン力学で予測されていない電磁場を記述した。「アンペールの法則」は、導線の環に沿う磁力の総和は、その環を貫通して流れる電流の総和に等しいことを示す。ファラデーは、電磁誘導とファラデー効果を発見した。電磁誘導とは、運動する磁石が導線に電流を生じさせ、変化する電流が別の導線に新たに電流を生じさせる現象である。ファラデー効果とは、偏光した光が磁場の存在のもとでガラスを通過する時、その偏光面が回転するという現象で、磁気は光に影響を及ぼすことを意味する。
当時、電気は、導線を流れる粒子としてニュートン力学で議論されていた。ファラデーは、電気も磁気もエーテルの歪みから生じ、エーテルによって伝搬すると信じていたという。そして、力線を用いて磁気を実験的に説明する。小学校の理科で、磁石の周りで砂鉄が曲線を描くアレだ。これを数学的に説明したのがマクスウェルで、電磁気学という新分野を切り開いた。彼は、磁気ベクトルポテンシャル(電磁ポテンシャルの磁気部分に当たるベクトルポテンシャル)と微分方程式を用いて、変化する磁場でどのように電流が生じるかを説明する。
「磁場が光の偏光面を回転させられるなら、力線上のそれぞれの点は、回転する小さな分子の渦のようなもので、その渦は、傍を通過するあらゆる光の波に、自らの回転の一部を与えることになる。」
磁場が回転する多数の「セル」でできていると仮定すると、磁場が強いほどセルの回転は速くなるというわけだ。そして、電磁現象の媒体はある程度の弾性を持っていることを示した。ここで注目すべきは、弾性を持つものはすべて、エネルギーを波動性によって伝えるということである。電磁場では、反射、屈折、干渉、偏極の現象があるというわけだ。
実は、マクスウェルはエーテル説に憑かれていたようだ。音波であれば、風が吹くとその媒体である空気の流れる方向によって異なる速度で伝わる。ならば、エーテルにもわずかなドリフトがあって、光の方向にも速度の違いが生じるのではないかと考える。マクスウェルは、電磁波なるものの存在を予感させる。そして、電磁波を発見したのがハインリヒ・ヘルツ。結局、マイケルソン・モーリーの実験でエーテルの存在は否定されることになるが。
ところで、マクスウェルが定式化したベクトルポテンシャルAと静電ポテンシャルΨに基づいた表現は、悪評だったそうな。複雑過ぎて実用的でないというわけか。そこで、アマチュア科学者のオリヴァー・ヘヴィサイドが、電気力Eと磁気力H、電気と磁気の流れをDとBを使って書き直し、一気に四つの方程式に凝縮されたという。測定したいものはポテンシャルではなく、電場の強度と磁場の強度ではないか、というのが彼の言い分だそうな。この思想は、ヘルツをはじめ著名な電磁気研究者に歓迎されたという。

7. E = mc^2
「運動の相対性」と「光速の一定性」との間に矛盾が生じると、物理学界はニュートン力学かマクスウェル理論のどちらかに間違いがあるだろうと考え困惑した。そこで、やけくそになった人物がローレンツだという。彼は、静止系と運動系との間には時間の長さの違いが生じるとした。ローレンツ変換は、二つの慣性系の間の時間と空間を結びつける線形変換である。観測系が光速に近い運動をすれば、時間や空間が縮むというわけだ。すなわち、絶対空間や絶対時間なるものを認めない。ローレンツは、エーテルの存在を仮定して、時間の収縮が起こるというローレンツ収縮を導き出した。
実は、ローレンツはエーテル説を救おうとしたという。対して、アインシュタインは、エーテル説を仮定しなくても相対性と光速一定が両立できるという立場から、同じ結果を導く。二つの慣性系における時間と空間の長さの違いを、ピタゴラスの定理によって収縮係数を求めたのだった。アインシュタインは、相対性原理をマクスウェルの方程式と組み合わせると、質量は物体の中に含まれるエネルギーを直接表す量でなければならないことに気づいたという。そして、光は質量を運ぶものということになる。つまり、ある物体がエネルギーを放出すると、E/c^2 だけ質量が減るというわけだ。
この方程式には、「質量とエネルギーの等価性」という概念が記述され、宇宙の基本的な骨格が示されている。質量とエネルギーは低速度ではほぼ一定だが、光速に近づくにつれて変化するというわけだ。後に、原子核が発見され、更に中性子が発見されると、質量とエネルギーの等価性の原理は、宇宙の最小スケールから最大スケールまで、あるいは原子構造から恒星の爆発まで説明できるようになる。

8. 一般相対性理論の方程式 : Gim = -κ(Tim - 1/2・gimT)
この時空の曲率を表す場の方程式には、アインシュタインの重力定数κ が含まれ、空間は重力場の近辺で湾曲するというのだから、まさにニュートン力学の普遍性に修正が加えられた偉業である。
慣性質量と重力質量という二つの現象があったとしても、自由落下している物体が外部からの作用によるものなのか、重力場の影響なのかを区別することはできるだろうか?運動している物体自体はそれを区別することができない、ということが何を意味するのか?
ニュートン力学では、軽い物体よりも重たい物体の方がより強く引き付ける。だが、重たい物体の持っている慣性質量によって、重力の引き付ける力にちょうど同じ強さで抵抗し、結局すべての物体は同じ加速度を持つことになる。この現象は一つの共変性を示している。共変性とは、いくつかの物体がある系で運動している時、一つの変化が共通して変化しているように見えるが、別の系から眺めると異なって見えるということである。しかも、その異なり方は、系の変換によって具体的に記述できるとした。
アインシュタインは、共変性を拡張して加速する系にも当てはめることを考えたという。基準座標系が加速しているとしたら?と。この定式化によって特殊相対性理論から一般相対性理論を構築するに至ったという。特殊相対性理論が等速運動の系を記述したとすれば、一般相対性理論は加速度運動の系を記述したというわけか。アインシュタインの重力理論に扉を開かせたのは、ヘルマン・ミンコフスキーの影響だという。ミンコフスキーは、物体の三次元座標(x,y,z)に時間軸を加え、ピタゴラスの定理を適応したという。
 S^2 = x^2 + y^2 + z^2 - (ct)^2
四つ目の項は時空を示していて、今日ではテンソルと呼ばれる形式で座標変換される。数学者の思考では、時間もまた通常の次元と平等に扱うわけだが、数学上のテンソルは階数によって複雑さが格付けされる。階数とは、物理学では次元に相当するのだろう。ミンコフスキーはテンソルによって時空までも統合したというわけか。
ところで、美しさという意味では、明らかに E = mc^2 に劣る。アインシュタイン自身も「半分は高級大理石でできているのに、もう半分は粗悪な材木でできているようなものだ」と嘆いたという。そして、残りの生涯を賭けて、その修繕にかかったが無駄な努力に終わる。そんなわけで、この難解な方程式をほとんどの人は鵜呑みにするしかない。自然界の理解という観点からすると幸か不幸か?ニュートンを超えたのか?超えていないのか?アル中ハイマーには分からん!

9. シュレーディンガー方程式
 d^2U/dr^2 + 2(a + 1)/r dU/dr + 2m/K^2 (E + e^2/r)U = 0 ...なんじゃこりゃ?

「ある粒子がある位置で検出される確率として解釈された系の量子状態は、時間とともに変化する。」
プランクは、黒体輻射にも古典論を適応するために、量子という概念を持ち出した。光を吸収したり放出したりする振動子のエネルギーは、ある特定のエネルギー量の整数倍になるような波長の光量だけを選択すると仮定すると、古典論がうまく適応できるという。アインシュタインも、光電効果で量子の概念を拡張して、エネルギーが量子の整数倍という離散数でのみやり取りされるのは、振動子がそのように選択しているからではなく、光そのものが粒子的だからだと説明したという。
古典物理学では、電子はエネルギーを放射しながらいずれ原子核に落ちることになる。だが、そうならないのはなぜか?ボーアは、「電子は、特定の離散的な量でしか輻射を放出したり吸収したりできない」と仮定すれば説明できるとした。原子内部では、電子は限られた軌道や状態でしか存在できないし、そのような状態どうしで飛び移るのに要するエネルギー分しか吸収したり放出したりできないというわけだ。
しかし、状態やエネルギーが離散的に変化するというのも奇妙な話だ。量子飛躍なんて聞くと頭が痛くなる。だから、学生時代から「元素の周期表」なんてものが大嫌いだ!どう考えたって、人工衛星は徐々に地球に近づいて落下するし、その軌道が飛躍するなどとイメージできない。電子軌道が波長の整数倍でしかありえないとはどういうことか?宇宙戦艦ヤマトが時間の波の頂点と頂点の間をワープするようなものか?
現象を確実に説明できないとなれば確率論に頼るしかない。マクスウェルもアインシュタインも仮の措置として統計論を用いる。そして、統計論を普遍的な原理に押し上げたのはハイゼンベルクとシュレーディンガーだという。ハイゼンベルクは、行列力学によって量子力学を計算するが、すこぶる使いにくいツールだそうな。対して、シュレーディンガーは、古典的なツールである連続関数による波動方程式を使い、時空の中で連続的に展開するプロセスを記述したという。つまり、波動で示すことによって視覚化可能なものとした。シュレーディンガー方程式は、未知の波動関数ψを含み、波長を運動量に、振動数をエネルギーに結びつける。ψは状態の確率を示すわけで、つまりは粒子の存在確率を示すことになりそうだ。但し、本書の式はψで表現されてない。

10. ハイゼンベルクの不確定性原理 : ΔqΔp ≥ ħ/2
「空間の小さな領域のなかに粒子の位置を特定すると、その粒子の運動量は不確定になり、また、逆に運動量を特定すると位置は不確定になって、全体としての不確定性は、ある特定の量に等しいか、それより大きくなる。」
量子の世界では、運動量と位置が同時に決定できないことを主張している。尚、pは電子の運動量、qはその位置。
「量pが平均誤差p1で表される精度内で特定できる場合...qを同時に特定しようとすると、q1 ≈ h/p1 という平均誤差で表される精度内でしか与えられないというのがその性質だ。」
量子の世界では、通常の乗法が成り立たない。掛け合わせる順番が違えば、経路も変わってくる。古典論では必ず ab = ba が成り立つが、量子論では、ab ≠ ba という場合があり、交換則が成り立たない。そこで、数学では行列式が強力な道具となる。行列は次元を一般的に表現でき、行列どうしの乗算はその順番が問題となるからだ。行列で一般の四則演算が可能なのは、対角行列のような特殊なケースのみ。
ハイゼンベルクは、覚悟を決め時空を放棄したという。原子の領域では、粒子や物体という概念を消し去るところから思考が始まる。それはニュートン的存在論の否定である。シュレーディンガー方程式が波動力学で示したのに対して、ハイゼンベルクは行列力学で示した。物理学者にとって、波動関数の方が馴染があったようで、当初はシュレーディンガーの方が優位にあったようだが、どうしても離散的な現象がひっかかる。シュレーディンガーとハイゼンベルクの論争は連続性と離散性の対立とも言えそうだ。精神の存在を説明しようとすれば、連続性では無理があり、あるかないかの離散性であるのだけど...
E = mc^2 の方がはるかに知名度は高いが、その式が成り立つのは限定された条件下だけということになる。抽象度の観点からすれば、不確定性原理の方がはるかに高いレベルにある。それは、科学と精神の融合であり、ある意味、主観と客観ですら抽象化しているのかもしれない。精神の最も高度なレベルは不確実性であり、最も崇高なものが「気まぐれ」というわけか。ハイゼンベルクは、「気まぐれ」ですら数学で証明したのか?
彼は「中間的リアリティ」という言葉を使ったという。不完全で半ば抽象的な存在ってことか?現実や実存といったものは単なる象徴概念であって、本質的な存在は人間の認識できない領域にあるのかもしれん。最初から、視覚化できない!認識できない!ことを覚悟すれば、心地よい世界へと導かれるのであろうか?

2011-10-09

"禁断の市場" Benoit B. Mandelbrot & Richard L. Hudson 著

フラクタルの父と呼ばれるベノワ・マンデルブロ氏。彼が亡くなったと大々的に報じられたのは一年前のこと(2010.10)。実は、彼の著書「フラクタル幾何学」を探していたのだが...まぁいい、人生行き当たりばったりよ!
マンデルブロ氏は、インタビューで経済学者を名乗り、金融工学は科学的に未熟で、過信すればすぐに破綻すると指摘した。そぅ、偉大な数学者が経済学に殴り込みをかけたのだ。その予想は的中し、世界はリーマンショックを皮切りに金融危機を経験することになる。1929年の世界恐慌以来、おそらく経済危機の伝統は受け継がれていくだろう。いまだ人類は、市場という複雑系を科学的に解明できるほどの有効な分析ツールを見つけられないでいる。せめて最大リスクを回避するための手段はないものか?本書は、まさしくその手段を提唱する。

ここで、古いジョークを一つ。
技術者と物理学者と経済学者が、海で遭難しましたとさ。
やっと辿り着いた無人島は砂ばかりで、食べられる物といえば豆の缶詰一つだけ。さて三人の意見は?技術者は石で缶に穴を開けて豆を取り出そうと言った。物理学者は缶を太陽熱で膨張させて破裂させようと言った。そして経済学者は、考えた末に「まず、我々が缶切りを持っていると仮定しようじゃないか...」と語り始めた。

運の委ね方にもいろいろあろう。確率論もその一つだが、賭けるものが大きくなれば客観的な視点は失われる。経済人には最大利潤を求める価値観があるが、その根底に安全運用という思考が働かなければギャンブル性を高める。企業家は従業員の生活に責任を負い、真っ先に倒産のリスクを計算する。一方、金融屋はわざわざリスクを複雑にして、世間を欺瞞する金融商品を続出させる。金融理論では、グローバル市場における暴落の可能性を過少評価し、専門家よりも一般の人々の方が危険性を直観的に感じているように映る。
金融理論が金儲けのツールとしてほとんど役に立たないことは、過去の市場経済が証明してきた。しかし、ちょいと視点を変えてリスク管理ツールとして眺めれば、そこそこ活用できることも確かだ。市場価格の分析では、絶対価格を追い求めるよりボラティリティを観察する方がずっと現実的であろう。それは、相対的な価値観にしか到達できない知的生命体の宿命であろうか。はたして、市場を完全に理解するということが、どれほど現実味を帯びているのだろうか?
数学者コルモゴロフ曰く、「サイコロを振るような過程でも、集合として全体を見ると、本当に美しい法則がある。そのような法則から生じる運を見積もることに、確率論の存在価値がある。」
政治や経済の最も重要な役割は、好景気に導いてみんなを裕福にすることではない。いかに経済的危機を避けるか、いかに耐え難い格差を抑制し基本的人権を守るかである。したがって、その視点はリスク管理にかかっているはず。一時的に景気を煽ったところで、その反動で不況の波が必ずやってくる。瞬間的に誘導した資本の流れは、経済循環に歪を生じさせるだろう。ある産業で景気を良くしようと企てたところで、別の産業にシワ寄せがくるだろう。それが経済サイクルというものである。

あらゆる現象を分析する上で、統計学の果たす役割は大きい。だが、数学の中でも少々異質に見え、肌が合わない。それは、いかに分布モデルに当て嵌めるかということに囚われ過ぎるように映るからである。ド素人感覚で言うならば、関数の直交性や対称性から地道に解析すればいいのに...と思うのだが、おそらく複雑系を相手取るような分野では、なんらかの法則や型に嵌め込んで近似する方が現実的なのだろう。そのアプローチでは、まず正規分布を仮定するのが一般的で、平均値や分散だけで統計モデルを決定しようと考える。そこで必ず例題として用いられるのが、学業成績や身長分布である。確かに、最も単純なところからモデリングするのが筋道であろう。しかし、自然界を眺めると正規分布をする方が珍しい。
そもそも「正規」ってなんだ?身近な現象では、突風のゆらぎ、金属の断面のギザギザ、凸凹した海岸線、地震の揺れなど... 物理現象では、ブラウン運動、熱伝導、フリッカー雑音、太陽黒点の変動など... ほとんど変則的で乱流的な性質を持っている。乱流の間欠性は、物理学では空洞実験などで古くから知られており、むしろ、ランダム性の方が「正規」と呼ぶに相応しいのではないか。経済学においても、伝統的に正規分布を仮定したモデルで金融理論を構築してきた。だが、市場経済もまたランダムウォークしやがる。おまけに、自然現象だけでなく、人間の思惑まで絡むという複雑怪奇!
そこで、フラクタルの登場だ!それは、図形の部分が全体と自己相似形になっているような幾何学的概念である。マンデルブロ氏は、人類にとって絶望的とも思える複雑系の中にフラクタルという法則性を見出した。根底の考えには「ベキ分布」があり、そのスケールは想定外で発生することを盛り込む。ちなみに、ベキ分布とは分布関数がベキ乗則に従うようなやつだ。正規分布では平均所得層が最も多いことになるが、ベキ分布では多くの富がほんの少数の富裕層に集中することが説明できる。
その分析方法は極めて単純だ。図形の部分と全体が相似形になる基本パターンを抽出し、そのパターンも数か所の点を持つ折れ線グラフを用意するだけ。あとは、パターン図形の拡大縮小率や縦横比率を調整したり、反転や左右対称などの幾何学的操作と組み合わせて近似する。これが「マルチフラクタル」の概念である。単純とはいえ、折れ線グラフは傾きや折れ曲がる場所をパラメータとするだけで無限のパターンが生成できるので、実際にはそう簡単にモデルを決定することはできないだろう。
カオス理論は、数値シミュレーションで想定した値にほんの少し誤差があるだけで、結果が大きく変わることを教えてくれる。この思考方法は微分に似ている。最も単純な折れ線グラフは三角形であるが、三角形で微分しているようなイメージだ。したがって、統計学というよりは解析学に近い、いや!幾何学と解析学の融合と言った方がいいかもしれない。自己相似性を用いて解析するとは、総体としての自己を根源的な自己で見つめ直すということに通じるような...自然法則が無限循環論に嵌り自己矛盾に陥るとすれば、これは自然学的な発想なのかもしれない。ちなみに、フラクタルという名のカクテルがあってもよさそう...酔えば酔うほどフラフラくたる...ランダムウォークとは千鳥足のようなものよ!

1. 異端の科学者
マンデルブロ氏はユダヤ人の家庭に生まれ、戦争体験から派閥に属さず独自路線を歩んできたという。プリンストン高等研究所では、フォン・ノイマンの最後の教え子となる。その後、IBMのトーマス・J・ワトソン研究所に勤務し、コンピュータの通信エラーの統計解析を行う。ついでに、社長の依頼で株式市場の価格変動を解析したという。1962年、金融工学の標準的モデルを否定する論文を発表し、正統派経済学と真っ向から対立する。
「経済学は流行りすたりのある学問分野です。自然科学でも似たようなところはあるのですが、特にこの学問のなかでは何が正しいのか、どんな研究が博士論文に値するのかについては、多数の合意、あるいは流行で決められる傾向があります。」
マンデルブロは、経済分析にベキ分布を取り入れた最初の人物だそうな。価格分布でファット・テールと呼ばれる長い裾野があるという考えは、今では広く受け入れられる。彼の提唱したベキ分布の理論は、安定分布、パレート分布、レヴィ分布、レヴィ=マンデルブロ分布など、様々な名で呼ばれるという。非整数ブラウン運動という確率過程と、その根底にある非整数階の微積分という概念も、近年、計量経済学の技術として用いられるという。また、市場がいかにバブルを生み出すかを定量モデル化しているという。後の研究者の手柄にされているようだけど...
彼は、マルチフラクタル・モデルを提唱し、「経済物理学」という新たな分野を切り開いた。そして、経済学の影の功労者として殿堂入りするに相応しい人物だという。

2. フラクタル幾何学
その名称は、「分解された」、「壊された」を意味するラテン語を元にした造語だそうな。例えば、樹木の枝やカリフラワーの小房、川の分岐などは、自然界に存在するフラクタルの代表である。
フラクタル幾何学では、ランダム性を単純な方からマイルド、スロー、ワイルドの三状態で分類するという。従来の金融理論では、単純なマイルド型が想定されている。それはコイン投げの確率と同じモデルである。確かに、コインを投げて表と裏が出るグラフを作成しても、株価チャートと見分けがつかないような傾向が見られる。本書は、実際の市場は最も複雑なワイルド型であると指摘している。マイルド型では一人の人間が歴史に影響を及ぼすことはないが、ワイルド型ではたった一人が歴史を大きく変える可能性があるという。そして、ホワイト・ノイズや熱エネルギーによる電子の動きは比較的予測可能でマイルド型、コンピュータの通信エラーや1/fノイズはワイルド型だとしている。
フラクタル幾何学では、全体と部分で繰り返しの構造に注目するので、分析と統合が同時に行われるという。基本は、イニシエータ、ジェネレータ、代入の規則、この三つがセットになってフラクタルのコードが構成される。最も単純なフラクタルは、ユークリッド幾何学の基本図形から出発する。三角形、直線、球がイニシエータで、フラクタルを作るための雛形になる単純な幾何学パターンがジェネレータである。どの方向にも同じスケールで拡大や縮小をすると元の形が現れる。この性質が自己相似性だ。ジェネレータはいくつか用意しておき、使う順番を乱数で決めたりする。
しかし、価格変動モデルでは、縦軸が価格で横軸は時間を表しそれぞれの性質は異なるので、縦軸と横軸の拡大率を変えないと同じ形が見えてこない。このような軸方向性を持つような相似性を「自己アフィン」と呼ぶそうな。更に、基本パターンごとに拡大縮小率を変え、左右対称、上下対称、スケールの相似といった組み合わせでマルチフラクタルを形成していく。

3. マルチフラクタル・モデル
市場予測では時間を横軸とするのが普通である。注目すべきは、物理時間と精神時間を区別して導入しているところである。ニュースが飛び交って売買注文が殺到する時もあれば、際立ったニュースもなく穏やかな時もある。そこで、一定に刻まれる物理時間ではなく、取引活動に基づいた「トレーディング時間」を想定する。時間方向と価格変動方向を分解するようなモデルを導入するわけだ。
フラクタルでは全体を一定の割合で縮小すると部分が再現できるのに対して、マルチフラクタルでは一つのパターンの中に複数の拡大縮小の特性を持っている。また、二つのパターンの特性を引き継ぐようなパターンをデザインすることもできるという。本書は、父親パターンと母親パターンから、それぞれの特徴を引き継いだ子供パターンの幾何学的な作図法を紹介している。これは感動ものだ!
母親パターンには物理時間を横軸にしたランダムウォークを用意し、父親パターンにはトレーディング時間に変換したランダムウォークを用意する。そして、その二つの特性を融合したマルチフラクタルが得られるという寸法だ。ここでは、フラクタル市場の立方体までが紹介されるが、次元は好きなだけ増やすことができそうだ。
時間の伸び縮みの処理方法は、数学的には「乗算カスケード」と呼ばれるそうな。ここでは、金鉱石を産出する地域の解像度を次第に上げていくようなイメージが紹介されるが、ウェーブレット変換に似ている。ウェーブレット変換は、思いっきり単純な関数の直交性を利用して成分を分解する。フーリエ変換にしても、正弦波と余弦波の直交性を利用して成分を分解する。なるほど、思考の原理は同じかぁ。ただ、マルチフラクタルは、幾何学的に何次元でも拡張できそうな予感がする。
更に、複雑系の現象として、突然現れる危機的な現象と、周期的に見える長時間相関の二つの激動の形を考察している。価格の大きな変動が一度現れると、ある程度持続する傾向もあれば、同じ方向の変動が単純に続くこともある。あるいは、それらの傾向が突然止まることもあれば、変動が逆向きになることもある。過去の事象が長時間相関の記憶効果によって、どの程度影響を与えるのかはまるで気まぐれだ。
そこで、この二つの形を検証する手段として、ハースト指数(H)と指数アルファ(α)を紹介してくれる。Hは、0から1の値をとり、0.5より大きければ持続性を示し、0.5より小さければ持続性を示さない。αは、値が低い時は突然の変動を起こす可能性があり、値が高い時は標準モデルに近い振る舞いをする。Hはトレンド性が見えやすくなり、αは市場リスクが見えやすくなるというわけか。

4. 凸凹とフラクタル次元
100年ほど前、リチャードソンという研究者は国境線の長さの矛盾を指摘したという。スペインとポルトガルの国境線の長さは、スペイン側は987km、ポルトガル側は1214kmとしているそうな。オランダとベルギーの国境線の長さも、オランダ側は380km、ベルギー側は449kmとしているそうな。正確な微分ができなければ近似するしかないわけだが、基準の物差しを短くすると海岸線の長さがどんどん長くなる。
この現象を特徴づけるために導入されたのが、「フラクタル次元」だという。直線ならばフラクタル次元は1となる。しかし、イギリスの海岸線は1.25、オーストラリアの海岸線ではもう少し滑らかで1.13、南アフリカの海岸線は1.02、といった具合に半端な数字になる。分岐を繰り返す気管支の先に広がる肺胞の表面積は、テニスコート一面分もあり、肺の表面のフラクタル次元は3に近い値になるという。肺の中の気道はきわめて入り組んでいて、ほとんど3次元空間を埋め尽くすというわけか。
フラクタル次元とは、図形の凸凹の様子を定量化する量ということになる。そして、あらゆるランダム性をフラクタル次元で表すことができるかもしれない。音楽や絵画や...精神も...

5. 金融理論も捨てたもんじゃない!
本書は、正統派金融工学が生み出した三つの理論の優れた点を考察している。それは、CAPM(資本資産価格モデル)、MPT(現代ポートフォリオ理論)、ブラック=ショールズの公式である。これらは、経営学修士(MBA)を取得するのに必須科目だという。
銘柄ごとに平均と分散などのグラフを描けば、リスクの高い銘柄と低い銘柄が見えてくる。そして、リスクとリターンの按配から、好みの銘柄を集めて独自のポートフォリオが作成できる。この概念は分かりやすく、投資をする上でまず勉強するところであろう。株式だけでなく債券や為替などを盛り込むこともできる。
CAPMは、ポートフォリオ理論を単純化したもので、株式指数型投資信託の概念を生んだ。
更に、ブラック=ショールズの公式の登場で、市場と同様にオプション価格を随時計算できるようになった。金融派生商品の価格づけに現れる確率微分方程式を編み出し、リスクに値段を付ける仕掛けを作ったわけだ。これらの理論が、投資をギャンブル性から工学へと持ち込んだ。フラクタル分析は、このあたりの理論の発展形と捉えることもできそうだ。
ところで、リスク管理のために世界中の銀行で使われるVaR理論というものがある。それは本当に機能しているのか?まさか、みんなが同じリスク管理思考に陥っているから、一斉に金融危機として現れるということはないよなぁ?BIS規定のような国際基準を設けるのもいいが、リスク分散には多様性に鍵があるような気がするけど。重要なのは規定ではなく、運用状態の情報の透明性である。危険な運用者がいたとしても、まともに情報が開示がされていれば、金利が上昇するだけのこと。市場には危険を好むギャンブラーが多いのも事実であり、彼らを単純に否定することもできまい。金融機関がいかに安全運用しているか、その努力で競争の原理が働くように誘導しなければ、規定は言い訳にされるだけであろう。

2011-10-02

"巨大企業が民主主義を滅ぼす" Noreena Hertz 著

前々からノリーナ・ハーツ女史の書を読んでみたいと思っていたが、なんと絶版中ではないか!いつでも入手できると侮っていたら...てなわけで図書館へ。
今日、どこの民主国家でも選挙の投票率は低下傾向にあるらしい。それは民衆の無言の抗議を示しているのか?それとも政党政治の限界を示しているのか?いまや政治不信は世界的風潮となりつつある。社会人類学者レヴィ=ストロースは原始社会の研究において、政治的首長は社会の必然から生じるものではないという見解を示した。ニーチェ風に言えば、政治家は余計な人々というわけか。これは真理かもしれない。グローバリズムの真の姿とは、政治家不要説ということか?...そんな予感をさせてくれる一冊である。

巨大化する多国籍企業が巨額な政治献金を行えば、政治家の行動を縛ることになる。民間企業がなんの見返りもなく資金提供するとは考えにくい。アメリカのように国民皆保険の設立を夢見たところで、反対派の保険業界から多額な献金を受けていては骨抜きにされるのも仕方があるまい。政治家がどんなに立派な公約を掲げようとも、選挙を介さない連中によって政治が動かされる現実がある。
本書は、「企業による無言の乗っ取り!」の実態を暴き、資本主義とグローバリズムの行き過ぎが引き起こす民主主義の衰退に警鐘を鳴らす。そして、政治や企業に対して市民の新たな関わり方を提唱する。これは反資本主義を唱えたものではない。過去に資本主義が富を生み、自由の尊さを教えてくれたのは事実である。資本主義以上の社会システムが模索できない今、このシステムに改良を続けていくしかあるまい。
ただし、我が国はこのようなレベルで経済政策や国家政策を議論できる土壌が、まだできていないことは虚しい。政策が悪いという前に将来計計画がない。善悪はひたすら結果論で評価され、その場のギャンブルに委ねられる。政治屋は、数の派閥を利かせるには、無思想、無理念のチルドレン議員を多く輩出することが最も効果があることを知っている。そして、次の政策には反省を盛り込むことすらできず、問題先送りの泥沼に嵌り込んでいく。これは、世論調査ばかりを気にする日和見政権が長期化することの悲劇であろうか。説得する政治は、いまだ見ることができない。将来ビションに対する説得がなければ、なんで増税議論ができようか。

民主政治にとって選挙が絶対的な制度とは思わない。それでも、現時点で人類が編み出した最も実践的な制度であることは確かだ。政治家たちは選挙制度を自らの手で機能不全に陥れてきた。そもそも選挙制度を国会で決めることに矛盾がある。現制度で当選した連中が、わざわざ見直すだろうか?「泥棒が刑法を作っているようなもの」とは、よく言ったものだ。おまけに、国対が存在するとは憲法違反ではないのか?憲法第41条に「国会は、国権の最高機関であって、国の唯一の立法機関である。」と記されているにもかかわらずだ。
政治支援団体は資金をちらつかせ、政治屋はその資金で選挙戦略を練る。いわば脅し屋とたかり屋の構図がある。もはや「清き一票」を信じる人は少数派であろう。支援団体や献金の規模の違いはあれど、どこの民主国家でも原理は同じだ。
しかし、献金する企業が悪いとばかりは言えない。現実に、実業家の中には慈善活動に従事する人々がいる。彼らは、その成功が不必要な格差を生じさせたと罪を感じ、懺悔心でも抱くのだろうか?実業家は現場を知っている。そうでなければ事業は成功しない。現場に則した実践的な政策立案のできる能力やマネジメント能力を持っている。政治家のように上辺の政策とは根本的に思考水準が違うはずだ。もし、彼らが倫理観に目覚めることができれば、これほど政治的に役立つ連中はいないだろう。
「行政が後ずさりすれば、企業は新たなチャンスだ。政治はこれまでになく曖昧にブランド化された商品となり、企業は社会と環境に対する責任を負うことによって、道徳的というありがたい評価を得るとともに、実際のビジネス面でも利益をあげることができる。」
とはいっても、企業の本来の性格は利潤を求めることにある。経営不振ともなれば、生産効率の悪い部門から削られ従業員は解雇される。慈善活動は余裕のある範疇でしかできない。対して、政府は耐え難い格差や不公平社会を抑制するために存在し、ボランティア的な性格がある。だが、財界と政界が癒着するならば、どうして資本主義や自由主義の暴走を防ぐことができようか。

では、企業を倫理的に導くことはできるだろうか?反社会的な領域に及ぶ利潤追求は、透明性のある情報公開によって抑制することができるだろう。近年、内部情報の漏洩や内部告発が企業イメージを失墜させ、その存続を脅かす。ただ、社会的制裁は情報の正確性があってはじめて機能するもので、エセ情報が流布したおかげで非のない企業にダメージを与えることもある。
では、情報の正確性を誰が検証できるのか?マスコミは信頼できるのか?マスコミもまたスポンサーに逆らえないし、大企業や政府の圧力を受けやすい組織であることは周知の通りである。いまや報道屋は政治屋と同じくらい、いやそれ以上に胡散臭いとされるが、そんな疑惑をマスコミ自身が報じるわけがない。近年、インターネットは、大手マスコミが語ろうとしない情報が得られる点で社会的役割が大きい。現実に、北アフリカや中東でソーシャルメディが改革運動を高めた。だが、欺瞞やエセ情報が流布しやすいのも事実だ。
んー...どこにも浄化作用が見当たらない。
本書は、個々の自由意志で参加する民衆運動を訴えている。マスコミにも、政府にも、企業にも、民衆の眼で圧力をかけようというわけだ。これが具体的で最も現実的な方策であろうか。不買運動やボイコットといった民衆運動や消費者運動は社会的意義が大きいので、大企業や政府も無視できないはず。ただ、民衆が偽情報で扇動されると厄介なことになる。人間は個人では冷静でいられても、群衆化すると感情論に煽られ暴徒化しやすい。となれば、個人の能力として情報の目利きが要求され、個々で思考して行動することが求められる。
...などと言えば、民主政治とはなんと難しいシステムであろうかと絶望感に苛まされる。やはり、シャングリ・ラのような超高齢化社会でもなければ、精神が成熟できず実現できそうにない。
んー...人間の悪魔化を抑制する手段は、それぞれの業界の緊張的関係しか思いつかない。競争の原理とは、「毒を以て毒を制す」を意味するのか。

1. 諸悪の根源
本書は、英国でサッチャー政権が米国でレーガン政権が誕生したあたりに諸悪の根源があるとしている。新自由主義と叫ぶ連中が「レッセフェール!」を布教しながら市場シェアを拡大したために、市場は制御不能な怪物と化したと。「小さな政府」をスローガンにWTO、IMF、世界銀行が世界各国に圧力をかけてきたことは周知の通り。そこで決まって福音されるのが、「富裕層が貧困層を牽引して、経済を回復させる...」だ。しかし、富裕層が潤った頃に景気は再び後退局面に向かう。これが経済サイクルというものか。
株価が上昇したところで、庶民の生活が向上するわけではない。だが、株価が暴落すると思いっきり庶民の生活を圧迫する。この一方向性はなんなんだ?エントロピーの法則なのか?容認できない二極化は、かつての貴族社会のように階級を固定化する。財産という優位性によって、富裕層の子孫たちが明日のリーダーを担うような社会がまともなのか?
経済学者アマルティア・セン曰く、「穀倉が作物いっぱいなときでも、飢饉が起こりうる。」
冷戦構造が終結し、イデオロギー対立による軍事的脅威が収まると、政治の主な役割は経済に向けられた。むかーし、社会主義や共産主義は福祉の分配に成功していたかに見えた。だが、腐敗から巨大官僚主義が蔓延るまでに時間はかからず、結局、貧民から搾取するシステムとなった。そして今、資本主義が同じ轍を踏んでいる。冷戦構造は、資本主義の暴走を抑制するために、ある程度機能していたのだろう。単一のイデオロギーしかない世界では、民主主義は自身の本質を見失うのだろうか?かつての共産主義圏ですら資本主義や自由主義の成功に憧れて、欧米式の経済コンサルタントを受け入れた。その最たるものは、ノーベル賞経済学者を擁したドリームチーム「LTCM」だ。その結果、世界規模の経済危機を招き入れ、市場経済への信頼を失墜させた。そして残されたものは、耐え難い格差社会と不公平社会であった。これがグローバリズムの正体か?小さな政府は、なんでもかんでも民間に委託すればいいと考える。そして、国家防衛の要である軍事を専門とする企業が出現した。次は、政治を専門とする民間企業の出現か?

2. 無言の乗っ取り!
今日、経済政策は消費主義と同一視され、政府は相変わらず消費を煽る。経済循環は消費に見出すしかないのか?人類が相対的な価値観しか見出せないならば、経済循環も相対的なものとなるはず。絶対的な経済循環というものが認識できなければ、循環は欲望とともに拡大を続けるしかないだろう。
いまや国際的巨大企業の力は、中小国家を凌ぐほど強大化している。ヘッジファンドなどの投機家の資金力は、国際経済に影響を与えるほど怪物と化した。金融市場は、続々とデリバティブやオプションを発明していき、新しい金融商品は爆発的なキャピタルフローを生み出す。それに通信コストやコンピュータ処理の低コスト化が輪をかけ、もはや政府は海外投資に規制をかけることもできない。
しかし、増え続けたのはポートフォリオ投資だけではない。80年代あたりから、企業は生産拠点をより効率のいい場所に移し、前例のないペースでグループ企業が設立された。
本書は、最大規模の多国籍企業100社で、グローバルな外国資産の約20%を支配していると指摘している。最大規模の多国籍企業6社のそれぞれの年間売上は1110億から1260億ドル。GDPで上回るのは21か国に過ぎないという。ウォルマートは、ポーランド、チェコ、ウクライナ、ハンガリー、ルーマニア、スロバキアを含むほとんどの中央ヨーロッパ、東ヨーロッパ諸国よりも収入が多いそうな。この傾向は21世紀になっても衰えず、多国籍企業は合併を繰り返す。そして、政治と癒着し、選挙とはまったく無関係に国家を乗っ取るほどの力を発揮する。各国はIMFや世界銀行に門戸開放政策を押し付けられたが、利益を得たのは多国籍企業だけではない。多国籍企業が進出した相手国政府と腐敗した役人、外国企業に就職できた幸運な人々などがいる。
本書は、第三世界では売国奴となりさがる政治屋が蔓延り、不正行為に慣れっこになったと指摘している。政治屋は、選挙資金を盾にこのゲームに積極的に参加したというわけか。正義、公正、権利、環境、さらに国家安全の問題でさえ、なおざりにされたという。
自国の企業利益が絡めば、軍事独裁国家や人権侵害国家ですら援助し、もはや民主国家の誇りすら感じられない。ここには、経済が政治よりも重んじられ、市民は単なる消費者とみなされ、人権など無視される実態がある。しかし、企業に道徳観念がないわけでもないという。社会的責任、持続しうる経済循環、環境への配慮などを訴えるのは、むしろ政府の大臣よりも企業のCEOであろうという。政治家は、企業の暴走を抑制するというよりは、むしろ助長する側にいるのかもしれない。

3. 最後のシャングリラ?
人口約60万のブータン王国は、最後の独立ヒマラヤ公国で、チベットとインドの間に位置する。一人当たりの所得550ドルといえば貧困国とされるが、この数字だけでは誤解を招きそうだ。国民の85%が自給自足農業に従事し交換取引が当たり前だから、衣食足りてホームレスがほとんどいないそうな。成功は、環境、倫理、精神の発展に基づいて決定され、道徳性と教養は物質的富にまさるとされる。入国する旅行者は6000人(1998年)と少なく、旅行客の一人一人に行動規範が渡されるらしい。チップを渡さないこと、現地の子供たちに物を与えないなどは、物乞いをさせないためだとか。商業施設や宿泊施設も、環境破壊につながるとして建てられない。ブータンの仏教はエコロジーを重んじるそうな。
C・ドルジ計画相の言葉が紹介される。
「わが国は、何でも現代的なものを無批判に受け入れる、ということはしません。過去に発展の道を歩んだ人たちの経験に頼り、私たちの能力と必要にふさわしい足取りで、じっくり現代化に取り組むつもりです。そうしてわが国の文化、伝統、価値体系と制度を持っています。」
しかし、グローバリズムの波はこの国にも及んでいるようだ。バスケットは国技となり、NBAが人気を博すという。インターネットも普及し、農家は農作物を売り外貨を得ているという。シャングリ・ラのような価値観を持った国は、ごく少数派として俗世間から隔離しないと実現できないのだろうか?ジェームズ・ヒルトンの小説のように、250歳ぐらいまで生きないと到達できない価値観なのか?

4. 産業スパイ
1947年、ソ連を監視するために米英の諜報機関が組んで「エシュロン」を組織した。後に英語圏のカナダ、オーストラリア、ニュージーランドが加わる。
しかし、ソ連崩壊後も電子機器を使ったエシュロンの監視は続く。自由主義を脅かす国に向けられるのではなく、米英の同盟国の事業を傍受する商業活動に変貌したという。あらゆる通信が傍受され、他国の企業活動の情報を自国企業に流していた。この驚愕な事実が表面化したのは2000年。機密扱いを解かれたアメリカの防衛関連文書がインターネットに公表された。政府が営利目的で動けば、企業は政治資金を差し出すであろう。ドイツでは発明や開発計画が盗まれたことが明るみとなり、その損失は年間100億ドルに上るという試算もあるとか。もちろん日本企業も餌食にされ、東南アジアで受注されるはずの契約がアメリカ企業にかすめ取られたという。クリントン大統領は産業スパイもCIAの任務だと明言したという。
「ボーイングにとってよいことは、アメリカにとってもよいことだ。」
そもそも、産業スパイを企てない国の方が珍しい。欧州連合の報告書は、フランスとドイツが共同して、北米と南米の双方を盗聴していることを明らかにしたという。中国は海外留学生と科学者に商業的機密を本国に回すように奨励しており、日本は産業スパイの達人だという。かつて総合商社が、日本企業の情報戦略として機能したことも確かであろう。そうでなければ、政治が三流でありながら経済大国にまで伸し上がった理由が説明できない。しかし現在は、海外勤務を拒む商社マンが多いという噂を耳にする。

5. カネがなければ選挙にならない!
「贅沢な資金が手に入る人しか立候補できないのに、どうして自由で公平な選挙ができるだろうか。」
政治家は、優秀なコンサルタントや、マーケティング、マネジメントのプロを雇い、効果的なメディア戦略を練る。アドバイザーや広告業者は、政治家よりも有名となる。いまでは、政治屋がバラエティ番組に出演して選挙運動をするといった現象まである。政治理念の相違点がはっきりしなければ、単純に資金力の差がものをいう。そして、企業にとって良い投資先となる。税制においても、政治家にとって必ず有利な方向に働き、継続的な癒着をもたらす。この論理からすれば、政治は腐るしかないではないか。
対して、企業側もうかうかとはできない。政治資金を提供しなければ、すぐにでも独占問題で非難の的にされる。実際、アメリカ政府がマイクロソフトの独占を問題視したのは、ビル・ゲイツがしかるべき時期に政治献金をせず、時流に乗ったロビー活動にも参加しなかったことが原因だと言われる。なるほど、ある業界に有利な法案が通る時は、その方面から多額な企業献金がなされたと思えばよさそうだ。かつて煙草産業の宣伝広告塔とされたF1マシンだが、F1界の実力者バーニー・エクレストンが献金すれば、イギリスは煙草企業による自動車レースの後援に反対しなくなった。政治献金の方法は、どこの国でも法律すれすれのグレーゾーンで行われる。そして、怠ればスキャンダル沙汰かい。

6. 消費者運動
「多国籍企業の間では政府は弱い、国民国家はもはや世界における力の中心ではない、政治家にはもはや企業をリードできず、企業のほうが政治家にできることとできないことを教えているのだ -- こう思った今では、もう政治家に働きかけるのをやめている。その代わり、新たな政治的権力、企業に対してストレートに動こうとする人々が増えている。」
政治的行動を起こすために最も効果的なやり方は、スーパーマーケットや株主総会で直接意思表示することだという。民主的先進国では、人々は投票する代わりに買い物をする。そして、非倫理的企業に抗議するには、企業イメージを非難し、その製品を買わないことだと。ただ安いからといって飛びつく消費行動が民主主義を崩壊させるというわけだが、生活が苦しければ誘導することも難しい。それに、民衆が企業情報をいかに正確に入手できるかにもかかっている。となれば、そこで暗躍できるのがメディアということになる。民主主義社会では、メディア支配の社会になりやすい。
「ニュースの消費者として、他の業界を監視するようにメディアを監視することは不可能だ。メディアが独立した外部の力に対して説明する責任を負わなければ、民主主義の死活にかかわる報道の自立性が危険にさらされることになる。」
政治や企業にとって、主要なジャーナリストと仲よくなるのが効果的というわけか。報道倫理に関する委員会なるものが、どこまで第三者機関として機能するだろうか?検証機関というものは、世論の非難を避けるために組織され、政治力が思いっきり働いて弱い者いじめをする傾向がある。伝統的なメディア、政府、企業、シンクタンク、研究機関から提供される情報と誤報が錯綜する中、消費者にとって新たな情報源が必要であろう。NGOや圧力団体の活躍に頼るのも一つの方法であろうが、彼らもまた暴走する可能性がある。民主主義の根幹は、情報の信頼性と透明性ということになろうが、あまり透明過ぎても国家戦略が機能しない。
近年、情報漏洩や内部告発が頻繁に起こるのは、社会への不満と無関係ではあるまい。警察が機能しなければ自警団が組織されるが、社会が機能しなければ民衆的な自主運動が盛り上がるというわけか。

7. 大慈善家でも知られるソロス
ジョージ・ソロスといえば、「イングランド銀行を破産させた男」として有名な大投資家。むかーし、この有名人の伝記的物語を読んだ時、金融界のデリバティブ商品に問題があると指摘していたことに共感した。ソロスは、ポンドがヨーロッパの為替相場メカニズム(ERM)から脱退することに賭け、見事に10億ドルの利益を稼いだ。結局、イギリスはポンドを切り下げてERMからの脱退を余儀なくされた。いわゆるブラックウェンズデー(1992.9.16)である。結果的に、ソロスはポンドをERMから解放し、慢性化したイギリス経済に回復のチャンスを与えたという見方が多い。実際、ソロスがハイリスクで得た資金は慈善寄付へと流れているという。また、ドラッグ規制からセルビア人の攻撃に対するサラエボ防衛まで、アメリカ政府がためらった分野で高邁なプロジェクトを次々と立ち上げたという。その活躍ぶりは称賛と非難の両方に及ぶ。
ソロスはハンガリーで育った。彼の父はユダヤ人弁護士だが、一家はキリスト教徒を装って強制収容所送りを免れたという。大戦後、共産主義国で過ごした後にロンドンへ渡り、哲学者カール・ポパーの「開かれた社会」という概念に感化されたという。彼は、アービトラージ(裁定取引)の達人となり、ヘッジファンドのプロとして開化する。
しかし、1970年代後半から金儲け以外のことに目を向けたという。結婚が破綻し家族を顧みなかったことに気づき、まもなく自責の念と羞恥心が大きな位置づけとなり寄付活動を始める。1980年代、ハンガリー全土にコピー機を供給したのは、コミュニケーションを促進して検閲を難しくすることで、民主化運動を直接支援するためだったという。更に、共産圏から民主化のために欧米に働きかけたが、それは実らなかったらしい。ナチスと共産主義を生き抜いた経験が、民主化への情熱を掻き立てたようだ。
しかし、アメリカでは「過剰な個人主義」と非難される。ソロスは「制限のない市場資本主義は共産主義と同様、オープン・ソサエティにダメージを与えうる」と警告したという。