表紙 > 雑感 > 森田真生氏「大人のための数学講座」感想

全章
開閉

04「ランダムネス」をめぐる数学 open

森田真生さんの「大人のための数学講座 in 名古屋」を聞いてきました。
その感想と、『三国志』読解へのつながりについて、書きます。お題は「「ランダムネス」をめぐる数学」でした。
一晩寝て、ちゃんと歴史の勉強の話に着地させる見通しが立ったので、こちらに書きます。三国志と関係ない話が続きますが、ちゃんと着地させる予定です。
数学の講義から、ぼくが導出できると思うことは、、
過去に無数に起きた出来事はランダムであり、史料の記述は、非ランダムである。どちらが典型的(ありふれている圧倒的な多数派)かと言えば、歴史記述されなかった出来事のほうである。無数の出来事を、有限である人間の知性で把握するために、おおくの情報を圧縮する(=歴史観を形成する、歴史理論を設定する)ことになるが、それは、まあ仕方がないことである。ただし、圧縮の方法は、新しい情報に触れたときに変化できるよう、開かれた状態を維持したい。という話です。

議論における「お約束」は、情報の圧縮

はじめから、つまづいて面白かったこと。先生とぼくたちは、前提や約束を共有していない。これが明らかになったとき、笑いました。
先生が「1 1 1 1 1 …」と黒板に書き、「これはランダムか、ランダムでないか」とぼくたちに聞いた。おそらく先生は、「”ずっと1が続く数列”と、説明できる。ランダムでない」という事例を用意したのだと思う。しかし生徒が「チョークで書いた文字の、長さや感覚が微妙にちがうから、ランダムである」という。

ぼくが思うに、文字や記号に関する諒解事項がある。たとえば、ゴシック体の「あ」と明朝体の「あ」と、私が書いた「あ」と、あなたが書いた「あ」と、ぼくたちは「同じ文字だよね、”あ”だね」と諒解する。草書体の「安」を書かれると、仮名の来歴を知る人は「これも”あ”だ」と理解するし、知らない人は「読めないから、活字に翻刻してください」と言うだろう。
「いま、なにを読んでいるか」というモードを切り替えることによって、読めないものが読めたりする。たとえば、会社の上司の手書きメモを、「活字の書類のように」読もうとすると、さっぱり分からない。しかし「古文書のように」読むと、読めたりする。マジで。
言語の本質は、隠喩と換喩だそうだが、その比喩のルールを見失うと、言語や記号による情報の圧縮は、情報の破壊にすぎなくなるなあ!
森田先生いわく、
人間の頭で認識できる情報量は限られているから、圧縮して理解すると。
この圧縮による行き違いが(おそらく先生も予測していない範囲で)起こったんだと思う。数学者である先生は、黒板に「1 1 1 1 1 …」と書くとき、チョークがかすれていようが、1は1だ。1という概念には、検討すべき哲学の問題が含まれているそうだけれど、ともかく、チョークのかすれまで問題にしていたら、何がなにやら分からなくなるから、1は1とする。これは、数学者の諒解事項=情報圧縮である。同じ諒解が、ぼくたちには、通用しないことがあるんだなあ!という好例だった。

ぼくが思うに。先生が「ランダムの定義は何か。それが今日の問題です」と、既成概念を揺さぶるような問いを投げかけたあと、「1 1 1 1 1 …」と書いた。だから、ぼくたちは、既存のルールを崩して(情報圧縮を一時停止して)異様に感度をあげたせいで、こんな「笑い話」が起こったのだと思う。いくらぼくらが数学者でなくとも、小学校で算数をやったときの頭を、そのまま持ちこめば、さすがに、今回のようなルール停止は起こらなかったはず。
先週、中沢新一先生が言っていたことにも共通する。いわく、
文化とは、脳のニューロンが現実にそのまま影響しないように、障害物をおくこと。もし脳が「進化」して、脳の全域が活性化すると、統合失調症となり、人格が破壊される。脳があまり活性化しないよう、障害物をおくことで、人格が形成されると。
これと同じ「統合失調症」に、意図的に自己を放りこんだぼくらは、「1 1 1 1 1 …」のなかに、ランダムネスを見つけてしまったのでした。あたかも、「間違い探しゲーム」をするときの繊細さで、先生の書いた数字を見てしまったのでした。

同じような、情報の圧縮ミスを、もうひとつ。
つぎに先生が、「1 0 1 1 1 0 1 …」と黒板に書いた。これは「奇数番目は1である」という規則をもった数列だったようです。しかし生徒は、「数字は0から9まであるのに、1と0しか使っていないから、ランダムでない」という。ランダムでないという結論は、先生が用意したものと偶然に一致した。だが、まったく異世界からの攻撃になったと思う。
思うに、1と0ばかりを使った場合、「二進法の表現でいくからね」という諒解が、ほのかに含まれている。10進法で書かれた、千百一だって、1101と書けば、二進法のような気がしてしまうほどだ。黒板に即興で書いたときに、このような前提のズレが露呈する。おもしろいなあ!

ランダムネスの定義

ランダムネスの性質は、3つあるらしい。20世紀に研究が進み、3人の研究者が、3つの登山道を進んだところ、最終的に同じ山頂に辿りついたので、「やっぱりランダムネスって、そういうことだよね」という合意が得られたっぽい。
森田先生はこういう合意を、ランダムネスが「数学的に実在する」と表現されていた。べつにキーワードとして提示されたのでなく、言葉の端が気になってぼくがメモしたのですが。これは面白いことです。ぼくなりに言い換えてゆくと。
数学というある一定の情報圧縮のルール化では存在が確かめられた。ぎゃくに言えば、そのルールを共有しない者のあいだでは、存在が確かめられない。存在しないかも知れない。もしくは、まったく違う存在として出現するかも知れない。

ランダムネスの3つの性質とは、典型性、予測不可能性、圧縮不可能性。
典型性とは。数直線の上に、無限に数が存在する。そのなかで、1とか、1/3のように、きっちりと割り切れて説明できる数(非ランダム)のほうが少ない。例えば、0.1と0.2のあいだには、全てを数え上げるのが不可能な(ランダムな)、無限個の数が含まれている。無限個=多数派という意味で、ランダムとは典型的な数たちのことである。
予測不可能性とは。つぎに何が出てくるか分からないこと。1/3を少数で書き表すと、0.33…となる。べつに、3を書き続けなくても、ずっと3だよ、と予測できる。これができないのが、ランダム。
圧縮不可能性とは。全ての数を、省略することなく列挙しないと、誤りなく表現することができない数。例えば円周率は、ランダムでない。「円周は直径の何倍か」という定義に置き換えられる。情報量が減る。または、オイラーの公式で表現できる。いっぽうでランダムであれば、円周率のように説明できない。

ここまで聞いて、ぼくは思った。「ランダムには3つの性質がある。性質とは、、」と説明している時点で、情報の圧縮に成功しているじゃないかと。もっと言えば、「ランダムネス」と発話している時点で、とっくに把握に成功しているじゃないかと。
数学がランダムネスと呼ぶようなものが、「日常言語的に実在する」ためには、数式は要らない。「ランダムネス」という語彙を作れば、とりあえず完了なんだ。
このあたりが、どういう約束のもとで議論するか、という上記のモヤモヤと同じ問題だと思う。ランダムネスは、日常言語的には実在していた。だってそういう言葉があるんだから。しかし、20世紀に数学者が研究するまで、数学的には実在しなかった。先生が発言するときは、暗黙に「数学的には」が隠れている。しかし、余りにも先生にとって当たり前すぎて、それが表に出てこない。というか、何度も言っていたら、話が進まない。しかしぼくらは、きちんと意味を受け取りこそねる。
「1 1 1 …」と書いたとき、ぼくがチョークのかすれを見落とした。このとき、先生とぼくのあいだで、ルールの共有があった。だが、「ランダムネスの特徴は、圧縮不可能性である」と先生が言うとき、ぼくは「?」と思う。ルールの共有に失敗している。しかし、「説明できてるじゃないですか」というのは、野暮だというのは分かる。「それを言っちゃあ、おしまい」だと分かる。でも、やっぱり「?」は残るなあ!

人間の脳のメモリは、3テラバイト

森田先生いわく。
脳神経の発火をコンピュータに例えると、人間の脳が格納できる情報は、3テラバイト。1日にネットにアップされる情報の1百万分の1しか、人間の脳は格納できない。情報は、ほとんど外部にある。
太古、単細胞生物は、自分の周囲の環境で起きている化学反応を察知して、その化学反応に自分を似せていくことで、生き延びた。周囲の環境と「つじつまが合っている」生物が生き延び、そうでない生物は絶滅した。
周囲のランダムな環境を理解するとき、生物の限られた身体には、すべての情報を取り込めない。だから、近似的に圧縮することで、周囲への適用をはかった。『ムーたち』のように。
元来はパターンがない、ノイズばかりのところに、シグナルを読みとる。これが脳の学習である。ゆえに、シグナルを読む訓練をしていないと、人間の顔の輪郭や表情を、理解することができない。周囲の無限の風景と区別がつかない。例えば、大人になって視力回復の手術を受けた人は、子の顔を見ても「感動のご対面」とならない。視覚=見えているものとは、世界そのままの姿ではない。自分の理論を、世界に対して適用したものである。

ぼくが思うに。数学は、あるルールに基づいて、人間の外部にあるランダムなことや、人間の頭に浮かんでくるランダムなこと、数式などに写しとる。しかし、数学の訓練を積んでいないぼくには、「数学者のような景色の見え方をしない」。たとえば、視力回復者が、人間の顔「すら」認識できないのと同じように。
今回、まったく異分野の話を聞きにいった、ぼくにとっての効果は、きちんと出ているなあ。先生の講義の内容以前に、ルールやコードが分からなかった。講義の開始5分は、ノートとりも迷走した。いちど、チューニングが済んだあとは、理解できるようになったけど。あの5分間の混乱は、きつかった!忘れずに覚えておきたい。

森田先生いわく。
確率の研究は、頻度主義から始まった。つまり、「コインを24000回投げたら、表が12012回出たよ」というように。コインは、表と裏をカタチで識別できる時点で、両面が均等でないはず。だが、数学的なモデルにおいて「1/2の確率で表が出るコイン」を設定する。このモデルを獲得するため、何万回もコインをなげて、ノイズのなかから、シグナル(1/2で表が出る)を読み取ろうとする。
ギリシャ哲学は、もっとも正しいシグナル=真なる意味を見つけ出すことから始まった。プラトンは、理性で真理に到達すると考えた。アリストテレスは、経験から真理に到達すると考えた。しかしデカルトは理性の限界をいい、ヒュームは経験による帰納の不可能性をいった。
100%の真もしくは偽は存在しない。生物は、単細胞生物だったときと同じく、外部の(ランダムな)環境を正しく理解しないと生き残れない。(ランダムな)真実を理解したいと思う。しかし、理性でも経験でも、真実に到達できない。ゆえに(ランダムな)偶然に翻弄される。

九鬼周造いわく、運命とは偶然を内面化したもの。南方熊楠いわく、世界や宇宙といって分かった気になるのでなく、「不思議」とよぶべきである。


ベイズの理論;事実の判明で確率は変動する

確率論や期待値は、未知のものを探れる道具。ただし、「誰がやっても、コインを1000回投げたら表がこれだけ出る」という種類の確率論は、あまり実生活には役に立たない。「私がやる1回きりのこと」について、未知を探れなければ意味がない。
そこで、「ある仮説や信念を持った人が、どのように真実を理解するか」を数学的に把握できるのが、ベイズの理論。
たくさんのグリンピースがあるとする。マメ1つ1つが「可能宇宙」だとする。可能宇宙とは、あるかも知れない、起こり得る宇宙。ゆえに、すでに反証があるもの(過去が食い違ったもの)は含まれない。また、起こる確率によって、可能宇宙の分量がかわる。明日も太陽が東から昇る可能宇宙は、たくさんのマメであり、西から昇る可能宇宙は、すこしのマメである。

ベイズの理論には、3つの変数がある。事前確率、事実、事後確率。
「事前確率」とは、可能宇宙のマメが、どれくらい多くあるかという信念。「事実」が判明すると、「事後確率」に変動する。
たとえば、事前確率において、UFOは存在すると信じている人がいた。事実として、UFOを目撃しても、「そういうことって、あるよね」と再確認するだけで、事後確率=新たな信念は、あまり変化しない。いっぽう、UFOを存在しないと信じている人が、UFOを目撃すると、「見間違いだった」という可能性を留保しつつも、「もしかしたら、UFOが存在するかも」と信念を揺らがす。事後確率が変動する。

ある事実Bのもとで、Aが起こる確率(事後確率)は、どのように決まるか。Aが起こる確率(事前確率)に、AのもとでBが起こる確率をかけ、Bが起こる確率で割ったもの。
これを変形すると、以下の2つが等しいとわかる。
Bが起こる確率に、Bが起こったあとでAが起こる確率をかけたもの。Aが起こる確率に、Aが起こったあとでBが起こる確率をかけたもの。

このあたりは、数式のほうが分かりやすいなあ、、

たとえば、
人間は0.5の確率で男である。男である場合、彼が数学者である確率は0.05だとする。女である場合、彼女が数学者である確率は0.01だとする。すると、「男であり数学者である確率」は、ある人間が男である確率に、男であった場合に彼が数学者である場合の確率をかけたものに等しい。
再説すると、以下の2つがひとしい。ある人が数学者である確率に、ある数学者が男である確率をかけたもの。ある人が男である確率に、ある男が数学者である確率をかけたもの。

これを使えば、部屋に長い髪の毛が落ちていたとき、それが女性のものである可能性を求められる。もし人類の0.5が女性で、女性のなかで長髪が0.75、男性のなかで長髪が0.30いるとする。すると、長い髪の毛が女性のものである確率が、0.714であると求められる。
同じように、飛行機がビルに突っこむ映像を見たときに、それを「事故でなくテロだ」と気づく確率も、求められる。テロが起きると予め思っている度合は、ビルに突っこむという事実により、更新される。2機目の飛行機が突っこむ前には、すでに1機目が突っこむシーンを見ているから、「ほぼテロだ」と認識できる。
すなわち、
飛行機が突っこむとき、事故でなくテロだと認識する確率を、0.005とする。2000回に1回、事故でなくテロによって突っこむだろう、という見通し。飛行機が突っこむという事実(確率=1)を目にすると、それがテロが起きたと思う確率は0.38になる。「ほんとうにテロかも」と信じ始めた状態。2機目が突っこむときは、すでに0.005から0.38に信念が更新された状態で見るから、2機目が突っこむという事実(確率=1)を見たとき、0.99の確率で「テロだ」と分かる。

ぼくたちなりの「日常言語」で置き換えると。
1州を支配したとき、皇帝を自称する確率を求めたい。
まっさらの状態で、群雄が皇帝を自称する確率は、0.01とする。つまり、100人の群雄いたら、99人が皇帝を自称しない(という信念をもつ)。たまに1人くらい皇帝を自称するような者が出てくる。
もし皇帝を自称した者が、1州を支配している可能性が、0.9だったとする。皇帝を称するくらいだから、1州くらいは支配していることが多いでしょう、という見通し。また、群雄のなかで1州を支配するほどの大きな勢力が、0.2だとする。つまり、1州を擁するほどの大勢力になるのは、群雄の5人に1人だと。
すると、1州を支配したとき、皇帝を自称する確率はどうなるか。まっさらの状態で皇帝を自称する確率0.01に、皇帝を自称した場合に1州を支配している確率0.9をかけ、しかしなかなか1州を支配できるものではないから、0.2で割る。計算結果は0.045。つまり、1州を支配したとき、20人に1人くらいは皇帝を自称したくなる。1州未満しか支配していないときに比べて、4.5倍も皇帝への野心がつよまる。
直感で納得できないので、等式で確認。以下の2つが等しい。
群雄が1州を支配する確率0.2に、1州を支配したとき皇帝を称する確率 0.045をかけると、0.009になる。まっさらから皇帝を称する確率0.01に、皇帝を称したとき1州を支配している確率0.9をかけると、0.009になる。一致。
いちど、1州を支配した者が皇帝を自称するという前歴をつくると、ベイズの理論では(2機目の飛行機をテロと高精度で把握できように)立て続けに1州を支配する者が、皇帝になっても良さそうだ。だが、袁術は失敗した。ぎゃくに周囲を慎重にさせた。失敗例という「事実」が、周囲の事後確率を、マイナス方向に変化させたのだ。また、曹丕が禅譲された直後、劉備がすぐに皇帝即位するから、ベイズの理論が適用できるかも。だが孫権は、そこから数年も皇帝に進まない。
うーん、切れ味が悪い。べつに、ぼくが設定した、0.01とか0.2とか、そういう数値が不適切なんじゃなくて、この理論で三国志の皇帝即位を論じるのがむずかしい。劉備の場合だって、曹丕に政治的に対抗するための即位であって、互いに独立な原子や分子が、化学反応したのとはモデルがちがう。


ぼくは思う。ツジツマは合っている(等式変形で表現できる)のだが、なんだか「役に立つ」気がしない。事前の信念が、事実を踏まえて変化する、というモデルには納得する。しかし、それを数式で表現しても、何かを拾えるのだろうか、という疑問がのこる。べつに三国志に限らず、日常の諸事に関して。
社会学のアンケートが苦戦するように、事前確率をひろう作業、事実を判定する作業、事後確率を調査する作業こそ、もっとも難しいのだろう。たとえば、「男女の定義とは」「髪が長いとは、どれくらい?」「20センチの髪がおちていた場合、男にしては長髪だが、女にしては長髪でない。男女でそれぞれ長髪の比率を調査しても、その結果は使えない」という、野暮な疑問が尽きない。
同じように、飛行機の件では、「事故とテロの違いは」「テロに対する認識を、どうやってアンケートを取ればよいか。母集団の年齢や人種や宗教は?誘導尋問にならないか?」と、いくらでも野暮な疑問が出てくる。
さっき、ぼくが思考実験した、「1州を支配したら皇帝を自称する確率」を求めるには、「皇帝を自称したとき、1州を支配している確率」を用意しなければならない。後者が分かっているなら、べつに前者もだいたい分かるよ。というか、何か新しい情報が増えたか?

まったく知りませんが、数学においては、こういう混乱が起きないように、「属性P」のように記号化するのだろう。長髪と短髪とか、テロと事故とか、せっかく数学者が歩み寄って降りてきて、分かりやすい例にしたとき、その例の揚げ足をとるのは、ルール違反で野暮だと思う。しかし、なかなかねえ。
数式にするメリットは、議論が複雑になって、人間の頭が追いつかないときにでも、機械的に変換できることだと思う。論理学がやるように。複雑な記号を操作した結果、論理的には正しい結果が出るだろう。しかし「歴史学は史料に基づいてやろう」という諒解事項のなかでは、記号化しないと理解ができないほどの操作をすると、やりすぎなんだと思う。極論すると、論理的には正しそうでも、史料的根拠がなければ、良くて保留、悪ければ却下しておくというルールがある。
べつに記号の操作が不得意だから、こういう態度をとるのでなく(じっさいに不得意だが)、もっと抽象度を落とした思考をしていたほうが、史料を楽しく読めるなあ!という気がした。
たしかに、事前確率を曲がりなりにも設定でき、事実を曲がりなりにも確定できれば、事後確率を求められると思うだけど、その前段階で、ランダムネスに搦め取られてしまって、例えば「客観的なアンケートなんて、どうやるんだよ」という悩みに拘束されて、前に進めないのが、ぼくだなあと思いました。

ベイズの哲学、区別する力

森田先生いわく。
「私にはバイアスがない」というのが、最大のバイアス。何を見ても信じ続ける(事前確率=1)、何を見ても信じてたまるか(事前確率=0)という状態に、固着するのは辞めましょう。自分がどういう信念を持っているか、事前確率を0から1のあいだで明らかにしなさい。

ぼくは思う。このあたりで、前提が食い違っているのだろう。「信念を明らかにせよ」という時点で、信念を数値化して、宣言できるという前提がある。「それができれば、苦労しないよ」だと思うのだが、その部分のランダムネスは、ないことになっている。
頭の悪い文系おじさんのクレームになりそうなので、もうちょっと考える。

フランシスコ・バレラの祈りの言葉。「神よ、私に戦う力を与えてください。私に、私が変えられるものと、私が変えられないものを区別する知恵をください。変えられないものを受容する力を与えてください」と。

ぼくが思うに。森田先生のおっしゃるとおり、真理とか不思議のようなものを、把握することは不可能。しかし、どこまでなら、どのようにしてなら、把握できるかについても、なかなか合意が難しい。
たとえば数学では、ベイズによって、「区別できた」と考えられる部分があるのだろう。しかし、他分野から見ると、ある高名な歴史家が批判を受けたように「理論を振りかざしているだけで、実証を伴わない」ように見える。どの学問の分野の諒解事項に基づいて「区別する」のかを見落としたままでは、たとえば数学においてベイズの理論の切れ味が素晴らしくても、やはり区別が不充分なんだと思う。べつに森田先生が「数学は万能だ」と言ったのではなく、ぼくが疑問を自家製造しているだけですが。

冒頭の伏線を回収します。過去の出来事は無限(ランダム)にある。それを文書にのこし、それを変遷する時点で、かなり意図的にシグナルを読みとり、情報を加工している。史料に書いてあることは、きわめてマレなことであり、近似的にはゼロに等しい。この認識を忘れると、「正史厨」になるなあ。しかし「ぜんぶ陳寿のウソだよ、司馬懿におもねっただけ」と断言しても、それはそれで、情報を加工しすぎているわけで。
こういう歴史哲学の問題なんだと思う。ランダムネスの数学は。


こういう思考のぐらつき、歴史学の相対化ができたので、数学講座に行って、良かったなーと思います。歴史学のなかで「理論を振りかざしている」と批判される先生がいる。この先生ですら、数学のグリンピースも入った大きな缶詰のなかでは、相対的にかなり「実証的」に見える。事後確率が変動した。また同時に、いくら理論がおもしろくても、歴史学がこだわり「史料的根拠の提示」は大切だし、そこの具体性のなかに、歴史学のおもしろみがあるんだなーとも感じた(自戒)。これも、数学のグリンピースが投入されてこないと気づけなかったこと。
また、神、全体、ぶよぶよ、自然、野生、身体、などの「人間の知性で捉えきれないから、人間が理解しようと努力してきた対象」を言い表す言葉に、「ランダムネス」が新たに登録されたのも良かった。事後確率が、変動しまくるなあ。

座標平面で考えてみると。
横軸に「理解できるもの」をおく。ノイズからシグナルを弁別し、右にいくほど「理解ができる」とする。すると、大半のものは右にあるかと思いきや、じつはそれは幻想である。左には、たっぷりとランダムネスがある。
縦軸に「理解する方法」をもうける。数学は、上のほうにあり、より多くのものを右に振り分け、「理解できたことにする」能力がある(暴力ともいう)。上から順に、理性で真理を理解する演繹主義者がいて、つぎに経験で真理を理解する機能主義者がいて、両者は背中合わせ。いちばん下には「五感に飛びこんでくる電気信号を、すべてそのまま受け止めよう」とする、統合に失敗した世界との付き合い方がある。ランダムネスに打ちのめされてしまう地帯。
このモデルで捉えたとき、ぐいっと上に押し上げられて、右に連れて行かれ、平衡感覚を失って、くらくらっとした。そういう数学講座だったと思いました。121021

閉じる