2013/08/25

【読書メモ】 集合知とは何か

『集合知とは何か』は本年2月に中公新書から発刊、西垣通・著。
著者の西垣氏は東大の計数工学科を卒業、日立製作所のソフトウェア研究開発、明大法学部の教授職を経て、東大大学院の情報学環工学博士まで歴任されたとの由。
コンピュータの学際的な普及解説の第一人者としても広く知られる。

およそ高水準の学術見識に基づいた大衆書というものは、以下大別した2つの要素を併せ持っているのではないか…と僕は近頃考えている。
(1) 或る観念/アブストラクトを、様々な意味論をもって(再)定義するもの
(2) 市場産業に実在する諸要素を、その属性や効用から分析するもの

この大分類からすれば、本書『集合知とは何か』は(1)の範疇にシフトした観念解説書、のようでいて、実は(2)の範疇における技術論ガイダンスとしての側面も多分に有るもの。
実際、本書を店頭で立ち読みしてみたところ、Intelligence Amplification やサイバネティクスといった用語を散見、ああこれは僕自身の会社員時代の技術知識を増強するに絶好の参考書かなあと購入した次第。

本書を概括的に評すれば、ネット集合知は「何か」というより、むしろ「どのように構築されるべきか」さらには「どうであってはならないのか」について慎重に論じられている。
その上で一貫している巨大な問題設定。
「我々人間は一人ひとりがITを便利な知識情報媒体として活用している、が、それではITは我々人間一人ひとりをどう活かし得るのだろうか?」

本書において引用・概説される生命、人間、社会組織、ITインフラといった多重な構造(系)、それらの主客相互の相対的な機能関係 ─ と、緻密で多元的な分析にはまこと感嘆の限り。
なるほど随所にみられるテクニカルな述語(「感受する」「創出する」「創発する」など)の読解にあたっては緻密な論理力を動員やむなしではあるものの、そこが本書を硬質でエッジの利いた論説たらしめている所以。
たかだか200ページの新書版に収めるにはあまりにも密度の濃い科学論(それ以上に哲学論か)といえようか。
とまれ、以下に僕なりに要約した読書メモを一応は纏めおく。



・或る特定解が存在する疑問にさいして。
不特定の回答者による部分的な解の集積は、この分野での専門エリートの見解よりも正解に近くなる。 
そもそも、不特定の回答者は各人が自己の体験から互いに独立した見解を呈する、か、或いは自信無き場合には全く当てずっぽうな回答を返す。
一方、特定の専門エリートは精度の高い推測モデルを有しているので、それに則って皆が似たような回答を呈示する。
ここで、不特定の回答者の推察の集合は正解に近似しようが、無知の当てずっぽうにかけ離れようが、どちらの場合にも集団としての誤差は小さくなり、つまりは正解に近くなる。
だが、特定専門エリートの回答は皆が一様に間違っている可能性もあり ─ そうなると不特定の回答者の回答の集合が正解に近くなる。
…と、これが情報寄せ集めモデル(推測統計学を含む)の基本的な着想のひとつ。

・なお、正解そのものが準備されていない問題に応じた場合、つまり回答者集団の多数決の解が総意とされる場合は、どうなるだろうか。
政治学者アローの定理でも遍く知られるとおり、各人がそれぞれ合理的と信じる意思決定をもって回答したとしても、その集積としての多数決は個々人の判断結果と一致するとは限らない。
よって、ネット環境によって自生的に新規の民主的な正解が導かれるなどと一概に喜ぶわけにはいかないのである。

==============================

・そもそも、「客観的な知」など在りうるのだろうか。
たとえば市場原理は特定の評価基準、第三者専門委員会、数値目標、結果の明示などによって、特定の情報の透明な共有化が可能な社会をもたらす。
が、実はこれは謂わば権威と流動性に保証された所与の知(天下りの知)とでもいうべきもの。
所与の知の例として法律の条文解釈や、外国語文法などが挙げられるが、これらは権威有る誰かが一意に行った解釈に依っている知に過ぎず、そこに大きな間違いが起こっていても誰にも分からない。
一方で、市場での流通にそぐわない知識や情報は存在しないものとされやすい。

・所与の知は、欧米流の論理的な導出、つまり公理、原理、憲法、実証的事実の集積による普遍性(という信念)に多くを依っている。
13世紀のスペインの騎士ライムンドゥス・ルルスは、イスラム教徒をキリスト教化するため修道士となり、普遍的記号論に基づいた「円盤機械」を発明。
のちのルネサンスにも宗教改革にも、さらにはデカルト、ニュートン、ライプニッツにも連なる普遍的な近代の知の端緒である。

・とりわけ20世紀は「所与の知」の論理的整合性を大前提に据えつつ実証実現に挑んできた世紀ともいえる。
フレーゲの『述語論理』、ラッセルとホワイトヘッドの『数学原理』、ヴィトゲンシュタインの『論理哲学論考』、ルドルフやカルナップらの『論理実証主義』などを経て、厳正な「はずの」論理記号表現によって数学から科学哲学まで表記の精密化をはかった。

ヒルベルトは 「無矛盾の公理系から導かれる真なる数学命題は、必ず形式的操作で証明出来る」 とし、いわゆる記号転置型形式主義を説き、量子力学者かつ数学者のフォン・ノイマンはこのテーゼに準じつつ現代型コンピュータを開発。
また、チューリングもプログラム内蔵理論を実現した計算機として「万能チューリングマシン」を開発。

ところが ─ 数学者のクルト・ゲーデルは、「記号による形式主義手法では自己言及矛盾の命題を証明出来ない」と説き、ヒルベルトの説が否定されるに至り、更に万能チューリングマシンによってもヒルベルト説の限界が却って示されてしまった。

・上記経緯にも関わらず、思考機械としてのコンピュータは「所与の知」の正確なシミュレーションとソリューションをもたらす、と更に見做され続け、1980年代にメインフレーム・コンピュータの最盛期と人工知能(Artificial Intelligence)の隆盛に至る。
いわば知識工学の推進であり、そのひとつの実現が『エキスパートシステム』で、これは個別のユーザのソリューション要求に応じ、特定の専門プロの知識(命題)を論理的に最適化して都度リターンするというシステムである。
但し、さすがにそれら専門知識も最適化も万能ソリューションとは見做されておらず、本システムは知識工学の主流たりえていない。

・かたや、いわゆる『第5世代コンピュータ』は、フレーゲ以来の述語論理を直接ハードウェアベースで並列処理する(コンパイル処理ナシ)というコンセプトもので、人間の脳内思考処理の最も直接的なシミュレーションとされた。
現在に至るまで、第5世代コンピュータは日本のIT関連プロジェクトとして最も大規模な産学投資がなされ、実現に至った。
しかし1990年代以降のIT技術はネット分散処理に大きくシフトし、よって第5世代コンピュータも知識工学の主流を占めていない。

==============================

・以上、第5世代コンピュータあたりまでが、人間の「所与の知」の省力マシンとしての人工知能(AI)追求であったとすれば、現在のネット分散処理の進展はむしろ逆に、 コンピュータの便宜によって人間自身の知力を高めんとするもの ─ つまりIA(Intelligence Amplification) を強化する状況にある。

・ネット分散処理のインフラ環境増強(とりわけウェブ2.0以降)およびデータ検索エンジンの急速な向上が進み、国民の知識の拡大が起こってきた昨今である。
かつ原発事故の経緯もあり、20世紀まで産学両面にて幅を聞かせてきた「所与の知、天下りの知」の信頼がいまや大きく揺らいでいる。
そもそも、論理と実証による統一的な客観世界が本当に存在するのか、との疑義が現在までいよいよ問われ続けている。

・すでに20世紀半ばの科学哲学者マイケル・ポラニーは、客観知が論理と実証のみからは成立しえないと指摘していた。
ポラニーによれば、通常我々が完結的に認識している各人のそれぞれの知は、本当はそれらの潜在的な構成要素たる個別情報から成り立つ由。
この前者と後者の関係付けをポラニーは『暗黙知』というタームをもって説明、こうして人間同士が(論理と実証による統一解ではない)その時その場の客観知を構築出来る、とした。

・一方、1960~70年代にトマス・クーンの『パラダイム理論』が発展。
これによれば、専門家集団の学説といえども統一された論理と実証ではなく、おのおの既設のパラダイム内に留まっているに過ぎず、ゆえに唯一の客観世界など記述してはいない。

===============================

・あらためて注目すべきは、我々一人ひとりの閉じた主観=体感としての知、流行りのタームで言えばクオリアであり、そこから導出される一人ひとり個別の反応行動であり、それらを通じてなされる人間の再帰的な創出活動である。

・ ヨリ多重構造として捉えれば、生命そのものにも統一された客観世界など無く、各個体も独自に閉じたクオリアによる感覚(センシング)と反応によって生きている。
1970~80年代に生物学者のマトゥラーナとヴァレラによって『オートポイエーシス理論』が発展、これは、生命が細胞レベルからどこまでも自己創出的であって、おのれの生成も出力も自己自身のために再帰的に機能するとしたもの。
現在まで生命の本質をもっとも掴んでいる学説といえ、かつ、これを人間に適用すれば、各人の閉じたクオリアや経験記憶や思考もオートポイエティック=自己創出型といえる。

・そうであれば、人間が成立させる社会組織そのものもまた、それなりに閉じたクオリアと経験記憶と思考を通した自己創出によって再帰的に機能しているはずである。
(ここが本書の最大の難所の一つなのだが) 社会組織の独自に閉じた自己創出機能は、個々の人間のそれよりも上位にあり、にも関わらずこの両者は包含関係にはなく、相互干渉破壊の危険もなく、いわばお互いがプロトコルレイヤのように機能は相互独立しつつインタフェースは共有している (という論旨だと僕は解釈した)。
この社会組織と個人の機能関係を、本書では 『階層的な自律コミュニケーションシステム』 と明示している。

・さてそれでは、「クオリアと反応において閉じられているはずの生命体」は、「入出力反応が外部に開放されている機械」 とどういう関係を構築しうるだろうか。
1948年に数学者ノーバート・ウィーナーが『サイバネティクス理論』を提唱、これは人間はじめ生命体の閉じられた自己安定性を外部機械が統計確率的に保全するという議論であった。

とはいえ、生命体がそれぞれ独自の閉じられたクオリアにおいて感受や反応を行う以上、それらを外部の機械が一様に保全することは出来ない、との再認識から、1970年代以降にフェルスターが唱えたのが『二次サイバネティクス論』である。
これはいわば「サイバネティクスのためのサイバネティクス」、つまり、個々の生命体おのおの独自の感受や反応プロセスそれ自体を、外部機械によって全く個別に保全する、(そうすることで個々の生命体の自己安定性を機械によって保全することになる)、という新たな踏み込みであった。
本論を提唱したフェルスターは、オートポイエーシス(生命の自己創出)論を説いた生物学者のヴァレラなどとも親交があったという。

・以上に記した、人間各個人の閉じたクオリア及びオートポイエーシス(自己創出)論を総括した学術アンソロジーが、2009年にメディア学者のマーク・ハンセンや文学者のブルース・クラークによって編纂され、『ネオ・サイバネティクス』と冠されて発表された。
ここで新たにまとめられているのが、『システム環境ハイブリッド』というコンセプト。
ここではクオリアやオートポイエーシスの前提をふまえつつも、こと人間はテクノロジーによって認知世界を意図的に拡大させる性質を有しており、よって「無意識の知性」を習得しうるものである、と論じている。
これをもって、人間は単なる閉鎖的な個体ではなく、その無意識の知性習得の最前線にある媒体がIT(ネット)であると説明。

※ とはいえ、本旨に対しては著者の西垣氏は懐疑的見解をとられており
─ 人間にとってあくまで外部的存在に過ぎないITエージェント(エンティティ)は、論理演算に留まるものにして、それが(閉じられているはずの)個々人の倫理までも形成するとは云えず、またITエージェントの論理的作動と人間個々人の無意識の作動の差異について明快な説明も無い、と記し措かれている。
まして、ITの演算能力への無邪気な万能信仰は、20世紀型の論理と実証の試みと限界を再度想起させるものである、との念押しもなされている。 

===============================

・ところで、生命体を巡る科学理論としては、20世紀末からカオス理論やフラクタル図形など非線形数学をもって「自己組織化」を説明しようとする潮流も根強い。
いわば、ミクロな要素が非平衡な物理系で相互作用し、それでマクロな自己組織化のダイナミズムが発生するというもの、つまり生命体を反エントロピーの創発現象として解釈するというものである。
しかし、これらの物理現象は、相互に閉じられたクオリアにより感受と反応を繰り返す個々の生命体の在り様を完全に説明したことにはならない。

・いわゆる『ポスト・ヒューマン』論はもっと稚拙で、サイバネティクスを人間と機械の混交であると誤解し、人間はネットのエンティティ(いわばアバター)に堕して主体的な知性を失うなどという。
つまり、人間一人ひとりの閉じられたクオリアと自己創出性を全く無視した論調に留まっている。

=============================

・以上が、本書の問題設定、いわば大前提。
第5章の中盤以降にて、いよいよ総論と展望論にうつる。
閉ざされた各人の「主観知」を社会組織という「客観知」、ひいては「集合知」へと導き出す手がかりを模索する ─ という旨、あらためて注記がなされている。

・たとえば流行の脳科学テクノロジーは概して物質的な脳機能分析、つまり外部で共有可能な「客観知」データの捕捉を目的としている以上、これだけでは個々人の非開放的な「主観知」を同様に外部に導き出すことは出来ない。

・この両者間をどこかで連結させるための、ひとつのヒントとして紹介されているのが、我々一人ひとりを絶対的に閉ざされた個人としてではなく、社会とのインタフェースを共有する「分人」のプロパティを有する者と捉える着想。
各個人の「分人」の部分が社会組織(ネット側)と継続的に問/答のコミュニケーションを図ることによってこそ、相互のインタフェースが構築増強されていく ─ ひいては「集合知」のボトムアップとなる、と考えてみてはどうか。
この発想は、「二人称的な『心身問題』」としてかなり数理的に検証され始めているという。

・この「二人称的な心身問題」の検証事項としては、個々人の「分人」の部分が社会組織(ネット側)の一体誰と連結インタフェースを図っているのかが端的なデータたりうる。
そこで好例として引用されるのが西川麻樹による『アサキモデルで』、これは個々のモナド(単一で閉じられた単子)が相互にコミュニケーションを行い、一定の相互信用度の閾値にも左右されつつ、中枢としてのモナド(いわば脳)を生み出すダイナミズムを説明している。

・このモデルに則りつつ ─ 仮に個々のモナドをクオリアによって閉じられた個々人の精神と読み替え、支配中枢としてのモナドを社会組織のリーダーシップと置き換えてみる。
すると、両者のネットを介したインタフェースや社会組織リーダーシップ生成のダイナミズムを少なくとも数理的には検証したことになる。
相互関係の閉ざされた個々のモナドが独自に閾値条件設定とインタフェース形成を続ける、そんなシステムこそが、常に安定した支配中枢モナドを生成する、という結果が顕在化している。

==============================================================

・ネットによる「集合知」は、たとえばネオ・サイバネティクスの応用進化によりもたらされるモニタリングハード/ソフトの充足により、閉じられた個々人ユーザおのおのの経験と暗黙知と生命(つまり人生)を充足させる不定形の知性のこと。
そして、社会組織の問題解決に接しては、ネットの向こうの知識集積と、ネットのこっちの閉じられた個人、といった主従関係においてではなく、おのおの独自の出来る範囲にて互いに発揮しあう知性のこと。
そうである以上、ネット集合知はメインフレーム中枢処理系(第5世代コンピュータなど、いわゆるタイプI世代)による論理演算力の増強や、ネットインフラ分散処理(現在主流のいわゆるタイプII世代)によるアクセス効率化のみからはもたらされ得ない。

そこでこんご期待されつつ基礎技術の研究開発が進められているのが、タイプIII世代コンピュータ ─ つまり個々人ユーザの閉じられた知へのセンシング機能が充足してネット集合知を常時実現しうる、何らかの拡張型コンフィギュレーションである。

以上