Brewster Kahle

Brewster KahleがWikimaniaで面白い話をしていたということをAlanに言ったら、Brewsterは以前AppleAlanと一緒に働いていたことがあるという話が返ってきた(またか)。彼はThinking Machinesで働いていたのでBostonにいたのだが、ガールフレンドが「もうBostonはいや!」と言ったので、DannyからAlanに「面白いやつがいる」という話が来たそうである。Alanはちょっと前にとある会議でBrewsterと久しぶりに会ったそうだが、そのときにBrewsterは子供を二人連れて家族連れで来ていたらしい。そして、当時のガールフレンドがちゃんと奥さんとなっていたそうである。すばらしいではありませんか。

そういえば、DannyはRichard Feynmanと友達で仕事を一緒にしたことがあると聞いたことがあったのだが、WikipediaにThinking Machinesで働いたことがある人としてFeynmanが載っていたことに気が付いた。そういうことだったのか。

写真

太田さんのflickrNew York Timesに載ったWikimania 2006の写真が載っているのだが、それに俺が写っている気がしてきた。

http://www.flickr.com/photo_zoom.gne?id=209012839&size=o

2年前のESUGでも旧東ドイツの小都市Koethenのローカル紙に載ってしまったのだが(そのときはほとんど唯一のアジア人だったし)、今度はNYTですか。

http://d.hatena.ne.jp/squeaker/20040908

フライト

ボストンからLAへ。案の定、というべきか同様の時間のフライトだった日本人の方々とSilver Lineに乗るところで合流。出発前にちょっとのんびりさせてしまったのだが、ちゃんと皆さん間に合ったのだろうか(すみません)。

座席はトイレの出入りをする人の様子がみてとれる席だった。ときどき、「空の上でそれはないだろう」というような想像を書きたてるような人の出入りもあり。山頭火でラーメンを食べ、オフィスにもちゃんと行きました。

Wikimania 2006

(ちなみに、昨日のところに「その2」というやつを書き足しました。)

今年のWikimaniaの参加者は480人くらいで、100ヵ国以上と言っていたような気がするのだが、人数のほうはともかく、国の数のほうは本当かね?

Mitch KaporはLotus 123を作った人。disc jockeyをしたり、瞑想の師匠をしたりもした。...という話があったのだが、BlogよりもWikiのほうがより対話的で、同等の他者を仮定して書くようになるからよい、というような話から、その後は政治の話にどんどん移ってしまい、質疑も政治談議みたいになってしまっていた。

小部会での発表は、proxyでwikipediaの内容をダウンコンバートし、PDAなどで表示しやすくした、という話などもあったが、まあぱっとせず。他にはAdam Curry問題、Swiftboat問題、Siegenthaler問題などで、嵐のような編集がどのように起こってどのように消えていったかを概括したものなど。文系テイストがかなりある集まりなので、Wikipediaの精神を象徴する"Neutral Point of View"という言葉のNeutralがどのような定義と見るべきなのかという、やや形而上的に近づきつつもなんとか踏みとどまっていたような発表もあり。「中立とは結果ではなく、中立であろうとするプロセスのことである」というのはまずわかる話ではあるが、途中に出てきた定義っぽい文章で、「sportsman-likeな態度」という文言を使ってしまっているのは、定義のほうにより複雑な概念を導入してしまっていたような気もする。

WikiMedia Foundationのボードに対する質問セッション。Angelaという人は今期限りで辞めてしまうらしいのだが、どうやらコミュニティの協調的な態度が失われつつあり、それはもう戻らないのだ、という発言をどこかでしたらしい。それに対して、あういう発言をして、その後数ヶ月ボードに居残るくらいなら、発言した時点で後任をすぐ探してすぐやめるべきだったのでは?という質問があったり。あほか。中国の参加者が「中国語版Wikipediaは現在完全にブロックされているのだが、WMFとしてなにかできることはないのか?」という質問をしていたりした。Jimboの受け答えは(何もできない立場にいる人としては)非常に上手だったね。「少なくともブロックが解けるのが遅くなるような行動は取らないし、香港に10月(?)に行くときに、現地でいろいろな人となるべくたくさん話して解決を模索したい」というような返答だった。後は、英語がどうしても支配的な言語になってしまうのをどうするかとか。Neutral Point of Viewよりは、Respectful Points of Viewというようにしたほうが良いのでは、という質問に対しては、「いや、NPOVというを皆に共有された意識としてみたとき、すでにRespectfulという概念も入っているようになっているし、言葉を変えてもその言葉がまた別の悪い含意を持つようになるかもしれないので変えることはないだろう」との答え。うーん、上手だ。

このセッションのときに感じたのは、皆ある意味ものすごくユートピアン的だということである。素晴らしい未来を共に作っているという感覚を共有している感じがする。

お昼ごはん中に、同席の人にまた毛玉をデモしてしまったり。世の中、eToysみたいなものは見たことない人が多いのだよな。進歩の事実と幻想。

それとは別に思い出したのだが、道具が思考様式の規定をする、という例の話のことである。会議中にラップトップを使っている人々を後ろから見ていると、多くの人はWikipediaの画面を見つつ、discussion欄を通じて会話をし、質問などで話に使う例として(まあ当たり前だが)Wikipedia上の記事を引用しつつ話すように見える。熱くなりかけた議論のときにも多くの人はNPOVを気にしていて「だが一方では...」という論法をからそれほど熱くはならない感じがする。また、コードが書ける人は、MediaWikiを書き換えて新しい機能を加えているが、これは彼らにとっては思考様式の拡張なのであろう。こうやって、Wikipediaの環境と文脈で物事を考えるようになった人のことをWikipedianと呼ぶのかもしれないと思ったりした午後であった。この考えを進めると、彼らにとってはWikipediaがコンピュータ環境そのものになるべきである。例えば、BrowserのなかでWikipediaと親和性の高いemailクライアントが書かれたり、Wikiっぽいマークアップワープロが使えるようになったりすれば、Wikipedia.org上だけで暮らせるようになる。これは一考の価値ある方向性かも。

会議の締めは、David Weinbergerによる講演。これが今回の講演の中で最も面白く、示唆的でもあった。皆、耳をかっぽじってよーく聞け。じゃなくて読め。

まずは、Lessigの特長ある発表スタイルをパロって、ちょっとダサいフォントを使い、言っている事とは違う文字を出してギャグにしたり、駄じゃれにしたりと大盛り上がり。そして本題。

2,500年かこの方、知識というものには7つの固い感じの概念がまとわりついていた。単数のKnowerがいて、単数のKnowledgeがあってそれが脳の中に入ってKnownとなる。というモデルに基づいていたわけである。

1. 知識は脳の中にある。
2. 知識は(ひとつひとつは)単純で、正しいか間違っているかのどちらかである。
3. りんごは誰にとっても赤い。
4. 知識は、それが説明しようとしている世界そのものよりも単純である。
5. 多くの事柄は、知識とはなりえない。
6. 組織化されている。例えば階f層化され分類できるように。
7. 我々自身よりも大きなものである。

知識に関する概念もまた、現実世界を反映した鏡である。本という物理的存在があったとき、カバーとカバーの間にあるのはなんなのだろうか。図書館には何万冊も本があって、何段もの棚が何回にも分かれて置かれている。ある本の中に他の本への参照があるとき、いったいどうすればよいのか。階段を上り下りし棚の中の本を見つけなくてはならない。つまり、アイディアをカバーとカバーの間に挟まなくてはいけない、ということによって、2つのアイディアを結びつけることが難しくなってしまっている。

Harvardには、蚊の標本がたくさん保存されている。1869年に発見されたこの蚊の標本にはいくつかのラベルがシシカバブの串刺しのように刺さっているが、その中のひとつは赤いもので、数字がひとつ書かれている。これは、この標本が新種を発見したときのその個体である、という意味である。この番号を見たら、150年前に手書きされた(文系なので数字は概数である)ノートを参照して、その蚊に関する情報を書いた本(ページ?)を調べ、本を探さないと、その蚊に関する情報が得られない。知識は頭の中にあるのではない。現実世界を映す鏡でもない。

Bushが5月に移民について演説したときは、台本作家は難しいことを切り詰めて、25,000語程度の簡単な演説を作った。が、放送後3時間で、25,000以上のBlogが、演説の中の小さな疑問点を引用して論じていた。人間が物理的な物体を理解するためにひっくり返したりこねくり返したりして調べてみるように、多くの人が単純だったものを"complexify"して、よりよく理解しようとした。知識とは単純なものではない。

Wikipediaを見ていれば、誰にとっても同じという知識がないことはすぐに分かる。

組織化されているのか? propediaのようなものを書いた...という人がいたが、彼は決して新たな情報を加え得たのではなかった。フランスの百科事典では項目がすべて分類されていて階層構造になっているが、「宗教」は「迷信」のとなりに分類されている。Wikipediaでは、項目のアルファベット順にはほとんど意味はない。カテゴリ機能もまだまだ改善の余地がある(というところで会場がちょっと受けていたのだが、Wikipedia素人の私にはどういう意味の笑いなのかいまいちわからなかった)。NPOVはそもそも分類の概念がなければ成立不可能である。

正しいか間違っているかの択一なのか? Britanniaを読んだ人はだいたい「信頼が置ける情報だ」と思う。が、Wikipediaを読んでいる人は自分が今読んでいるものに信頼をそのまま置くわけではない。編集履歴の長さをみてみたり、discussion欄を見てみたりすることによって、さらには、誰でも自分で編集できる、ということを明らかにすることによって信頼度を確保するにしている。
「この記事の中立性が議論されています」という注意書きまで親切に出してくれる。このタグがついた新聞記事を見たことがあるか?

我々より大きいのか? Wikipediaがカバーしている項目は、良かれ悪しかれ人類の興味の対象を表している。なによりWikipediaは(Lessigのスタイルに戻り)"ours"、我々のものであるという感じがする。

誰にとっても同じひとつの真実があるのか? Wikipediaのページが生まれ、どのように編集されていくのかを見ればそんなことはない、ということがわかる。(典型例として編集頻度のグラフについて、これが典型的だよねとDavidが聞くと、聴衆から「場合による」と答えがあった。「えー、でも続けるよ。だってパワーポイントのスライドやってるの私だから」といって続けたりしていた。学校の先生のやり方だよねとかいいつつ)。例えば、「カルシウム」に関するエントリは大した編集もなくおそらくはもう落ち着いているだろう。1868年に発行された"The World Almanac"では、諸々の事実を説明することによって、当たり前のことを一般物品化(commodity)した。釘とは一般商品で、もう我々は釘のことは余り心配しないでよくなっている。物事を一般化することによって、我々は一段上に上がって、そのレベルでものを考えることができるようになる。Wikipediaの最強の点は、知識を一般物品化(というか一般の手の届くものに)したことにある。ハイデッガーは、「金槌が金槌であるためには何が必要だろうか?」と問うた。答えは、そのためには釘がある、ということを知らなくてはならないというものである。釘は板があって釘であり、板は木があり、森があり、太陽があり、宇宙すべてがあってなりたっている。知識とは、意味が暮らす王国(realm of meaning)なのである。外部化、ということを考えてみると、我々は今意味をWikipediaに外部化しているのである。Mitch KaplarはWikipedia内のタグを解析して新たな意味を見つけようとしているし、Semantic Webも意味のネットワークを作ろうとしている。もともとハイパーリンク(つながるということ)は意味なのだ。我々は知ることはだいたい得意である。knowledgeは単数にしかならないが、understandingsは複数になれる単語である。(というところで終わったのだが、今思うとunderstandingsについてどういう意図で言ったのか分からなくなってしまった。)

元気に早口でしゃべるものの、Lessigのように勢いで圧倒しようというプレゼンではないし、なにより引用したり例として使うものとのつながりに深みがある。ジョークがちりばめられていて面白い。知識とはプロセスでありネットワークである、というのもすとんとうなずける。こういうことを書くと語弊があるかもしれないが、あらかじめ何が書きたいのかわかっていないとコードがかけない言語と、そうでない言語における開発方法を思い浮かべる私である。多視点の強調も良い。「本のカバーとカバーの間にあるのは何か」という禅的な問い、そして「それは紙だけど、本当は知識なのだ」という答えも良い。ハイデッガーの「金槌であるには」という問い、そしてまた「釘を知っていること」という答えも良いし、それから帰結されるオブジェクトのネットワークがすべてを表現するという話も良い。「間を意識したオブジェクト指向としてのSmalltalk」である。「我々は物を知るのが得意である」というのはちょっと同意しかねる面もあるがな。

発表の後でまた頂上作戦。「今回の会議で一番良かったし、Lessigの発表よりも良かった。Lessigのプレゼン方法をパロったことが、Lessig自身がプレゼンの中で言っていたRW cultureの見本になっているというのがその理由だ。」ということを言ってみた。それも意識してやっていたのかと思ったのだが、俺の話で受けてくれた笑い方を見ると、案外盲点だったのかな。(WeinbergerはLarryとは友達だよ、と強調していた。)

Wikimaniaは、Lightning Talkをするだけで終わるかと思っていたが、人々の素直な情熱を目の当たりにすることができて、とても有意義だった。皆がスターなのだ、という意識は、純ソフトウェア作り、あるいはそれに近いプロジェクトではなかなか共有することができない。人間のやることだから実際には色々あるとは思うが、それをも"embrace"できるプロジェクトなのがうらやましいところである。

夕方からは、また日本人管理者の皆さんとBoston観光。強行軍のため歩きながら寝ている人もいたが、Boston Commonsを巡り、デパートにも入り、North EndのLittle Italyで思わずパレードに遭遇しつつゆっくりと御飯をいただきました。どうもありがとうございます。某Mさんはid:turkeyさんのダチだということが判明したりもしましたね。

Wikipedia 2006 (その2)

Yochai Benklerによる"The Wealth of Networks"という講演。ネットワークベース(P2Pベース)の生産、デジタルコピー、プロダクトよりもプロセスということを基調に、Wikipediaが如何に良いか、といっていう話。テクノロジーが古い産業への脅威(P2Pが音楽業界への脅威となったように)でもあるが、新たな産業や生産形態も生み出した。というような話だったが、あまりまじめには聞かず。

その次のRishab Ghoshによる200 years of collaborative ownershipという話。これは例に挙げたJames Wattの話が面白かった。彼は確かに蒸気機関を発明したが、その特許をとり特許の有効期間を変更させライバルを徹底的に叩いたために、その後蒸気機関の効率が上がらないままになってしまった。特許が切れた後、Cornwall(当時のシリコンバレー)の人はそれまでのあくどさに対してWattの会社をボイコットした。が、James Leanという人が高圧式のエンジンの細かな使用と設計図を1811から新聞(?)に載せてCornwallで出したところ、皆がそれを元に改良したので、その後技術革新が進んで効率が一気に上がった。

同じような歴史は、185年後、195年後にソフト業界で繰り返されている。ソースを公開したソフトが出て、皆が改良した。
なぜ皆オープンソースに貢献しようとするのかということに関するちょっとした経済学的(というほどもないけど)考察。物々交換のときは、Aliceは自分が持ってきた魚よりもポテトのほうに価値があると感じ、Bobはポテトよりも魚のほうに価値があると感じるので成立する。オープンソースプロジェクトにおいて、「他の人は、giveよりもtakeが多いと思う」というアンケートにyesと答える人よりも、「自分は、giveよりもtakeが多いと思う」と答える人のほうが少ないものの、自分はtakeのほうがgiveより多いと思う人も多い。Linuxカーネルは5千5百万行あって、14,005人年くらいのコストであるが、投資が分散されて行われ、個人的な参加者も多いので可能であった。
Brewster Kahleの発表は面白かった。彼はMinskyやDanny Hillisと一緒に働いていたこともあるようだが、Minskyに言われたように、「大きなゴール」をまず決めて、そこから考えるというやり方をしているといっていた。まあ話し方からも、あの辺の人々と共通したものが感じられるわけである。

彼はWAISをやり、Alexaをやり、Internet Archiveをやっている。Internet Archiveでは、可能な限りいろいろなものをデジタル化して保存しようとしている。

1976年の米国における著作権法の改正により、知識がだれかの所有物として扱われるようになってしまった。その最初の犠牲者はソフトウェアへの著作権の適用で、フリーソフトウェア運動はその話への反応だった。音楽や映画に対しては、Creative Commonsが生まれている。

営利団体による努力は色々と行われた。DejaNewsはNetNewsの検索サイトだったがGoogleに売られ、IMDBはまだ活動しているがAmazonに売られ、CDDBはGracenote, inc.になり、WAISはAOLに売られ、FTP softwareはNetmanageに売られ、CygnusはRedhatに売られた。

そういう商用化の流れに対して、Non-profitの組織が生まれてきた。Apache Foundationはフルタイムがいない。OSAF。Mozilla Foundationは、Google Toolbarを載せることによってお金が入った。Wikipediaもnon-profitだが、これらはどれも生き残ることに成功している。

Open Hardwareへの動きもある。PetaboxはInternet Archiveで使っているサーバーだが、自分達で設計してそれを公開している。$100 Laptopもオープンである。

というところからようやく本題。大きなゴールは、知識をすべての人にアクセスできるように(Universal Access to Knowledge)ということである。

例えば、すべての本をデジタル化することを考える。合衆国議会図書館には全米の本がすべて保管されることになっていて、だいたい2千6百万冊から、2千8百万冊ある。本の文字のことだけを考えると、大体一冊1MBくらいなので、すべてのデータは26テラバイト程度であり、60,000ドルでサーバーを用意すればすべてのコピーを保管できる。

電子化した本を読むためのUIも作ってみたが、BookMobileという、移動印刷屋(?)のプロジェクトもやっている。百万冊くらいのデータをバンで運び、一ページ1セント位で印刷すると、1ドルくらいで一冊作れる。このバンがインドで2台走っている。中国とエジプトでは、本をスキャンして電子化している。V字型で、本が傷まない程度に開いてページをめくって写真を撮る機械を作り、400冊/日くらいのペースでスキャンしている。一冊スキャンするのにアメリカでやると$30程度かかってしまうが、2千6百万冊でも7億5千万ドル(800億円くらい)かければ、すべての本を電子化できる。全米の図書館の年間予算の..%くらいの額を一度だけ使えばよいので、技術的・経済的にも可能である。

問題は著作権である。我々が注意したのは「問題を規定すると、それが問題になる」ということである。著者が死亡して時間もたち、現在の著作権者が分からない本がたくさんある。これらを「迷子の本(orphan book)」と呼ぶようにした。イラク戦争で相手をテロリストと呼ぶようにすると自動的に「攻撃すべき相手」という意味を持つが、迷子の本と呼ぶと、皆が助けてあげなくちゃという気持ちになるので。

Amazon著作権者が分かっている本からデジタル化をはじめている。我々はその反対である。Microsoftも実は資金を提供してくれた。

音声は、2-3百万枚程度のオリジナルな(異なる演奏などを含まない)CDタイトルがあると考えられている。全部吸い上げてしまうこともは技術的には可能だが、また著作権の問題があるので、狙うのはニッチになる。まず、バンドが自分の演奏をCDに焼いて人に配る、という文化がある。インターネット後は彼らはオンラインに置いて聞いてもらおうとするが、もし人気が出てしまうと、ISPからの請求書が上がってしまう。そういうバンドに電話をして「うちのサーバーなら、容量無制限、帯域無制限で置けますよ」というと、まずは「信じられない、嘘をつくな」という反応が返ってくる。まあひとつにはlossyな圧縮が気に入らないということもあるが、ちゃんと説明すると大体分かってくれて今は30,000位のコンサートがデジタル化されている。それから、ヨーロッパでは演奏を録音したものに関する著作権は演奏後50年で切れるようになっているので、1956年以前に録音されたものは合法的にデジタル化してよい。一枚当たり$10かかるが、(確か)Amsterdamのサーバーに蓄積中である。

動画は100年ほどの歴史しかなく、十万から二十万本ほどの映画が作られてきたと考えられている。今は6000本ほどがInternet Archiveに入っている。映画以外には、ニュース番組や教育番組や政治番組などの映像がある。趣味で作られた映像もたくさんあって、Legoの人形をコマ撮りしたアニメ、Lego Movieもひとつのジャンルをなしていたりする。これらもアーカイブしている。2000年以降は、20のテレビ局(BBCNHKなども含む)を24時間録画している。2001年9月以降、一週間ほどそれらすべてを比較して見られるようにしてみたりもした。

ソフトウェアは簡単で、これまで5万本ほどが作られている(もっとありそうな気もするが)。

Webは、1996年から2ヶ月ごとにスナップショットを取っている。

ためるだけでは駄目で、アクセスできるようにしなくてはならない。そのために図書館の歴史を研究してみたが、それで気が付くのは、図書館は非常にしばしば火事にあったり、非常にしばしば政府によって焼かれてしまっているということである。これを保存するには、まずはコピーを作ることである。アレクサンドリア図書館ver. 2を作るべく、Amsterdamと、AlexandriaとSan Franciscoにサーバーを置いている。これで次の数世紀を生き残れるかどうか試したい。

さて、これから何をすべきかを考えたい。open network、Seattleのwireless.netやMIT roofnet、SFlanなどの流れが良い。皆が自宅にwireless routerを持っているのだから、それら同士がつながるようにすれば良い。Webサーチもオープンなものにすべきである。nutchというサイトでは、1人の女性がgoogleよりも多くのウェブページをインデックス化した(がそのために彼女はGoogleに雇われてしまった)。個人でも頑張れできる。Torのような匿名ネットワークも重要である。米国では匿名での出版に関する長い歴史がある。Defensive Patentも重要である。特許をとるときに防御的に使うために取ることをはっきりとさせてとる。Wikipediaのページにもっと詳しい属性を付けられるようにすべきである。encycropediaには、propediaやmicropediaというインデックス用のものがある。このインデックス化をもう数段挟めば、インターネット全体をもっと必要な情報のレベルによってインデックス化できる。本の集合に対するアノテーションもできればよい。

という話だった。大きな話だが、着実に小さなステップを踏んでいるというなかなか素晴らしい話である。彼の講演の後また例によって頂上作戦を取るべく直接話をしてみた。Dannyと知り合いだという話はともかく、Bob Stein(彼と昔一緒にプロジェクトをしたことがあるはずだ)が最近やっていることを耳打ちしてみたり。未来の本に関してはいろいろな動きがあるのだが、そろそろ何か面白いものがでるかもしれん。

Lightning TalkではTinLizzieのデモを5分ほどしたのだが、目玉だったはずの2D Croquetはうまく動かなかった。ああ。車の例をもっとみっちりするべきだったかな。

夜は、MIT Museumを借り切ってパーティー。Lisp Machineがあったり、ロボットがたくさんあったり、インタラクティブ・アートがあったり、ストロボがあったり。SICPの授業では、82年頃(?)、HPに48台Scheme用のChipmunkというマシンを作らせて、それを使って実習をしていたそうだが、その機械がすでに博物館入りしている。近くの人としゃべっていたら、「俺このマシンでSussmanにScheme習ったんだよ。自分が勉強に使ったマシンが博物館入りしているのを見るのはちょっとがっかりするよね」と言っていた。そりゃそうだ。