ウェブの情報量は日々増え続けますが、それをさらに加速するのが「センサー」が提供するさまざまな情報です。たとえばGPS付きの携帯電話のように、センサーを備えた機器がネットワークへ接続されると、センサーが取得した情報がネットワークへ流入することになります。白書の前段では、そうした「増え続けるデータ」と、それを活用する仕組みとして「集合知(collective intelligence)」がキーワードとなっていました。
白書の中段では、集合知についてさらに踏み込んでいきます。ウェブは「クラウドソーシング(不特定多数の人に業務を委託する雇用形態)」だという見方がありますが、たしかにアプリケーションが人間に役割を割り当てているとも考えられます。
`
オンライン事典(Wikipedia)やレビュー付きのオンラインカタログ(Amazon)、地図上へ情報を追加する(ウェブによる地図アプリケーションの数々)、最も人気のある話題を見つける(DiggやTwine)のように、一般的に、アプリケーションとはユーザーに特定の役割を果たさせるために作られているものであると理解されている。AmazonのMechanical Turk(メカニカルターク)というサービスは、人々をつなぎ合わせて、コンピューターだけで処理するのが難しい仕事を割り振るプラットフォームを提供することまでするのである。
`
しかし、こうしたことが「集合知」の意味するところなのか、と白書は問いなおします。人間やセンサーがもたらす膨大な情報を浴びるようにして存在するウェブを、周囲からの刺激や環境から学習していく赤ん坊にたとえて、次のような問いを立てています。
`
ウェブは成長するにつれて賢くなっていくものなのだろうか?
`
Googleでの検索結果を例にすると、結果の上位に示されるリンクは、検索語の利用頻度やユーザーのクリック数などの動向を反映して変化します。このあたりから、ウェブに対する「入力」という視点がキーワードになってきます。
`
1998年にLarry PageとSergey Brinが画期的な打開をなした。リンクとはもはや新しいコンテンツを見つけるための手段ではなく、コンテンツを、ランク付けしたり、より洗練された自然言語の文法へと結び付けたりする手段であると示したのである。簡単に言うと、あらゆるリンクのそれぞれが1票となり、ナレッジのある人びとからの投票によって(投票した人びとの数と質によって計られる)、他のリンクよりも多く票を得るということである。
`
この場合はユーザーの検索行為や振る舞いが「入力」となってウェブに反映されています。さらに、iPhone用のGoogle Mobile Appでピザレストランを検索する例を挙げています。このアプリは音声認識モードとGPSというセンサーを使って、声から音声データベースを解析することで検索語を、GPSから位置情報を得て、検索を開始します。ここで注目すべきは、明示的なかたちで「入力」を与えることなく、ウェブから結果が得られるという点です。つまり、こうした仕組みの後ろでは、アプリケーションが「学んだり」、「教えられたり」しているのです。
`
アプリケーションによって参照されたいくつかのデータベースは — GPSの情報を位置情報に変換したように — アプリケーションに“教えられる”一方で、音声認識のように、巨大でクラウドの元になるようなデータセット(ひとまとまりのデータのこと)を処理することによって“学ばれて”いるのだ。
`
「入力」を、明示的なものと暗示的なものの2種類に分けてみると、そこには「ウェブが学ぶ」という仕組みが見えてきます。興味深いのは、暗示的「入力」からウェブが意味を取り出すという視点です。
`
しかし、ウェブはどのようにして学ぶのだろうか? 意味とはなんらかのある分類によって解読されるもので、コンピューターのプログラムはそれを理解したりまたはそれに反応したりするだけなのだと、イメージされているかもしれない。私たちが実際に見てきたのは、意味とは多数のデータから“推論されるようにして”学ばれるということだ。
`
「ウェブが学ぶ」という過程の中でポイントとなるのは、データをいかに構造化して処理するのかということです。なぜなら、構造化されたデータは、ウェブにとって「意味」を持つことができるからです。その初歩としてまず考えられるのは、構造化されたデータ同士を合わせることで新しい「意味」を得る場合です。
`
他のケースでは、意味はコンピューターへと“教えられる”。つまり、アプリケーションに、ある構造のデータセットの間にある解読方法が与えられているということだ。たとえば、通りの番地とGPSの座標とを連携させることで、学ばれるというよりは教えられるのである。いずれのデータセットも構造化されているが、お互いをつなぎ合わせるためのゲートウェイ(通路)が必要となる。
`
次に、構造のないデータを構造化するということがあります。これについては、「一見すると構造化されていないデータを構造化する」、つまりデータの中からある構造を見出すことだ、と述べています。まったくでたらめなものの中からある意図をひねり出すわけではありません。
`
または、アプリケーションに、ある2つのデータの間にある関連を理解する方法を教えることで、構造化されていないように見えるデータに対して構造を示すこともできるだろう。You R Here(http://www.longtrek.com/LongTrek/)というiPhoneアプリは、こうした2つのアプローチを組み合わせたようなものである。ユーザーはiPhoneのカメラを使って、Googleマップなどの一般的な地図アプリケーションに載っていないような詳細な地図・・たとえば、公園の足跡マップやハイキング・マップなどのような・・を写真に撮る。そしてiPhoneに搭載されたGPSによってユーザーの現在位置を地図上に設定する。ある距離を歩いて、次の地点を設定する。するとiPhoneはオリジナルの地図画像の上にユーザーの足跡を記録してくれる。これはGoogleマップに記録するよりもずっと手軽だ。
`
そして、これに続く次の段落がポイントになります。
`
ウェブ上で最も基本的で役に立つサービスのいくつかはこのようなやり方で作られているものだ。最初は構造化されていないように見えて見過ごされていたデータを、見分けて、そしてその規則性を教えるのだ。
`
さて、ここまで読み進んでくると、ウェブは成長するにつれて賢くなっていくもののようです(おばけのように巨大に成長し過ぎないのかな、と妄想してしまいそうですが)。今回は、”Redefining Collective Intelligence: New Sensory Input” と “How the Web Learns: Explicit vs. Implicit Meaning” の2つの節を見て来ました。白書の後半では、ウェブと人間との関連について再考しています。ウェブがおばけ入道になるのかどうかは、次回の後半を読んでからのお楽しみです。
白書の原典は下記から参照できます。PDF版のダウンロードもあります。
Web Squared: Web 2.0 Five Years On
Download the Web Squared White Paper(PDF, 1.3MB)