セマンティックWeb=単なる属性記述規定?

2004年2月26日

セマンティック・ウェブが目指さないもの」(The Web KANZAKI)を読んで、思ったことをつらつらと。

セマンティックWebというのは「セマンティック」という言葉に惑わされるとやはりダメで、情報に対する単なる形式属性を記述するための規定と捉えるべきではないかと(気付くの遅い?まだ誤解してる?)。WindowsのエクスプローラとかMacOSのFinderでファイルを扱う際に表示できる、ファイルの名前や変更時間、ファイル容量などの各種プロパティみたいな感じで。

ただ「ファイル」ではなく、個々の「情報」が持つ属性を記述するための規定だという点が根本的に異なるわけです。情報をネットワーク上にファイルとして置いたときに、ファイルとしての属性と情報そのものの性は当然異なります。ですから両者を分離して、情報の属性を中心として扱うための仕組みを整備する、という意味合いが大きい、と。

この辺は「blog系サイトのlast-modefiedを見るとコメント追加によるリビルドまで拾っちゃうから、RSSのdc:dateを見るようにした方が良い」といった、アンテナ界隈で耳にする話と関連するかもしれません。

さて話を元に戻すと、ここで「情報が持つ属性」という部分が、セマンティックWebが誤解される大元のような気がします。

「情報が持つ属性」と表現すると、情報(コンテンツ)の内容を表現する属性と想像されがち(「セマンティック」だし)ですが、実際には著者や作成日時を始めとした、情報の形式属性(外部属性とでも言いますか)を規定することに主目的があるように見えます(先に「単なる形式属性を記述するための規定」と書いたのは、こういう意味です)。その意味で、セマンティックWebという用語はやはり良くないような気がします。誤解するのが悪いというよりも、誤解してくれといわんばかりの用語選定がちょっとアレかなあと。

ところで、セマンティックWebという言葉で(我々一般人によって)誤解されがちな方面では、Googleの動きが気になります。検索エンジンやSEOを主に扱うサイトの情報から判断すると、Googleが情報の重み付けを行うにあたって、どうもコンテンツの内容を見る方向でアルゴリズムを整備しつつあるようなのです。GoogleはAI(人工知能)を目指している訳ではないでしょうから、内容そのものを理解するのではなく、あくまでリンク構造や各種マークアップを中心とした形式構造から、コンテンツの内容の意味判断や重み付けを行うつもりでしょう。

個人的にこのようなボトムアップの問題解決方法には限界があると考えているのですが、このアプローチでどこまで行けるのかには興味がありますし、今後の動きに注目したいと思います。しかしこの辺の話はLonghornのWinFXが先行するものとばかり思っていたんですが(過去記事)、やはりネットワークの世界の方が動きは速いようです...。

The 1140px CSS Grid System · Fluid down to mobile