情報大工のひとりごと

情報デザイン業務の周辺で思ったこと、そして考えたこと

ダブリン・コアとかメタデータとか

2004年03月10日

先日開催された、ソシオメディア(株)主催のメタデータに関するセミナーに行ってきました。

パネリストのメンバー選定の勝利(笑)でしょうけれども、特にパネルディスカッションが充実した素晴らしいセミナーでした(これで参加無料というのも、すごい話です)。ダブリン・コア策定に従事されている両氏の発表内容は近日掲載されるであろう公式レポートに任せるとして、ここではダブリン・コアとメタデータに関しての感想を、一参加者の視点から箇条書きで。

少しネガティブ色が強くなってしまいましたが、「使える」知識ネットワークの基盤として機能することを期待したいところです。いろいろと考えることの多い、非常に有意義なセミナーを主催されたソシオメディア(株)と発表者&パネリストの皆様、本当にどうもありがとうございました。

関連記事(TrackBack)

この記事に言及する(Trackback URL)
http://www.laplace-lab.org/cgi-bin/mt/mt-tb.cgi/40

皆様からのコメント

The Web KANZAKIで反応して頂いているようなので、少し追記コメントを(脱力させてしまったようで、申し訳ありません)。
http://www.kanzaki.com/memo/2004/03/10-2

構造の隙間をつぶすには、列挙すれば良いという問題ではないと考えています。確立された概念や領域であれば問題を感じることすらないと思いますが、境界領域にあるような新しい概念であるとかアイディアであるとか、そうしたものを扱う場合にはかなり辛いことになると思うのです。
内容に関するメタ情報をベースにして、概念のネットワークをボトムアップで組みことが無理っぽいというか。その意味で、パネルディスカッションで「dmozなどを概念ネットワークとして利用するというアイディアもあるんじゃないか」という話が出たのは非常に納得できます。同じような話を以前考えていましたので。

ただ、やはり既存の分類にも機能不全の面があるのは否めません。最近一部界隈で分類ネタが流行っているのも、その辺に対する問題意識があればこそだと思います。
テクニカルコミュニケーションであるとかマニュアル制作、情報デザインというのはそういう面で非常に曖昧な存在である訳で、そうした私の普段の立ち位置が、この問題に対して(必要以上に?)ナーバスにさせている理由なのかもしれません。

形式属性中心云々の話とも関連しますが、結局のところ(それぞれの情報自体が持つ)メタデータで情報の内容を十分に表現できるのか?という根本的な部分について、あまり信用できないのです。自動付与に関しても、形式属性はともかく内容に関しては(現状レベルでは)まだまだでしょう。将来的な話をしても、先の構造の隙間の問題は絶対に出て来ることが予想されます。
あとは閲覧コンテクストを踏まえた形への変換が本当にできるのか?も気になります。

ですから、この問題が解消できるのか?を示す方策が見えてこない限りは、いくら「それは当たり前」と言われても、この種の疑問を持つ人は減らないのではないかと思います。

#ただ、なんか議論が噛み合ってないような気が…。
 実物が目の前にあれば、もう少し噛みあうのでしょうけれども。

Posted by: たかやま : 2004年03月11日 02:04

大変興味深い議論だと思います。(長いコメントになってしまい、申し訳ありません(-.-;)・・)

私が思うに、議論がかみ合っていないのは、「メタデータを分類のノウハウとしてみている」からではないでしょうか?

>結局のところ(それぞれの情報自体が持つ)メタデータで情報の内容を十分に表現できるのか?

この疑問がおそらく議論の中心になるかと思います。

別の言い方をすれば、「どうやって内容を十分に表現できる属性を見つけられるか?」になるのでしょう。この「どうやって」の部分は、メタデータのようなテクノロジーではなく、シソーラス+オントロジーのようなノウハウの領域になります。

だから、これらのノウハウを知らない人がデータモデリング(UML、ERモデル)とかで属性を定義しても、検索性を改善することができないのです。(うちの会社で大失敗しました・・涙)

神崎さんがおっしゃっているように、メタデータは内容を記述することを目的としています。そのため、セマンティックウェブのRDFにシソーラス+オントロジーのノウハウが取り入れられたのではないでしょうか?

http://www.w3c.rl.ac.uk/SWAD/thesaurus.html

********
>閲覧コンテクストを踏まえた形への変換が本当にできるのか?

この議論は私も同僚としたことがあります。要約をコピペしておきます。今後の参考になれば幸いです

Assumption: Adding metadata to information must improve information retrieval. Because of this asssumption, metadata need to meet certain quality.

A lot of metadata, like most of the Dublin Core data, do not improve information retrieval. They simply add associations to information that help people who know about this information, to find it back. This is a good technique to create some structure in your own information so you will not always look at more than a 1000 items. But it does not support information retrieval. The date, the author, the ISBN-number, all these things do not reveal anything about the information.
They only support people who have associations with the information.

The user you are trying to support has no clue whether the information exists. You communicate through metadata when your information is relevant. This type of metadata need to meet the following criterea:

1. The metadata describe both the subject (topic) and the user scenario (user, goal and condition) in which the information is relevant. Experts will mostly need the subject, novices will depend more on the user scenario for retrieving information. Metadata reveal what the information is about and what the information enables me to do.

2. The metadata really show the message (the intention) of the information. When I find information under "legal department" the information must explain something about the "legal department". "Legal department" should not be just another place for hiding your information.

3. The metadata must be clear. The book "Women, fire and dangerous things" explains this very well. It says that there is an optimal abstraction level. "car" is clear, "vehicle" is less clear. Use extremely clear metadata because you will communicate in just a couple of words.

4. The metadata will only point to useful information. Sometimes I see people who have the goal to classify all information. This will decrease their metadata to the level of search engines. Metadata must only point to useful information. Leave the information out of your classification if it is hard to describe the purpose of the information. The only reason why we have the Open Directory Project is because there people out there that can tell us where the useful information is, not all the information.

These criterea should be tested in a usability test, giving the user a real life task to find certain information and see whether the metadata will help and do not prevent this person from finding the necessary information.

Posted by: 林 : 2004年03月11日 23:10

林さん、コメントありがとうございます。とても参考になります。
基本は「ただの感想記事」だったので控えていたんですが、せっかくネタ振りして頂いたので、ちょっとコメント(でも長いです)。

1.シソーラス+オントロジーは信用していません(ごめんなさい)。
言葉に依存すると、「問題構造の類似性」を検出できないのではないかと思うのです。「確定申告めんどくさ」系の情報があったとして、どこに注目するのかで関連性なんていくらでも変わりますよね。記入フォームが悪い(視覚デザイン)、説明が悪い(テクニカルコミュニケーション)、確定申告というシステム自体の問題(税制、政治)、公務員が(略)などなど。
議論要旨でユーザーシナリオの話が出てますが、製品の設計者がユーザー行動を正確に把握できないのと同じで、これをメタデータ生成時に付与するのは現実的に無理だと思います。
それはなぜかと言うと、シナリオなりコンテクストというのは、情報とユーザーが関わる場面において発生するもので、情報それ自体に内在するものではないと考えるからです。以前「形式属性」と表現したのは、実はその辺の意味を込めています。

2.「意味の拡がり」を実現できるのか
ユーザーコンテクスト絡みで問題になるのは、上記議論でも出てますが「知ってる人には役に立つけど」だと思います。このセミナーの後にパネリストの長谷川さんと少し立ち話させて頂いたのですが、やはりこの辺の話が出ました。
ここからは私の妄想なのですが、内容を十分に表現できるというレベルであれば、(先の確定申告の例のように)表面的には異分野でも問題構造が近似している情報を検索できる、つまりユーザーの予備知識に依存しない検索ができるようになるはず、と思うのです。で、このような問題構造による意味の拡がりって、シソーラスで実現できるの?もっとメタなレベルの概念関係図が要るんじゃないの?という訳です。

3.検索エンジンとどこが(略)
となると、上記議論でも触れられていましたが「それじゃあ検索エンジンじゃん」みたいな話しになりますよね。ならば逆に「じゃあ内容を示すメタデータって、そもそも何のためにあるの?」という問いも可能だと思うんです。
将来的に分散ネットワークなどを使用した検索エンジンが動くようになると、計算機リソースの問題などもクリアされると思うんです。検索エンジンがある程度人間の知的作業を代行してくれるようになると、じゃあメタデータの存在意義って?という話が出て来てもおかしくない訳で。

というわけで、私は「どうやって内容を十分に表現できる属性を見つけられるか?」以前に、「内容を十分に表現できる属性というものはそもそも可能なのか?」レベルで引っ掛かっているのです。この辺ってすでに十分に議論されて、「可能性あり」ということで解決してるんでしょうか?

あと最後に念のため追加しておくと、メタデータ一般を否定するつもりは毛頭ありません。用途や目的が明確であれば、特に効果を発揮するでしょうし。
まとまってない上に細かい話をコメントで記述しているのでアレな面も多々あるかと思いますが、意図していることが伝われば良いなと思いつつ。

Posted by: たかやま : 2004年03月12日 18:34

この記事についてのコメントをお寄せください










名前、アドレスを登録しますか?






トップ | 新着情報 | 研究発表 | ひとりごと | 業務案内 | ご意見箱 | リンク集
このサイトについて | ご意見・ご感想はinfo@laplace-lab.orgまでお寄せください
©1996-2006 ラプラス取説研究所
ラプラス取説研究所のトップページに移動
#
新着情報のページに移動
#
研究発表の一覧ページに移動
#
情報大工のひとりごとに移動
#
ラプラス取説研究所の業務紹介ページに移動
#
ご意見箱に移動
#
リンク集に移動

新着記事(最新5件)

記事のジャンル

過去記事

アンテナ・ブックマーク

RSSフィード RSSフィード
Powered by MovableType 3.2