■背景?意義
世界中のWebサーバ数は2006年6月時点で、約8,600万台あると言われています。インターネットの情報はあたかも生き物のように自己増殖しており、これらはWeb上のホームページ、ブログ、掲示板あるいはメールなどに整理されずに散在したままです。
これらの情報の意味や関連情報を繋ぎ合わせることで、新たな知識を再構築するセマンティックWebという研究が世界中で行なわれ、The World Wide WebConsortium
(W3C)で標準化作業がすすめられています。この研究は、医療やバイオテクノロジを含む生命科学分野、ソフトウェア開発現場におけるソフトウェア資産の再利用、ディジタル情報家電を統合して遠隔管理する基盤および製品?サービスの評判を抽出し、新製品やサービスの企画に活用するニーズ探索など広い分野での応用が期待されています。 |
|
|
■概要
このプロジェクトでは、ホームページ、ブログ、掲示板あるいはメールなどWeb上に散在する未整理な状態の情報を意味の関連性でつなぎ合わせ、正確かつ効率的に人が求める情報を探し出す、インターネットの情報活用基盤Web辞苑を開発します。自然言語処理を用い、文書中に同時に現れる語句同士を繋ぎ合わせて意味ネットワークを構築し、更に発想支援、談話理解および質問理解機能などの技術を駆使して膨大な情報をグリッドコンピューティング環境で高速処理することで実用性が高いシステムを目指します。 |
|
|
|
|
|
|