研究テーマの詳細

研究テーマ「セマンティックWeb のための記述言語と推論エンジン」

 従来のWeb では,テキストによる表示・検索のサービスが中心だったが,セマンティックWeb(データWeb とも呼ばれる) ではデータの意味内容を判断することで高度なWeb処理を目指している.例えば,検索エンジンで「ワイン」と入力しても,文字列がマッチングしたWeb ページを探すだけであった.しかし,セマンティックWebでは,「赤い」「飲み物」「酒類」「原料がぶどう」などのワインを意味する属性情報をコンピューターが判断できるようにしておいて,自動的に意味から導かれる推論や検索を行う.こうした情報の意味や内容を扱うためには,洗練された記述言語と推論エンジンの整備が必要であることから,記述論理や論理プログラミングに基づく手法が必要である.
 セマンティックWebの実現には,情報の意味をコンピューターが解読できるようにするため,メタデータ,オントロジーとルールの記述が重要な役割を果たす.それらをWeb上で記述するために,国際WWWコンソーシアムではRDFS,OWLとRuleMLのマークアップ言語が標準化されている.本研究では,オントロジーとルールの2つの記述言語を融合したときに推論の決定不能性をもたらす致命的問題(即ち,推論が停止しないのでプログラムから計算結果が返ってこない)に対して,推論プログラムの停止性を保証する推論エンジンを開発している.
 兼岩研究室では,これまでの理論的成果を用いてセマンティックWebデータに対する質問言語SPARQLの推論エンジンを実装・拡張している.国内のセマンティックWeb研究者が海外の推論エンジン(エンドポイント)を用いている中で,独自にSPARQLを開発している研究室は数少ない.下図に示すように,現在,Web上の大規模な分散RDFデータ(リンクトデータと呼ぶ)を扱えるように推論エンジンを改良している.また,SPARQLの中核機能だけでなく,上記で述べたオントロジーにルール推論を追加する拡張によってWeb上での高次な推論サービスを可能にしている.この推論エンジンを用いて,商品情報の検索推論サービス,音楽アーティストの類似性評価,オントロジーからの概念知識の発見,クエリ自動生成による自然言語文の質問応答システムを研究開発している.

研究テーマ「ラフ集合データマイニングによる時系列データ分析」

 ラフ集合論は,人間のような曖昧な情報処理を可能にするソフトコンピューティング技術の一つである.ファジィ理論が要素と集合との曖昧な関係をメンバーシップ関数により0と1区間の実数値で表すのに対して,ラフ集合論は情報の粒度を変化させて集合を上近似と下近似の組で定義する.その情報の粒度はデータ表で処理されることから,属性データサンプルによる機械学習やデータマイニングに向いている.本研究では,データの粒度を変化させたときに,異なるデータリソース間の時間的遅れを分析して時系列データの因果関係を発見するアルゴリズムを開発している.
 Webデータは分野や目的に応じて公開されることから,その多くが分離・分散されて存在する.もし異分野データ間での因果関係が解析できれば,Webデータ統合サービスによって人の意思決定を支援する知識データベースが実現できる.本研究では,人間の直観的分析をヒントに,データの粒度を変化させたときに異なるデータリソース間の時間的遅れを分析してデータに因果関係が存在するかどうかを発見するラフ集合データマイニングのアルゴリズムを開発した.本研究の新規性は,以下の2 点である.1つは,論理的に無矛盾で最小の因果ルールをラフ集合によってマイニングすることである.もう1 つは,複数Webデータで互いの因果性を調べるために,2 つの時系列データを時間遅れでずらして連結し原因データと結果データとの関連性の強さ(データ変化の相関性) を比較することである.例えば,インフルエンザ発生と気象の時系列データからなる原因と結果のデータベースに対して,0日から13日へと時間遅れを変えて因果性の強さを評価する実験を行った.これは,頻度からルールを発見する伝統的データマイニングの研究とは大きく異なるアプローチである.

研究テーマ「UMLを用いた情報システム仕様の設計誤り検出アルゴリズム

 UML(Unified Modeling Language)は,国際標準のオブジェクト指向モデリング言語であり,ソフトウェアや組み込みシステムの仕様設計ツールとして用いられる.UMLではビジュアル的にシステム仕様を設計できるが,設計した仕様が整合的であるかどうかを検証する難しさがある.そのため,設計者には見つけにくい論理的な矛盾箇所を検出するための技術を研究している.

研究テーマ「Webオントロジー言語の研究」

 人工知能分野におけるオントロジーは,工学,医学,農学,バイオ,技術ノウハウなどの様々な知識を体系化して知識の統合・再利用を可能にする技術である.良質のオントロジー構築のために,それぞれの知識がもつ特性を反映したオントロジー言語を設計している.