IT製品導入に関する技術資料を多数掲載 ホワイトペーパーダウンロードセンター
  • @IT
  • ITmedia エンタープライズ
  • ITmedia マーケティング
  • TechTarget
  • キーマンズネット
  • ITmedia ビジネスオンライン
  • ITmedia NEWS

ファストサーチ&トランスファ株式会社

事例

ファストサーチ&トランスファ株式会社

構造化データの検索

コンテンツ情報
公開日 2007/02/19 フォーマット PDF 種類

事例

ページ数・視聴時間 13ページ ファイルサイズ 922KB
要約
構造化コンテンツの取扱いは、大きく2つの過程に分かれる。1つはデータの作成・管理、もう一つは情報をオンデマンドで抽出・分析する過程だ。RDBMSはこれまで事実上の業界標準とみなされてきたが、抽出と分析のプロセスやOLAP環境に、従来どおりのリレーショナルモデルでの対応に無理が出てきた。そこで、自然言語でのクエリがなぜ難しいのか、テキストから抽出したものにどのような意味があるのか、システムがリアルタイムで処理できないのはなぜか、どうすれば分析効果を向上できるか、プロセス全体を管理するのになぜ高額の費用がかかるのかといった疑問が生まれ、RDBMSベンダ各社は初歩的な検索技術を組み込んだデータベースエンジンの新バージョンリリースを始めた。
一方検索エンジンベンダも、構造化・非構造化データ両方を、RDBMSとは別の方法でマイニングを進めている。同資料では、両アプローチを比較・解説する。