【富士通フォーラム(Vol.19)】散在するデータを価値ある情報に | RBB TODAY
※本サイトはアフィリエイト広告を利用しています

【富士通フォーラム(Vol.19)】散在するデータを価値ある情報に

エンタープライズ その他
情報統合プラットフォームの概念図
  • 情報統合プラットフォームの概念図
  • デザインシートを使った情報統合のイメージ
  • クレンジングを行いたい範囲を選択する
  • 「住所表現をクレンジング」をクリック
  • 一瞬でクレンジング作業が行われる
  • 住所・氏名クレンジングの概念
  • 別々のリストから同一顧客を抽出、よりきめ細かなCRMが可能
 「富士通フォーラム2009」では、散在する各種データを簡単なデザインシートを使って統合し、価値ある情報に変える「Interstage Information Integrator V10」と、住所表記の揺れなどを自動的に修正する日本語データクレンジング機能をもつ「Interstage Information Quality(仮称)」のデモが行われていた。

 たとえば「アンケート葉書から取得したリスト」と「直販WEB経由の顧客リスト」といったように、フォーマットの違う複数のデータから氏名や住所といった共通のデータを取り出し、1つのデータに統合したい場合、ひとつずつ手作業で行うか、そうでなければなんらかの言語を使ってプログラムを開発する必要があり、どちらにしても非常に手間とコストがかかる。

 「Interstage Information Integrator V10」を使えば、データ統合の仕様を設定するデザインシートと呼ばれる簡易な設定ファイル(Excelのアドインを使用)を作成するだけで、DBからの抽出、データの収集、文字コード・フォーマットの変換、集計、ファイル出力といった一連の作業を容易かつ高速で実現できる。

 データ形式の追加や変更があった場合もプログラムではなくデザインシートを変更するだけで対応できるので、運用性・保守性・即応性に優れ、データ統合のトータルコストを削減できる。また「Interstage Information Quality(仮称)」を使えば、高精度な辞書コンテンツを使った住所・氏名などの日本語データクレンジングが可能になる。

 例えば、「東京都新宿区西新宿1−26−2」と「西新宿1−26−2」、「東京都新宿区西新宿1丁目26番地2号」といった同一住所なのに表記が違うため二重登録されていたものを、指定した形式に統一することによって、データの一意性を保つことができる。多くは人間の目による確認に頼っていた、いわゆる「名寄せ」作業を自動化することができるのだ。
《田口和裕》
【注目の記事】[PR]

関連ニュース

特集

page top