【インタビュー】「ビッグデータ」時代の文書管理とは?(前編) | RBB TODAY
※本サイトはアフィリエイト広告を利用しています

【インタビュー】「ビッグデータ」時代の文書管理とは?(前編)

エンタープライズ ソフトウェア・サービス
インタビューの様子
  • インタビューの様子
  • ジャストシステム エンタープライズ事業部 事業部長 菊地修氏
  • ジャストシステム 販売促進部 部長 星野和志人氏
  • 高精度検索方式「NL-Vgram」
  • 「フィールドナビ」利用画面(ConceptBase Enterprise Search 3.0)
  • サムネイル表示モード(ConceptBase Enterprise Search 3.0)
  • リスト表示モード(ConceptBase Enterprise Search 3.0)
  • 通常表示モード
■データの「整理と活用」が多くの企業で課題に

 昨今、「ビッグデータ」というキーワードに代表されるように、企業内に蓄積された膨大なファイルやドキュメントなどのデータ類をいかに整理して、有効活用すべきか? という課題がクローズアップされ、文書管理ソリューションへの注目が高まっている。前回取材した大塚商会では、「発生」・「管理」・「保存」・「廃棄」という4つのフェーズに整理して文書管理のソリューションを提供していた。このうち、「管理」のフェーズにおいて重要なことのひとつが、データの中から必要な情報を迅速かつ正確に見つけ出せる検索性である。

 「いま製造業や、流通・サービス業のお客様からの問い合わせが急増しています。彼らの主たる悩みは、管理するデータ量が非常に大きくなり、ファイルサーバが肥大化しているということです。ファイルサーバに蓄積された文書類をいちから整理・管理するのは手間がかかり大変です。とはいえ、コンサルティングを外注し、業務活用のステップを踏むという流れになると、作業プロセスとして長いものになってしまうというジレンマもあります」と語るのは、ジャストシステム エンタープライズ事業部 事業部長の菊地修氏だ。

■ConceptBase Enterprise Searchで社内のあらゆるデータを横断検索

 そのため、検索システムを利用し、手軽に業務改善を図りたいという引き合いが多くなっているそうだ。同社では企業内検索システムとして、すでに国内で3800社を超える導入実績を誇る検索エンジン「ConceptBase Enterprise Search」を発売している。同製品は、中堅・中小企業から、KDDIや大林組などの大手企業まで幅広く導入されている。前回取材した大塚商会の「eValue NS」でも、ドキュメント管理やコミュニケーション(掲示板)、ファイルサーバを対象に、全文検索を可能にするオプションとして提供されている。

 この点について、ジャストシステム 販売促進部 部長の星野和志人氏は、「『eValue NS』に提供させていただいている企業内検索オプションは、『eValue NS』シリーズ内だけではなく、ファイルサーバやデータベース、ポータルといった、社内に置かれたあらゆるリソースを統合した形で、一度に検索したいというご要望に応えるものです」と説明する。「ConceptBase Enterprise Search」では、ドキュメントのみならず、社内にあるデータを横断的に検索するために、Notes、RDB、SharePoint、HTTPなどを検索対象に設定できる各種コネクタを用意し、システム間の連携を図っているという。「そういう意味では、『ConceptBase Enterprise Search』は単なる検索エンジンという位置づけではなく、データを統合する情報基盤といってもよいものでしょう」と菊地氏は説明する。

■独自のハイブリッド方式で高精度検索を実現

 では「ConceptBase Enterprise Search」を導入すると、どのようなメリットがあるのだろうか? まずひとつに、取り扱えるデータが非常に大きいことが挙げられるだろう。企業内に蓄積された非定形文書では、約1億文書、数十テラバイトものデータを扱った実績があるという。そして何と言っても、ATOKや一太郎を開発してきたジャストシステムならではといえる高精度な検索能力に最大のメリットがある。「ConceptBase Enterprise Search」では、自然文による概念検索を実現しており、従来のキーワード検索ではヒットしにくい情報や知識を容易に発見できる点が差別化の大きなポイントだ。

 たとえば、「京都」という言葉を検索したい場合に、他社のエンジンでは「京都」だけでなく、「東京都」を含む文書も一緒に拾い上げてしまう。しかし「ConceptBase Enterprise Search」ならば、正確に「京都」だけを含む文書を検索する。一方、送り仮名/カタカナ/長音の揺れなども漏れなく検索できる。「売り上げ」という言葉を検索すれば、「売上」「売上げ」といった揺れを逃さずヒットする。また用言の活用形に対しても柔軟に対応し、「書く」という言葉を調べると、「書こう」「書きます」「書けば」「書け」というように活用形まで全てを対象に選んでくれる。「こうしたことが可能なのは、意味を理解して検索できるからです。“合成樹脂”という単語ならば、単に合成樹脂のみならず、言い換えた言葉として“プラスチック”もヒットします」と星野氏は述べる。

 ほかにも検索対象とする文書の中から重要なキーワードを抽出して提示する機能も備えている。企業内で独自に流通する言葉で、高頻度に使われるものを、導入した時点から探し出して提示できるのだ。「たとえば、携帯電話メーカーにおいて“ス”と入力すれば“スマートフォン”が提示されるという様に、インテリジェントな入力支援機能を装備しています」(菊地氏)。

 このような高精度検索を実現しているのは、同社オリジナル技術である高精度検索方式「NL-Vgram」によるものだ。ノイズの少ない自然言語処理を行う「NLP」と呼ばれる技術と、検索漏れがないように対象文字を適切に可変しながら区切って処理する「V-gram」(N-gramの発展系)という技術を併用。「NL-Vgramでは、単なる文字区切りで処理するのではなく、意味をひとつひとつ理解して、高精度に検索できる点が大きな特徴になっています」(星野氏)という。

■ユーザーの使い勝手を追及した専用インターフェイス

 検索画面で左側に表示される「ファイルナビゲーター」と呼ばれる領域には、ユーザー自身でアクセス権を持つフォルダのみ自動的に表示する仕組みがある。これらは複数ルートで高速に絞り込むこともできる。ツリー階層のフォルダで必要なものだけを明確に表示してくれるため、探す場所に戸惑うこともないだろう。検索でヒットした文書類は、右側の領域ではサムネイルとして表示され、そこにマウスを合わせると、文書を拡大したり、「パラパラめくり」のようなイメージ検索も行える。

 「ConceptBase Enterprise Search」は、9月28日から新バージョン「同3.0」が発売される予定だ。「こちらは製造業などで、CAD図面をより簡単に見たい、探したいというニーズに応えたものです」(星野氏)。新たに「CBES文書ビューアー」(別売)を採用し、サムネイルの一覧から起動して、用途ごとに色々な表示パターンを選べるようになっている。また欲しい文書をピックアップして、ショートカットとして画面上に置ける「CBデスクトップ」も搭載している。

 これに伴い、従来のファイルナビゲーターは「フィールドナビ」という形になった。その名のとおり、フィールドナビでは既存データベースに保管されているデータを属性で分類し、階層化して表示することも可能だ。「流通小売などでは、店舗で接客をしながらタブレット上から商品の仕様を確認したり、在庫照会をするといった使い方もできます」(星野氏)とのことで、現場の業務形態にも少しずつ変化が起き始めているようだ。

※後編に続く
《井上猛雄》
【注目の記事】[PR]

関連ニュース

特集

page top