KDDI研究所、Webサイトの“見た目”から有害サイトを検出する技術を開発 | RBB TODAY

KDDI研究所、Webサイトの“見た目”から有害サイトを検出する技術を開発

エンタープライズ セキュリティ
今回の開発技術の動作の仕組み
  • 今回の開発技術の動作の仕組み
  • 各方式の特性
 KDDI研究所は、有害サイトに特有な「見た目」(外形的特徴)を捉えることで、有害サイトを高速かつ高精度に検出する技術を開発したことを発表した。

 この技術は、独立行政法人情報通信研究機構(NICT)からの委託研究である「インターネット上の違法・有害情報検出技術の研究開発」の成果の一部として開発されたもの。90%以上の高い精度で、文書解析によるフィルタリングシステムと比べて3倍以上高速に、有害サイトを自動検出できるという。

 現在主流のフィルタリングシステムの「ブラック/ホワイトリスト方式」では、URLリストのデータベースを管理するためのコストが大きくなる点や有害Webサイトと無害Webサイトの双方が同じURLドメインに存在する場合があるため、判定精度が低下する点が課題だった。また、Webサイトに記載された単語から有害Webサイトを検出する「文書解析方式」、画像の特徴を解析することで有害な画像を検出する「画像解析方式」も開発されているが、高精度な検出には多くの処理時間が必要だった。

 今回開発された技術では、「背景色」「リンク先」「ブラウザに特定の動作をさせるスクリプト」など、WebサイトのHTMLを解析することで、有害サイトに特有な外形的特徴を自動的に学習し、検出することを可能とした。従来の文書解析方式では10,000個の特徴が必要だったのに対し、今回開発された外形的特徴に基づく方式では、わずか26個の特徴を用いるだけで90.3%という高い精度で有害サイトを検出することが可能となっている。また、処理速度も従来の文書解析方式と比較して、3倍以上の高速処理を実現した。

 これにより、従来の方式と比べて誤検出が少なく、短時間で有害Web検出フィルタリングが可能となるため、フィルタリングシステムが導入されたブラウザなどを快適に利用できるようになる見込みだ。今後は本技術を活用したフィルタリングシステムを、PCなどのブラウザ、ISP(インターネット接続事業者)のフィルタリングサービス、監視事業者におけるWebサイトの監視業務などへ導入できるよう、技術開発を進めて行くとともに早期の実用化を目指すとのこと。
《冨岡晶》

関連ニュース

特集

page top