IIJ-II、Wikipedia人気記事ランキングシステムを構築……ビッグデータ処理技術を応用 | RBB TODAY

IIJ-II、Wikipedia人気記事ランキングシステムを構築……ビッグデータ処理技術を応用

エンタープライズ ソフトウェア・サービス

「Wikipedia人気記事ランキングシステム」トップページ
  • 「Wikipedia人気記事ランキングシステム」トップページ
  • 過去3か月の「長寿」ページのアクセス数推移
 インターネットイニシアティブ(IIJ)は12日、“Wikipediaの人気記事ランキングシステム”を一般公開した。100%子会社のIIJイノベーションインスティテュート(IIJ-II)が開発したクラウド技術「Project Gryfon(プロジェクト・グリフォン)」の技術を応用している。

 日本語版Wikipediaのデータ(2013年5月末時点で約171万ページ)について、1時間ごとの各ページビュー情報を取得し、アクセス数が多いページを順に表示可能となっている。前日のデータ集計をもとにしたカテゴリ毎のランキングを、「急上昇TOP 10」「アクセス数TOP 10」「平均アクセス数TOP 10」などの分類で見たり、トラフィックの推移をグラフで見ることも可能。

 IIJ-IIでは、Wikipediaの辞書データをテキストマイニング系ビッグデータ解析における基礎データとして活用している。今回、クラウドアプリケーション向けプラットフォームとして開発を進めている「Project Gryfon」の技術を応用した事例として、ランキングシステムを構築した。Wikipediaでは、Page view Statisticsも提供しており、任意に選んだ1時間内のWikipedia(およびその他のWikimediaプロジェクト)の各ページビュー情報を取得できる。Project Gryfonでは、このページビューを集計するものとなっている。

「Wikipedia人気記事ランキングシステム」http://www.gryfon.iij-ii.co.jp/ranking/
《冨岡晶》

関連ニュース

特集

page top