月間3億PVのサーバーってどうなってるの? pixiv管理者に聞いた | RBB TODAY

月間3億PVのサーバーってどうなってるの? pixiv管理者に聞いた

ブロードバンド その他

pixivサーバー群:企業秘密もあり詳細はお見せできない。冷却効率も高い
  • pixivサーバー群:企業秘密もあり詳細はお見せできない。冷却効率も高い
  • pixiv開発者・管理人:馬骨氏、本人希望もありイラストでの登場
  • pixivネットワーク管理者:店本氏、やはり本人希望によりイラストのみ
  • pixivサーバー群構成概要図:pixivポリシーの具現
 9月17日にpixivの月間ページビュー(PV)が3億を突破した。会員数は約32万人、投稿されたイラスト総数は160万枚。1年前の2007年9月10日にサイトがオープンして翌年4月には1億PVを突破している。その後7月に2億PV突破、そして1周年の記念イベントが開催されているタイミングで3億PV突破となった。

 pixivは、イラストに特化したSNSサービスで、ユーザーが投稿したイラストを共有したり見せあい、評価、ランキング、ブックマークなどをつけることでコミュニケーションを図るサイトだ。扱うデータが画像ファイルとただでさえ大きくなりがちなのに、月間PVが3億にも達する「お化けサイト」のサーバーはどうなっているのだろうか。

 YouTubeがGoogleに買収されるまで、あの膨大な量の動画はどこに保存されているのか、だれが維持しているのかについて「都市伝説」が生まれるくらいだったが、このpixivはどうだろうか。そんな疑問を持つ読者(は少数かもしれないが)のために、pixivを運営するクルークに取材を試みた。

 取材に対応してくれたのは、以前サイト開設までのいきさつなどをインタビューさせていただいた、pixivの開発者である馬骨氏と、クルークで馬骨氏とともにサーバー管理を担当している店本氏のお二人だ。

 まず、pixivサーバーだが、大規模なデータセンターのようなホスティングサービスを想像している人もいるかもしれないが、サーバーはすべて自前で用意して管理している。しかも、そのハードウェアはすべて自作だそうだ。Google方式のサーバーのように、マザーボードとハードディスク、メモリに電源をむき出しの状態でエレクターラックにならべていく、筐体レスのサーバー群で構成されている。pixivほどのトラフィックや規模になると、ホスティングサービスのほうが確実で安価にできるのでは、と思ってしまうが、そうでもないらしい。

 SNSサービスとはいえ、イラストファイルという比較的大きな容量のファイルを大量に扱うデータベースや画像サーバー、ウェブサーバー、ロードバランサー(LVS)など、それぞれにチューニングが必要で「つるし」のサーバーでは構成が難しくなり、パッケージ化されたサービスではカスタマイズなどかえって高くつくという。実際、各サーバーはハードディスクの仕様、メモリやキャッシュサイズ、CPUパワーなどバラバラだそうだ。このような構成には、Google方式の筐体レスの自作サーバーが都合がよい。

 画像データが多いので、大規模なストレージサーバーを導入したらどうかと聞いてみたが、店本氏によれば、

「よく、画像表示が遅いといわれ、通信時のデータを圧縮して送ればいいというアドバイスなどをいただきますが、jpgデータなどはそもそも圧縮処理されているので、データ圧縮はあまり効果がありません。それに圧縮するとなるとCPUパワーもかなり必要です。なので、膨大なストレージで用意するよりも、CPUやメモリ(パワー)もたくさんあるサーバー群構成のほうがよいと思っています。車にたとえれば、ひとつのエンジン(CPUやメモリ)に座席(ストレージ)をたくさん作ってもスピードがでません。それよりも車の台数を増やすアプローチです。」

とのことだった。

 このような方式になったのは、じつはサービス開始の初期の段階におのずと決まっていったそうだ。昨年9月10日にサイトを開設したときは、pixivシステム(Webサーバー、PHPとMySQL)クルークのサーバーに間借りする形でインストールしていたが、1週間ほどでサーバーがパンクするようになり、すぐに別のマシンに移したそうだ。しかし、これも長くはもたず、サービス開始の同じ月内に、現状のスタイルになったそうだ。

 その後、ユーザーやトラフィックの増加に伴いシステム構成を拡張していったとのことで、おおまかには以下の図のような構成になっている。

 バックアップはどうなっているのだろうか。最近、1TBのハードディスクを増設したそうだ。そして、バックアップシステムも改良中とのことだ。

 システム管理で大変なのは、とにかくデータ件数とその容量が膨大なことだそうだ。メンテナンスやちょっとした変更でも膨大なDBクエリーが発生してしまう。バナー表示だけでも大変な負荷になる。そのため、管理アプリケーションなどフリーソフトウェアなどでは処理しきれない。もともと馬骨氏がスクラッチで開発したシステムなので、システムの管理ソフトウェアなども手作りのものも多いという。店本氏も画像処理や画像データベースに関する文献、クラスタリングの解説書など読んでいるが、用途が特殊なので必要な情報を得ることが難しいという。分散ファイルシステムにも注目しているそうだ。

 最後に馬骨氏に今後のpixivの抱負について聞いてみたところ、まず手をつけたいのは国際化だそうだ。サイトの日本語以外の言語に対応させたいとのことだ。ただし、国際化のアプローチはユーザー層を考えて、アジア圏からを考えている。韓国語や中国語のニーズは高いようだ。その次はEU圏、フランスやドイツ、イタリアなどは日本アニメの人気も高いし文化も定着している。英語対応は最後になるだろうとのことだ。

 現在実施中の1周年記念イベント「ピクシブたん」は投稿が2,000枚を超えるほど盛り上がっているそうだ。擬人化キャラクターでありながら、特定のイメージに固定されず自由な発想を許すピクシブたん。各自のピクシブたんが創造可能なように、すべてのクリエイターの活動を制限しないサイトのポリシー。サーバー構成や運用にもそれが貫かれている。運用しやすさや制御しやすさより、拡張性や柔軟性を重視した構成といえるだろう。
《中尾真二》

編集部のおすすめ記事

特集

page top