KDDI研、ネット投稿やつぶやきから年齢・性別・職業・出身・趣味等を高精度で推定できる技術開発 | RBB TODAY

KDDI研、ネット投稿やつぶやきから年齢・性別・職業・出身・趣味等を高精度で推定できる技術開発

 KDDI研究所は27日、インターネット上のブログや掲示板に投稿された文書を解析することで、投稿者のプロフィール(年齢、性別、職業、出身、趣味など)を自動推定する技術を開発したことを発表した。

エンタープライズ ソフトウェア・サービス
動作の仕組み(テレビ番組視聴者の意見集約システムの例)
  • 動作の仕組み(テレビ番組視聴者の意見集約システムの例)
  • 視聴者の意見表示画面
 KDDI研究所は27日、インターネット上のブログや掲示板に投稿された文書を解析することで、投稿者のプロフィール(年齢、性別、職業、出身、趣味など)を自動推定する技術を開発したことを発表した。

 商品やコンテンツに対する評判は、ユーザーの年齢や性別、趣味などのプロフィールに応じて異なるため、たとえば、若者にとって「おもしろい」と好評のテレビ番組が年配者に取っては「騒々しい」などの悪評を得ることもある。しかしブログや掲示板にはユーザーの年齢や性別が記載されていない場合が多いため、どんな人が肯定的または否定的な意見を持っているかが分かりにくかった。こうした問題に対し、本技術を評判解析技術に適用することで、商品やコンテンツに対して年代や性別などのプロフィールごとに、どのような意見を持っているかが分かるようになり、マーケティングへの応用が可能とのこと。

 本技術では、TwitterのIDのような投稿者に付与されたIDを利用して、クチコミ投稿者の過去の複数のコメントを取得することで、そのなかに含まれているプロフィール推定に役立つキーワードを取得。プロフィールが推定できるまでコメントをさかのぼって取得することで、高精度なプロフィール推定を可能とした。たとえば、日常のコメントに「学校」や「部活」「宿題」などの単語が頻繁に見られるユーザは、年齢が「10代」で職業が「学生」と推定。他にも、日常のコメントに「梅田」「なんば」「やねん」のような単語が頻繁に見られるユーザーは関西に居住していると推定するといった手法を採る。Twitter上でプロフィールが確認できたユーザー約10,000人のプロフィールを本技術を利用して推定したところ、年齢は80.2%(20代は89.5%)、性別は78.3%、出身は72.6%など高精度に推定できることが確認できたという。

 今後は本技術を評判解析技術に応用していく予定で、同研究所では、コンシューマ向けの応用の一例として、テレビ番組に対するクチコミをリアルタイムに分析することで、どんな人が同じ番組を見ていてどのような意見を持っているかを手軽に調べられるようなシステムを試作。この試作システムを「CEATEC JAPAN」(10月5日~10月9日開催)に出展するとのこと。
《冨岡晶》

関連ニュース

特集

page top