「ゎナ=∪も行くょ〜」も修正 —— KDDI研、「くだけた表現」の自動判読技術を開発

2009年12月3日(木) 16時57分
くだけた表現を修正し解析可能にの画像
くだけた表現を修正し解析可能に
くだけた表現修正技術の詳細の画像
くだけた表現修正技術の詳細
 KDDI研究所は3日、従来の言語解析技術では正しく解析することが困難だった、ホームページやブログ上で使われる口語やギャル文字などの「くだけた表現」を、正規な表現に自動修正する技術を開発したことを発表した。

 Web上の文章には誹謗・中傷や犯罪予告などの違法・有害な書き込みも含まれており、これらの表現を言語解析によって自動的に検出するフィルタリング技術に注目が集まっている。しかしWeb上の文書には口語やギャル文字、伏せ字などが多数含まれている上に、日々新しい言葉も現れており、従来の言語解析技術では正しく解析することが困難だった。

 今回開発された技術では、「ゎナ=∪も行くょ〜」「auの携帯ってヵゎいいね」「オ●マ大統領来日」といった文章であっても、システムが自動修正し、「わたしも行くよ」「auの携帯ってかわいいね」「オバマ大統領来日」と解析可能な文章に変換する。解析不能なくだけた表現を検出し、その修正候補となる表現を新聞文書などの正規な表現を多く含む文書から自動的に検索して取得。取得した複数の修正候補の中から適切な表現を選ぶために、同じような文脈で頻繁に使われている表現かどうか、元のくだけた表現から大きく変化し過ぎていないかどうか、修正後の文章が日本語として自然かどうか、といった指標を計算する。なおこの技術を商用のブログ記事に適用した結果、従来の形態素解析器では解析できなかったくだけた表現を最大38% 減少させることを確認したとのこと。

 この技術は、情報通信研究機構(NICT)からの委託研究である「インターネット上の違法・有害情報検出技術の研究開発」の一部として開発されたもの。本技術の利用により、Web上の文書を高精度に解析し、違法・有害な情報のフィルタリング精度を向上させたり、掲示板の口コミ情報から商品の評判を高精度に分析したりすることができるようになる見込みだ。今後は本技術を違法・有害情報フィルタリング技術などに応用していく予定。
《冨岡晶》
注目の情報[PR]

注目ニュース

子どものネットトラブル、「性犯罪」危惧する父兄が40%超 〜 ネットスター調べ

 ネットスターは25日、第十回「家庭でのインターネット利用実態調査」の結果を公表した。

セールスフォース・ドットコム、企業ソーシャルプラットフォーム「Salesforce Chatter」を新たに発表

 米セールスフォース・ドットコムは現地時間18日、新たなエンタープライズ・コラボレーション・アプリケーションおよび開発プラットフォームとなる「Salesforce Chatter」を発表した。

小学生の「情報モラル教育」家庭?学校? 父兄の意識差あきらかに 〜 gooリサーチ調べ

 インターネットアンケート・サービス「gooリサーチ」を共同で提供するNTTレゾナントと三菱総合研究所は13日、第7回「小学生のインターネット利用に関する調査」の結果を公表した。

NEC、アプライアンスサーバがトレンドマイクロのSaaS型セキュリティサービスに対応

 NECは19日、アプライアンスサーバ「Express5800/InterSecシリーズ」において、トレンドマイクロのSaaS型メールセキュリティサービスのサポートを発表した。

日本情報通信、チェック・ポイント「VPN-1 Power VSX」搭載装置を日本で初販売

 日本情報通信(NI+C)は15日、チェック・ポイント・ソフトウェア・テクノロジーズの仮想化ファイアウォール製品「VPN-1 Power VSX」を搭載した高機能仮想化ネットワーク装置を発表した。

「サイト管理人がウイルス感染を助長しないTIPS」、G Dataが公開

 G Data Softwareは15日、Webサイト運営者を対象にした調査を行い、その結果をもとにした「管理人が自分のサイトでウイルスを意図せず拡散させないためのTIPS」を公開した。

NTTぷらら、「ネットバリアベーシック」で有害サイトフィルタのレベルを細分化

 NTTぷららは14日、同社が提供するインターネットサービス「ぷらら」において、フィルタリングサービス「ネットバリアベーシック <URLフィルタ>」の機能向上を行うことを発表した。

警察庁「インターネット・ホットラインセンター」、上半期は通報62,462件 〜 違法情報が大幅増

 警察庁は24日、2009年上半期の「インターネット・ホットラインセンター」の運用状況について公表した。

G DATA、ウイルス対策ソフト最新版「インターネットセキュリティ2010」販売開始

 G DATA Softwareは17日、総合セキュリティソフト「G Dataインターネットセキュリティ 2010」シリーズの販売を開始した。

TCAと日本レコード協会、「違法音楽配信対策協議会」を設立

 電気通信事業者協会および日本レコード協会は16日、総務省など関係省庁との密接な連携のもと、「違法音楽配信対策協議会」を設立した。

NTT Com、企業向けクラウド型メールサービス「Bizメール」を発表

 NTT Comは15日、クラウド型メールサービスである「セキュアICT Bizメール(Bizメール)」を発表した。10月1日より提供を開始する。

G DATA、ウイルス対策ソフト最新版「インターネットセキュリティ2010」9/17発売

 G DATA Softwareは、17日より総合セキュリティソフト「G Dataインターネットセキュリティ 2010」シリーズの販売を開始する。ジャングルを通しての販売となる。

IIJセキュアWebゲートウェイサービスが「マルウェア防御オプション」を試験提供 〜 ブラックリストを活用

 IIJは27日、企業に必要なWebセキュリティ対策を統合的に行う「IIJセキュアWebゲートウェイサービス」において、あらたに「マルウェア防御オプション」を追加し、提供を開始した。

【子どもとネットVol.1】ティーンのオンラインセーフティ〜意識と取組み

 ティーンをネットトラブルから守るための対策として、オンラインセーフティ教育の必要性が注目を集めている。子どもたちの意識は、また保護者はどんな対策ができるのだろうか。

ワンクリ詐欺やグロ画像に遭遇した生徒がほぼ半数! 〜 慶大、デジタルアーツ共同調査

 慶應義塾大学大学院メディアデザイン研究科とデジタルアーツは19日、「青少年のインターネット・携帯電話利用に関するアンケート」の結果を公表した。

自民と民主、ともに「ネットの選挙運動、解禁すべき」と回答 〜 楽天が政策について質問状を送付

 楽天の三木谷浩史氏をはじめとするeビジネス関連企業の経営者ら60人は10日、連名で「eビジネス振興のための政策に対する質問状」を自由民主党および民主党に提出したことを発表した。

KDDI、保護者・教育機関向けサイト「見つめてみよう、子どものケータイ」を開設

 KDDIは7日、保護者・教育機関向けに、青少年のユーザに安心・安全に携帯電話を利用してもらうための情報を掲載したサイト「見つめてみよう、子どものケータイ」を開設した。

Twitter、マルウェアサイトなど「悪意あるURLのつぶやき」をブロック開始

 Twitterは、既知のマルウェア・サイトへのリンクを含むメッセージのフィルタリングを開始した。Twitter自身はこの件を公表していないが、エフセキュアが確認、3日に同社公式ブログで公表した。

SBモバイル、フィルタリングサービスのラインアップを拡充 〜 子どもの年齢や知識に応じて3段階から選択

 ソフトバンクモバイルは31日、年齢や知識・判断力などに応じて閲覧制限の強さを3段階から選択できるよう、フィルタリングサービスのラインアップを拡充すると発表した。

ミクシィ、18歳未満の青少年ユーザー確認を8月より実施

 ミクシィは27日、ソーシャル・ネットワーキング サービス(SNS)「mixi」における青少年ユーザー保護のためのユーザー確認を、8月18日より実施することを発表した。

LogLogic、IODEFに対応したログ管理ソリューション「Security Event Manager v3.3」を発表

 米LogLogicは22日、「LogLogic Security Event Manager v3.3」を発表した。

NEC、アプライアンスサーバ「Express5800/InterSec」に新製品8種を追加 〜 2,000ユーザをサポート

 日本電気は23日、アプライアンスサーバ「Express5800/InterSec」において、処理性能や負荷分散、運用管理機能などを強化した8製品を新たに追加した。同日より販売活動を開始、出荷は31日...

夏休みを前に「親子で話そう、決めよう、ケータイのルール。」PRキャンペーンが開始

 電気通信事業者協会は10日、ケータイのルールやマナーの必要性についてより多くの人に呼びかけるため、夏休みを前に「親子で話そう、決めよう、ケータイのルール。」PRキャンペーンを実施することを発表した。

子どもに悪影響を与えるテレビ番組、「あると思う」が80%超え

 メディアが子どもへ与える悪影響はどのくらい懸念されているのだろうか。アイシェアは、20代から30代のネットユーザー男女597名の回答を集計した。

キヤノンITソリューションズ、情報漏えい対策を強化した「WEBGUARDIAN」新版などを発表

 キヤノンITソリューションズとNECソフトは23日、Webやメールからの情報漏えいを防止するセキュリティ管理ソフト「WEBGUARDIAN」「GUARDIANWALL」最新版を発表した。

NEC、高可用性クラスタソフトウェア最新版「CLUSTERPRO X 2.1シリーズ」販売を開始

 NECは16日、高可用性クラスタソフトウェア「CLUSTERPRO」の中核である「CLUSTERPRO X」の最新版、「CLUSTERPRO X 2.1シリーズ」の販売を開始した。

NTT Com、SaaS型セキュアインターネットゲートウェイ「セキュアICTサービス」を強化

 NTTコミュニケーションズ(NTT Com)は3日、BizCITYコンセプトを実現するSaaS型セキュアインターネットゲートウェイ「セキュアICTサービス」へあらたな機能やメニューを追加した。

デジタルアーツ、ネット対応TV向けに“Webフィルタリングソフト”を提供

 デジタルアーツは9日、インターネット対応テレビ向けWebフィルタリングサービス「i-フィルターfor TV」を発表した。

「青少年ネット規制法」が本日より施行 〜 フィルタリングの義務化など

 本日4月1日より、「青少年ネット規制法(青少年が安全に安心して利用できる環境の整備などに関する法律)」が施行された。

RSS

特集・連載

楽天でキーワードをチェック

ブロードバンド/無線LANスポット検索

ブロードバンド検索
-

ピックアップフォト