シェアする

知能コミュニケーション研究室の前田若菜さん(博士前期課程1年)が、情報処理学会データベースシステム研究会 学生奨励賞を受賞しました。(2015/11/26)

データベースシステム研究会は、DBMS (Database Management System) 技術に象徴される「データ」に関わるシステムと科学を領域として研究会活動を進めています。 この第162回データベースシステム研究発表会は、2015年11月26日に、芝浦工業大学・豊洲キャンパスにおいて開催されました。 maeda
  • 受賞者 Awardee
    前田 若菜

  • 研究テーマ Research theme
    "ソーシャルメディアにおける非構造化テキストデータのk-匿名化によるプライバシー保護"
    ソーシャルメディアなどに存在する大量のテキストデータは,新たな価値を創出するビッグデータの一つとして注目されている.しかし,プライバシー保護のために,元データ及び解析結果の公開や共有に際して個人情報に相当する文字列を匿名化する必要がある.従来手法における,固有名詞を匿名化する手法では,固有 名詞以外の文字列から匿名化済み文字列を特定できるおそれがある.さらに,形態素解析が必要なため,話し言葉のようなくだけた文には対応できない.文の差異に基づく手法では,定型表現を持たないテキストデータには不適である.そこで本研究では,文字N-gramフレーズの出現回数に基づいたk-匿名化を提案した.これは,構造化データの匿名化で用いられていたSweeneyのk-anonymityの考え方を非構造化テキストデータに援用したものである. 文字N-gramフレーズを用いることで,未知語や話し言葉にも対応でき,広範囲のテキストに利用可能である.また,固有名詞以外の文字列からの特定を防止できる.実験結果より,理解可能性を保持しながら匿名化するためには,文字保存率を考慮してパラメータを設定する必要があることがわかった.


  • 著者 Author

    前田若菜, 鈴木優, 吉野幸一郎, Graham Neubig, 中村哲

  • 受賞についてのコメント Awardee's voice

    この度,学生奨励賞を受賞することができまして,大変光栄に思います.研究に関してご指導して頂いた研究室の先生方,様々なアドバイスや応援,サポートをして頂いた研究室の皆様に,この場を借りて厚く御礼申し上げます.この受賞を励みに,より一層研究活動に勤しみます.本当にありがとうございます.

>> 知能コミュニケーション研究室