-
サイバーレジリエンス構成学研究室
笹田 大翔
Taisyo Sasada
時空間データの特性に適応する実践的プライバシ保護技術に関する研究
差分プライバシ 準同型暗号 Trusted Execution Environment 時空間データ処理 -
相互不信頼環境におけるデータ収集の課題に挑む
時空間データのプライバシ保護については、近年は端末のデータに微小なノイズを加え、元データとは異なるデータを収集者に送信するローカル差分プライバシー(LDP)が注目されています。
LDPは「ユーザがデータ収集者を信頼していなくともデータ提供が可能」というメリットがある一方、大きな問題が2つあります。ひとつは、提供されるデータが元データと大きく異なり、とくに位置情報の特徴がノイズによってすべて消えてしまうこと。もうひとつは、ユーザの識別を不可能にするノイズ量は時事刻々と変化しますが、LDPは時間的要素を考慮せずにノイズを加えてしまうことです。つまり、時空間データにローカル差分プライバシを適応する場合、時間的/空間的特徴を保存できないのです。
そこで、場所や時間によって異なる「データの統計的特性」を考慮し、生成される時空間データに対してリアルタイムで処理を施すことによってプライバシを保護する、新しい手法の構築を目指しました。
ノイズ量を最適化し、プライバシ保護と時空間特性維持の両立を実現
本研究では、プライバシ漏洩を生じさせないように携帯電話事業者のエッジサーバと連携します。携帯電話事業者は各端末の近接情報を計算し、識別が困難な「似たユーザ」をグループ化してノイズ量を動的に変動させたうえで、データ収集者にデータを提供する、というイメージです。
当然、元データの漏洩を防ぐために、この処理を「誰が、どのような順番で、どの時間帯に行うべきか」、「どの数値を、どのタイミングで渡すか」等は、慎重に整理しました。
元データと提供されるデータの差異を軽減し、かつプライバシの保護強度も維持できるため、個人はもちろん幅広い法人データの利活用にも寄与できると考えています。
すでにプログラムを構築し、国際会議でも発表しましたが、現段階ではまだ1パターンのノイズの加え方しか検証できていません。今後さまざまな波形のノイズでの検証や、プライバシ強度の確認を進める予定です。
加えて、ノイズを加えた後のデータに時間的/空間的特徴がどれくらい残っているのかも厳密に検証・評価していきます。
研究者として大きく成長できる貴重な機会
私は学部時代にデータ工学・情報検索に関する技術を専攻し、データ分析に関わるインターンシップや課外活動に参加していました。その際、プライバシの観点からデータ提供を受けられないことが多々あり、データ分析技術の研鑽にはプライバシ保護技術に精通する必要があると考え、この分野の研究を始めました。
奨励費のおかげで海外への渡航が可能になり、国際会議での発表や国際論文誌への掲載が実現しました。また、学会発表や物品購入に欠かせない研究予算を自力で獲得することは、研究者として貴重な経験となりました。
データのプライバシ保護は、日本だけではなく海外の保護規則も関わっているため、現在はフランスの Telecom SudParis と連携して共同研究を行っています。今後も、国を横断したプライバシ保護の研究を進めていく所存です。
(取材・撮影:ライティング株式会社 酒井若菜)