INTERVIEW

日本学術振興会(JSPS)特別研究員

TOP
BACK
差分プライバシ 準同型暗号 Trusted Execution Environment 時空間データ処理

相互不信頼環境におけるデータ収集の課題に挑む

時空間データのプライバシ保護については、近年は端末のデータに微小なノイズを加え、元データとは異なるデータを収集者に送信するローカル差分プライバシー(LDP)が注目されています。  

LDPは「ユーザがデータ収集者を信頼していなくともデータ提供が可能」というメリットがある一方、大きな問題が2つあります。ひとつは、提供されるデータが元データと大きく異なり、とくに位置情報の特徴がノイズによってすべて消えてしまうこと。もうひとつは、ユーザの識別を不可能にするノイズ量は時事刻々と変化しますが、LDPは時間的要素を考慮せずにノイズを加えてしまうことです。つまり、時空間データにローカル差分プライバシを適応する場合、時間的/空間的特徴を保存できないのです。

そこで、場所や時間によって異なる「データの統計的特性」を考慮し、生成される時空間データに対してリアルタイムで処理を施すことによってプライバシを保護する、新しい手法の構築を目指しました。

高校時代は分子生物学に興味を持っていたが、今後はデータ分析やシミュレーションのプログラムを書くなど、生物学以外の強みが求められると言われ、データ分析に興味を持った

ノイズ量を最適化し、プライバシ保護と時空間特性維持の両立を実現

本研究では、プライバシ漏洩を生じさせないように携帯電話事業者のエッジサーバと連携します。携帯電話事業者は各端末の近接情報を計算し、識別が困難な「似たユーザ」をグループ化してノイズ量を動的に変動させたうえで、データ収集者にデータを提供する、というイメージです。  

当然、元データの漏洩を防ぐために、この処理を「誰が、どのような順番で、どの時間帯に行うべきか」、「どの数値を、どのタイミングで渡すか」等は、慎重に整理しました。

元データと提供されるデータの差異を軽減し、かつプライバシの保護強度も維持できるため、個人はもちろん幅広い法人データの利活用にも寄与できると考えています。

差分プライバシや準同型暗号、Trusted Execution Environmentといった様々なプライバシ強化技術を組み合わせることで、相互不信頼環境でのデータ収集を部分的に実現している

すでにプログラムを構築し、国際会議でも発表しましたが、現段階ではまだ1パターンのノイズの加え方しか検証できていません。今後さまざまな波形のノイズでの検証や、プライバシ強度の確認を進める予定です。

加えて、ノイズを加えた後のデータに時間的/空間的特徴がどれくらい残っているのかも厳密に検証・評価していきます。

セキュリティ分野やデータ分析技術のみならず、社会学や心理学をはじめ、個人や組織のデータ収集・分析を必要とするすべての分野に関わるテーマでもある

研究者として大きく成長できる貴重な機会

私は学部時代にデータ工学・情報検索に関する技術を専攻し、データ分析に関わるインターンシップや課外活動に参加していました。その際、プライバシの観点からデータ提供を受けられないことが多々あり、データ分析技術の研鑽にはプライバシ保護技術に精通する必要があると考え、この分野の研究を始めました。  

奨励費のおかげで海外への渡航が可能になり、国際会議での発表や国際論文誌への掲載が実現しました。また、学会発表や物品購入に欠かせない研究予算を自力で獲得することは、研究者として貴重な経験となりました。

データのプライバシ保護は、日本だけではなく海外の保護規則も関わっているため、現在はフランスの Telecom SudParis と連携して共同研究を行っています。今後も、国を横断したプライバシ保護の研究を進めていく所存です。

日本国内であってもAWSやGCP、Azure等の海外のクラウドサービスを使用している場合、データの送受信はその国の法律が適用されるため、海外との連携は必須

(取材・撮影:ライティング株式会社 酒井若菜)