Publications

その他 (国内) 段階的学習を用いたプライバシ保護型深層生成モデル

高木 駿 (京都大学), 髙橋 翼, 曹 洋 (京都大学), 吉川 正俊 (京都大学)

第12回データ工学と情報マネジメントに関するフォーラム(第18回日本データベース学会年次大会) (DEIM 2020)

2020.3.2

近年,大規模なデータセットを用いた機械学習とその活用が様々な領域やサービスで活用されている.しかし,それらのデータセットは個人のプライバシが問題になる場合に公開が難しく,活用が促されない.深層生成モ デルは学習データと同じ特徴を持ったデータを生成するように学習するモデルであり,データそのものや匿名化済み データの代わりに学習済み深層生成モデルを公開することが考えられる.しかし,その生成能力の高さから個人の データを復元してしまう可能性があり,同様にプライバシ漏洩が問題になる.そこで,差分プライバシと呼ばれる厳 密なプライバシ基準を取り入れた深層生成モデルを考案する.VAE やGAN といった既存深層生成モデルに既存研究 である DP-SGD を単純に適応することで,差分プライバシを満たすことができる.しかし,深層生成モデルを学習す る際のプライバシを保護するための雑音が原因で,生成データの質が悪くなってしまう.そこで,この論文では,段階 的な学習を行うことで,その雑音の影響を軽減した新しい生成モデル Privacy Preserving Phased Generative Model (P3GM) を提案する.P3GM が差分プライバシを満たすことを示し,実験的に,同じプライバシ保護の強度の場合に 既存の手法よりも質の良いデータが生成できることを示した.

Paper : 段階的学習を用いたプライバシ保護型深層生成モデル新しいタブまたはウィンドウで開く (外部サイト)