晴耕雨読

working in the fields on fine days and reading books on rainy days

センシティブな情報とは

「センシティブ」とは「微妙で慎重を要するさま」という意味があります。 センシティブなファイルをアップロードしちゃった!と言ったら、パスワードを含むファイルをアップロードした可能性が高いです。 JPCERT/CCの記事でセンシティブな情報をハードコードしない 1 とあるように、プログラマが言う「センシティブな情報」は主にはパスワードを含む情報のことを意味します。 最近ではハッシュ化したパスワードもセンシティブな情報と言うようになっています 2

この「センシティブな情報」という言葉はプログラマ以外の人には別の意味で捉えられてしまいます。 センシティブな情報という言葉はプライバシー保護の文脈で現れることが多く、例えば病歴や離婚歴、障がい等級などの社会差別に繋がる情報のことをセンシティブな情報と言います。 別の言い方では機微情報とも言います。 JIS Q 15001:2006 個人情報保護マネジメントシステム - 要求事項 3 によると、特定の機微な個人情報(センシティブな情報)には以下の内容があります。

  • 思想、信条又は宗教に関する事項
  • 人種、民族、門地、本籍地(所在都道府県に関する情報を除く)、身体・精神障害、犯罪歴その他社会的差別の原因となる事項
  • 勤労者の団結権、団体交渉その他団体行動の行為に関する事項
  • 集団示威行為への参加、請願権の行使その他の政治的権利の行使に関する事項
  • 保健医療又は性生活に関する事項

結局この記事で書きたかったことは、「パスワードを含む」という意味でセンシティブな情報という言葉を使うと、「社会的差別に繋がる情報」という意味で捉えられて、会話がすれ違ってしまうので気を付けましょう。ということでした。


2019/11 補足: 某大学の機械学習関係者が、機械学習によって得られた最適解によって一定の人が差別されるのは仕方がない、いわゆる統計的差別を容認する旨の発言がありました。 しかし、統計的差別であっても差別は差別であり、統計的であるかどうかとそれが容認されるかどうかは関係がありません。 したがって、統計的差別は否定されなければなりません。 人事の意思決定を行うプログラムで機械学習をする場合は、特徴量エンジニアリングの時点で、国籍、性別、年齢、言語、宗教、政治的意見、出身、財産、地位、障害、疾患、経歴という情報を特徴量として入力しないことです。 適正と能力のみを基準として判断することが公正な人事において大切なことです。 近年、AIが人事に関わることが増えているので、統計的差別については今後とも注目していきたいです。


  1. センシティブな情報をハードコードしない – JPCERT/CC 

  2. Docker が不正アクセスを受けたときの記事 Unauthorized access to Docker Hub database では "sensitive data may have been exposed. Data includes usernames and hashed passwords" と書かれており、パスワードはハッシュ化されていてもセンシティブな情報であるという認識 

  3. JIS Q 15001:2006 個人情報保護マネジメントシステム – 要求事項