晴耕雨読

working in the fields on fine days and reading books on rainy days

センシティブな情報とは

「センシティブ」とは「微妙で慎重を要するさま」という意味があります。 センシティブなファイルをアップロードしちゃった!と言ったら、パスワードを含むファイルをアップロードした可能性が高いです。 JPCERT/CCの記事でセンシティブな情報をハードコードしない 1 とあるように、プログラマが言う「センシティブな情報」は主にはパスワードを含む情報のことを意味します。 最近ではハッシュ化したパスワードもセンシティブな情報と言うようになっています 2

この「センシティブな情報」という言葉はプログラマ以外の人には別の意味で捉えられてしまいます。 センシティブな情報という言葉はプライバシー保護の文脈で現れることが多く、例えば病歴や離婚歴、障がい等級などの社会差別に繋がる情報のことをセンシティブな情報と言います。 別の言い方では機微情報とも言います。 JIS Q 15001:2006 個人情報保護マネジメントシステム - 要求事項 3 によると、特定の機微な個人情報(センシティブな情報)には以下の内容があります。

  • 思想、信条又は宗教に関する事項
  • 人種、民族、門地、本籍地(所在都道府県に関する情報を除く)、身体・精神障害、犯罪歴その他社会的差別の原因となる事項
  • 勤労者の団結権、団体交渉その他団体行動の行為に関する事項
  • 集団示威行為への参加、請願権の行使その他の政治的権利の行使に関する事項
  • 保健医療又は性生活に関する事項

結局この記事で書きたかったことは、「パスワードを含む」という意味でセンシティブな情報という言葉を使うと、「社会的差別に繋がる情報」という意味で捉えられて、会話がすれ違ってしまうので気を付けましょう。ということでした。


2019/11 補足: 社会的差別の件で、東大大学院情報学環特任准教授の某氏が差別ツイートで炎上したことについて、二の舞とならないように感じたことを綴ります。 東京大学憲章の前文には「国籍、性別、年齢、言語、宗教、政治上その他の意見、出身、財産、門地その他の地位、婚姻上の地位、家庭における地位、障害、疾患、経歴等の事由によって差別されることのないことを保障する」と書かれています4。 ところが彼は自身が携わる会社の採用方針として「そもそも中国人って時点で面接に呼びません。書類で落とします」などと投稿し、この発言は東大とは関係ないと主張しています。 しかし公正な採用選考の一つに「応募者の適正・能力のみを基準として行うこと」があり、彼の主張はこの基本的な考え方に反するものです。 特任准教授という肩書きがある以上、責任ある発言をしてほしいと思います。

また、彼はAI研究者を名乗っており、機械学習によって得られた最適解によって一定の人が差別されるのは仕方がない、いわゆる統計的差別を容認する旨の発言もしています。 これに反論するように、東大大学院情報学環特任助教の明戸隆浩氏が統計的差別について記事の中で説明しています5。 結論だけ述べると、統計的差別であっても差別は差別であり、統計的であるかどうかとそれが容認されるかどうかは関係がありません。 したがって、統計的差別は否定されなければなりません。

では、一人の技術者として機械学習をするときに気をつけることは何でしょうか。 一番簡単なのは、人事の意思決定を行うプログラムで、特徴量エンジニアリングの時点で、国籍、性別、年齢、言語、宗教、政治的意見、出身、財産、地位、障害、疾患、経歴という情報を特徴量として入力しないことです。 適正と能力のみを基準として判断することが公正な人事において大切なことなので、結局のところ機械学習に入力する情報は適正診断と能力診断の結果だけになると思います。

近年、AIが人事に関わることが増えているので、統計的差別については今後とも注目していきたいです


  1. センシティブな情報をハードコードしない – JPCERT/CC 

  2. Docker が不正アクセスを受けたときの記事 Unauthorized access to Docker Hub database では "sensitive data may have been exposed. Data includes usernames and hashed passwords" と書かれており、パスワードはハッシュ化されていてもセンシティブな情報であるという認識 

  3. JIS Q 15001:2006 個人情報保護マネジメントシステム – 要求事項 

  4. 東京大学憲章 前文 

  5. 東大情報学環大澤昇平氏の差別発言について - researchmap