AES (Rijndael) の MixColumns を理解する

AES (Rijndael) には攪拌するための処理の一つに MixColumns という処理があります。 AES を説明する記事は大量にあるにも関わらず、この MixColumns の処理は数学(数論)の知識が必要というだけで敬遠されているようなので、MixColumns について説明していきます。

AES ¹ の暗号処理は、内部に 4×4 の状態を持ち、ラウンド関数を繰り返す SPN 構造 ² となっていて、ラウンド関数は、暗号処理の基本となる置換 (Substitution) と転置 (Permutation) を組み合わせたものです ³ ⁴。 MixColumns の処理は「転置」にあたる部分の処理です。

  +---+---+---+---+           +---+---+---+---+
  | 0 | 4 | 8 | c |           | 0'| 4'| 8'| c'|
  +---+---+---+---+           +---+---+---+---+
  | 1 | 5 | 9 | d |           | 1'| 5'| 9'| d'|
  +---+---+---+---+           +---+---+---+---+
  | 2 | 6 | a | e |           | 2'| 6'| a'| e'|
  +---+---+---+---+           +---+---+---+---+
  | 3 | 7 | b | f |           | 3'| 7'| b'| f'|
  +---+---+---+---+           +---+---+---+---+
    |   |   |   |               ^   ^   ^   ^
    +---|---|---|---------------+   |   |   |
        +---|---|-------------------+   |   |
            +---|-----------------------+   |
                +---------------------------+
                  列ごとにMixColumnsの処理を行う

数式

MixColumns の処理を数式で表すと次のようになります。つまり行列の掛け算です。変換前が $b_i$ で、変換後が $d_i$ です。

ただし注意ですが、各要素は16進数による表現で、拡大体 $\mathrm{GF}(2^8)$ (法既約多項式 : $x^8 + x^4 + x^3 + x + 1$) の要素です。なので、足し算と掛け算は次のように定義されます。

足し算

足し算は2つの要素のXOR ($\oplus$) をとります。例えばバイナリ表現で2つの要素が $\{a_7 a_6 a_5 a_4 a_3 a_2 a_1 a_0\}$ と $\{b_7 b_6 b_5 b_4 b_3 b_2 b_1 b_0\}$ のとき、足し算の結果は $\{c_7 c_6 c_5 c_4 c_3 c_2 c_1 c_0\}$ (ただし $c_i = a_i \oplus b_i$) となります。

以下の数式は全て正しく、表現形式は異なりますが全て同じ意味です。

\[\begin{aligned} (x^6 + x^4 + x^2 + x + 1) + (x^7 + x + 1) &= x^7 + x^6 + x^4 + x^2 & \text{(多項式による表現)} \\ \{\text{01010111}\} \oplus \{\text{10000011}\} &= \{\text{11010100}\} & \text{(バイナリによる表現)} \\ \{\text{57}\} \oplus \{\text{83}\} &= \{\text{d4}\} & \text{(16進数による表現)} \end{aligned}\]

掛け算

掛け算は要素を多項式と見なして、多項式同士の掛け算を行います。ただし、既約多項式 $x^8 + x^4 + x^3 + x + 1$ を法とする多項式環上で演算を行います。要素の掛け算を表す記号は「$\cdot{}$」です。

例えば、$\{\text{57}\} \cdot{} \{\text{83}\} = \{\text{c1}\}$ となります。式変形して考えてみると：

\[\begin{aligned} \{\text{57}\} \cdot{} \{\text{83}\} &= (x^6 + x^4 + x^2 + x + 1) (x^7 + x + 1) \\ &= x^{13} + x^{11} + x^9 + x^8 + x^7 + \\ &\phantom{=}\;\; x^7 + x^5 + x^3 + x^2 + x + \\ &\phantom{=}\;\; x^6 + x^4 + x^2 + x + 1 \\[2pt] &= x^{13} + x^{11} + x^9 + x^8 + x^6 + x^5 + x^4 + x^3 + 1 \end{aligned}\]

これを、法既約多項式で剰余をとると、右辺と一致します。

\[\begin{aligned} &\phantom{=}\;\; x^{13} + x^{11} + x^9 + x^8 + x^6 + x^5 + x^4 + x^3 + 1 \pmod{x^8 + x^4 + x^3 + x + 1} \\[2pt] &= x^7 + x^6 + 1 \\ &= \{\text{11000001}\} \\ &= \{\text{c1}\} \end{aligned}\]

行列の掛け算

上述した足し算「$\oplus$」と掛け算「$\cdot{}$」を使って行列の掛け算を行うと次のようになります。

\[\begin{bmatrix} d_0 \\ d_1 \\ d_2 \\ d_3 \end{bmatrix} = \begin{bmatrix} \text{02} & \text{03} & \text{01} & \text{01} \\ \text{01} & \text{02} & \text{03} & \text{01} \\ \text{01} & \text{01} & \text{02} & \text{03} \\ \text{03} & \text{01} & \text{01} & \text{02} \end{bmatrix} \begin{bmatrix} b_0 \\ b_1 \\ b_2 \\ b_3 \end{bmatrix}\] \[\begin{aligned} d_0 &= (\{\text{02}\} \cdot{} b_0) \oplus (\{\text{03}\} \cdot{} b_1) \oplus (\{\text{01}\} \cdot{} b_2) \oplus (\{\text{01}\} \cdot{} b_3) \\ d_1 &= (\{\text{01}\} \cdot{} b_0) \oplus (\{\text{02}\} \cdot{} b_1) \oplus (\{\text{03}\} \cdot{} b_2) \oplus (\{\text{01}\} \cdot{} b_3) \\ d_2 &= (\{\text{01}\} \cdot{} b_0) \oplus (\{\text{01}\} \cdot{} b_1) \oplus (\{\text{02}\} \cdot{} b_2) \oplus (\{\text{03}\} \cdot{} b_3) \\ d_3 &= (\{\text{03}\} \cdot{} b_0) \oplus (\{\text{01}\} \cdot{} b_1) \oplus (\{\text{01}\} \cdot{} b_2) \oplus (\{\text{02}\} \cdot{} b_3) \\ \end{aligned}\]

次の章では、これを計算するためのプログラムを作る方法について説明していきます。

アルゴリズム

足し算にあたる「$\oplus$」は ^ で計算できます。なので、実装する必要があるのは、要素同士の掛け算にあたる「$\cdot{}$」です。

掛け算のアルゴリズム

要素の掛け算を行うためには多項式同士の掛け算を行うためのプログラムを書く必要があります。とりあえず SageMath を使えば簡単に計算できます (以下は $\{\text{57}\} \cdot{} \{\text{83}\}$ を計算する SageMath のコードです)。

F.<X> = PolynomialRing(GF(2^8))
R.<x> = F.quotient(X^8 + X^4 + X^3 + X + 1)

R(x^6 + x^4 + x^2 + x + 1) * R(x^7 + x + 1)
# => x^7 + x^6 + 1

しかし、SageMath は数学屋さんか暗号屋さんくらいしかインストールしていないと思いますので、素直に実装していきましょう。

まず、ある要素 $b(x)$ は次のように書けます。

\[b_7 x^7 + b_6 x^6 + b_5 x^5 + b_4 x^4 + b_3 x^3 + b_2 x^2 + b_1 x^1 + b_0\]

このとき、ある要素 $b(x)$ に $x$ を掛けた多項式は次のように書けます。

\[b_7 x^8 + b_6 x^7 + b_5 x^6 + b_4 x^5 + b_3 x^4 + b_2 x^3 + b_1 x^2 + b_0 x\]

このとき、$x \cdot{} b(x)$ を法既約多項式で剰余する必要があります。なぜなら、要素の最大次数は $x^7$ だからです。

剰余する方法としては $x \cdot{} b(x)$ の計算結果で $b_7 = 1$ であれば、結果から法既約多項式 $x^8 + x^4 + x^3 + x + 1$ を引き算します。足し算が XOR なら引き算も XOR でできます (GF(2) なので)。この法既約多項式をバイナリ表現にすると $\{\text{0000000100011011}\} = \{\text{011b}\}$ となりますが、計算上は unsigned char (1byte)で計算するため、桁あふれ分は考慮しません。なので、引き算 (XOR) する値は $\{\text{1b}\}$ です。最終的に、$x$ を掛け算する処理というのは「多項式 $b(x)$ に $x$ を掛けて $b_7 = 1$ のときは $b = b \oplus \{\text{1b}\}$ する」という流れになります。

この処理を xtime(b) という関数にしておきます。C言語で書くと次のようになります。ここで、b は多項式、<< 1 は $x$ の掛け算、^ は引き算、b & 0x80 は $b_7 = 1$ のとき真、0x1b は法既約多項式の値を表します。

unsigned char xtime(unsigned char b)
{
    return (b << 1) ^ ((b & 0x80) ? 0x1b : 0x00);
}

より高い次元の $x$ を掛け算するときは xtime を繰り返します。多項式に $x$ を掛け算することは、バイナリ表現における左1ビットシフトであり、16進数表現では値を2倍することと同じ意味です。これによって、任意の値の掛け算を実装することができます。

例えば、先ほど示した例の $\{\text{57}\} \cdot{} \{\text{83}\} = \{\text{c1}\}$ をプログラム的に計算してみます。まずは、forループで $\{\text{57}\}$ と $1,2,4,8,16,…,128$ を掛け算したときの結果を用意します。

\[\begin{matrix} \{\text{57}\} \cdot{} \{01\} & &= \{\text{57}\}\\ \{\text{57}\} \cdot{} \{02\} &= \mathrm{xtime}(\{\text{57}\}) &= \{\text{ae}\}\\ \{\text{57}\} \cdot{} \{04\} &= \mathrm{xtime}(\{\text{ae}\}) &= \{\text{47}\}\\ \{\text{57}\} \cdot{} \{08\} &= \mathrm{xtime}(\{\text{47}\}) &= \{\text{8e}\}\\ \{\text{57}\} \cdot{} \{10\} &= \mathrm{xtime}(\{\text{8e}\}) &= \{\text{07}\}\\ \{\text{57}\} \cdot{} \{20\} &= \mathrm{xtime}(\{\text{07}\}) &= \{\text{0e}\}\\ \{\text{57}\} \cdot{} \{40\} &= \mathrm{xtime}(\{\text{0e}\}) &= \{\text{1c}\}\\ \{\text{57}\} \cdot{} \{80\} &= \mathrm{xtime}(\{\text{1c}\}) &= \{\text{38}\}\\ \end{matrix}\]

よって、バイナリ法の考え方で

\[\begin{aligned} \{\text{57}\} \cdot{} \{83\} &= \{\text{57}\} \cdot{} ( \{80\} \oplus \{02\} \oplus \{01\} ) \\ &= (\{\text{57}\} \cdot{} \{80\}) \oplus (\{\text{57}\} \cdot{} \{02\}) \oplus (\{\text{57}\} \cdot{} \{01\}) \\ &= \{\text{38}\} \oplus \{\text{ae}\} \oplus \{\text{57}\} \\ &= \{\text{c1}\} \end{aligned}\]

となり、これを応用すれば任意の要素同士の掛け算を行うことができます。この処理を dot(x, y) という関数にして、C言語で書くと次のようになります。

unsigned char dot(unsigned char x, unsigned char y)
{
    unsigned char mask;
    unsigned char product = 0;

    for (mask = 0x01; mask; mask <<= 1) {
        if (y & mask) {
            product ^= x;
        }
        x = xtime(x);
    }
    return product;
}

行列の掛け算のアルゴリズム

足し算「$\oplus$」と掛け算「$\cdot{}$」がプログラムで計算できるようになったので、MixColumns の処理である行列の掛け算が実装できるようになります。繰り返しになりますが、変換前が $b_i$、変換後が $d_i$ とすると、変換は次の数式で書けます。

この処理を mix_columns(s) という関数にして、C言語で実装すると次のようになります。なお $\{\text{01}\} \cdot{} b_i = b_i$ なので、係数が1の要素はそのまま使います。

static void mix_columns(unsigned char s[][4])
{
  int c;
  unsigned char t[4];

  for (c = 0; c < 4; c++) {
    t[0] = dot(2, s[0][c]) ^ dot(3, s[1][c]) ^        s[2][c]  ^        s[3][c];
    t[1] =        s[0][c]  ^ dot(2, s[1][c]) ^ dot(3, s[2][c]) ^        s[3][c];
    t[2] =        s[0][c]  ^        s[1][c]  ^ dot(2, s[2][c]) ^ dot(3, s[3][c]);
    t[3] = dot(3, s[0][c]) ^        s[1][c]  ^        s[2][c]  ^ dot(2, s[3][c]);
    s[0][c] = t[0];
    s[1][c] = t[1];
    s[2][c] = t[2];
    s[3][c] = t[3];
  }
}

暗号化行列 (MDS行列)

MixColumns で使う暗号化行列は、MDS行列と呼ばれる行列で、各行が線形変換 $f(k) = Ak$ によって生成されています。符号理論におけるMDS（最大距離分離）の各符号の距離はシングルトン限界 (Singleton bound) の最大値の $d = m - k + 1$ であるため、入力を効率よく攪拌することができることから、MDS行列は暗号プリミティブとしてよく使用されます ⁵。 AESではまず、以下の逆元が存在する多項式を最初の行としています。

\[\text{\{03\}} k^3 + \text{\{01\}} k^2 + \text{\{01\}} k + \text{\{02\}}\]

$n$ 行目から $n+1$ 行目は線形変換 $f(k) = Ak$ によって生成され、$N$ 行目まで繰り返したものを $N \times N$ 行列にまとめたものが暗号化行列になります。以下のプログラムでは4行目、3行目、…の順に各行を生成してAESで使われる暗号化行列を生成している様子です。

G.<x> = GF(2^8)
F.<K> = PolynomialRing(G)
R.<k> = F.quotient(K^4 + 1)

row4 = R(G.fetch_int(0x03)*k^3 + G.fetch_int(0x01)*k^2 + G.fetch_int(0x01)*k + G.fetch_int(0x02))
row3 = row4 * k
row2 = row3 * k
row1 = row2 * k
matrix([[row1], [row2], [row3], [row4]])
# => [x*k^3 + (x + 1)*k^2 + k + 1]              ... [02 03 01 01]  多項式の係数を行列で表したもの
# => [k^3 + x*k^2 + (x + 1)*k + 1]              ... [01 02 03 01]
# => [  k^3 + k^2 + x*k + (x + 1)]              ... [01 01 02 03]
# => [  (x + 1)*k^3 + k^2 + k + x]              ... [03 01 01 02]

暗号化行列の各行は、多項式環上の多項式なので、その逆元を求めれば復号用の多項式が求まり、最終的に復号行列が求まります。続いては復号の話です。

InvMixColumns (逆演算)

MixColumns が暗号化プロセスならば、InvMixColumns は復号プロセスです。 InvMixColumns では次の行列を使って逆変換を行います。

なぜこの数字になるかというと、まず MixColumns の暗号化とは、法を $k^4 + 1$ とする多項式環上の多項式の掛け算で表されており、4つの暗号化多項式を1つの行列として扱っています（※説明のために要素同士の掛け算には変数 $x$、多項式同士の掛け算には変数 $k$ を使っています）。 MixColumns (暗号化処理) の各行は多項式を表しているため、その逆演算である InvMixColumns (復号処理) の各行は逆元となる多項式にしないといけません。多項式の最大次数は3なので、法を $k^4 + 1$ とする多項式環について、まず、暗号化の多項式 $a(k)$ が次のように書けます。

\[a(k) = \{\text{03}\} k^3 + \{\text{01}\} k^2 + \{\text{01}\} k + \{\text{02}\}\]

そして、その逆元 $a^{-1}(k)$ は次のように書けるからです。

\[a^{-1}(k) = \{\text{0b}\} k^3 + \{\text{0d}\} k^2 + \{\text{09}\} k + \{\text{0e}\}\]

実際に、この2つの暗号化多項式と復号多項式を SageMath を使って、法を $k^4 + 1$ とする多項式環上で掛け算したプログラムを以下に示します。

G = GF(2^8)
F.<X> = PolynomialRing(G)
R.<x> = F.quotient(X^8 + X^4 + X^3 + X + 1)
S.<K> = PolynomialRing(R)
T.<k> = S.quotient(K^4 + 1)

# 暗号化多項式 [03 01 01 02]
enc = (X+1)*k^3 + (1)*k^2 + (1)*k + (X)
# => (x + 1)*k^3 + k^2 + k + x

# 復号多項式 [0b 0d 09 0e]
dec = (X^3+X+1)*k^3 + (X^3+X^2+1)*k^2 + (X^3+1)*k + (X^3+X^2+X)
# => (x^3 + x + 1)*k^3 + (x^3 + x^2 + 1)*k^2 + (x^3 + 1)*k + x^3 + x^2 + x

enc * dec
# => 1

補足で、GF(2^8).fetch_int を使った別の解き方のプログラムも記載しておきます（こちらの方が読みやすい＆書きやすいです）。

G.<x> = GF(2^8)
F.<K> = PolynomialRing(G)
R.<k> = F.quotient(K^4 + 1)

# 暗号化多項式 [02 03 01 01] と復号多項式 [0d 09 0e 0b]
enc = R(G.fetch_int(0x02)*k^3 + G.fetch_int(0x03)*k^2 + G.fetch_int(0x01)*k + G.fetch_int(0x01))
dec = R(G.fetch_int(0x0d)*k^3 + G.fetch_int(0x09)*k^2 + G.fetch_int(0x0e)*k + G.fetch_int(0x0b))
enc * dec
# => 1

# 暗号化多項式 [01 02 03 01] と復号多項式 [09 0e 0b 0d]
enc = R(G.fetch_int(0x01)*k^3 + G.fetch_int(0x02)*k^2 + G.fetch_int(0x03)*k + G.fetch_int(0x01))
dec = R(G.fetch_int(0x09)*k^3 + G.fetch_int(0x0e)*k^2 + G.fetch_int(0x0b)*k + G.fetch_int(0x0d))
enc * dec
# => 1

# 暗号化多項式 [01 01 02 03] と復号多項式 [0e 0b 0d 09]
enc = R(G.fetch_int(0x01)*k^3 + G.fetch_int(0x01)*k^2 + G.fetch_int(0x02)*k + G.fetch_int(0x03))
dec = R(G.fetch_int(0x0e)*k^3 + G.fetch_int(0x0b)*k^2 + G.fetch_int(0x0d)*k + G.fetch_int(0x09))
enc * dec
# => 1

# 暗号化多項式 [03 01 01 02] と復号多項式 [0b 0d 09 0e]
enc = R(G.fetch_int(0x03)*k^3 + G.fetch_int(0x01)*k^2 + G.fetch_int(0x01)*k + G.fetch_int(0x02))
dec = R(G.fetch_int(0x0b)*k^3 + G.fetch_int(0x0d)*k^2 + G.fetch_int(0x09)*k + G.fetch_int(0x0e))
enc * dec
# => 1

2つを掛け算すると単位元 $1$ になることから、確かに、暗号化多項式の逆元が復号多項式になっていることが確認できます。つまり、暗号化多項式を掛けた後に、復号多項式を掛けると、元に戻ることがわかります。

最終的に、復号における行列の掛け算を表す変換式は次のように書けます。

\[\begin{bmatrix} b_0 \\ b_1 \\ b_2 \\ b_3 \end{bmatrix} = \begin{bmatrix} \text{0e} & \text{0b} & \text{0d} & \text{09} \\ \text{09} & \text{0e} & \text{0b} & \text{0d} \\ \text{0d} & \text{09} & \text{0e} & \text{0b} \\ \text{0b} & \text{0d} & \text{09} & \text{0e} \end{bmatrix} \begin{bmatrix} d_0 \\ d_1 \\ d_2 \\ d_3 \end{bmatrix}\] \[\begin{aligned} b_0 &= (\{\text{0e}\} \cdot{} d_0) \oplus (\{\text{0b}\} \cdot{} d_1) \oplus (\{\text{0d}\} \cdot{} d_2) \oplus (\{\text{09}\} \cdot{} d_3) \\ b_1 &= (\{\text{09}\} \cdot{} d_0) \oplus (\{\text{0e}\} \cdot{} d_1) \oplus (\{\text{0b}\} \cdot{} d_2) \oplus (\{\text{0d}\} \cdot{} d_3) \\ b_2 &= (\{\text{0d}\} \cdot{} d_0) \oplus (\{\text{09}\} \cdot{} d_1) \oplus (\{\text{0e}\} \cdot{} d_2) \oplus (\{\text{0b}\} \cdot{} d_3) \\ b_3 &= (\{\text{0b}\} \cdot{} d_0) \oplus (\{\text{0d}\} \cdot{} d_1) \oplus (\{\text{09}\} \cdot{} d_2) \oplus (\{\text{0e}\} \cdot{} d_3) \\ \end{aligned}\]

この処理を inv_mix_columns(s) という関数にして、C言語で実装すると次のようになります。

static void inv_mix_columns(unsigned char s[][4])
{
  int c;
  unsigned char t[4];

  for (c = 0; c < 4; c++) {
    t[0] = dot(0x0e, s[0][c]) ^ dot(0x0b, s[1][c]) ^ dot(0x0d, s[2][c]) ^ dot(0x09, s[3][c]);
    t[1] = dot(0x09, s[0][c]) ^ dot(0x0e, s[1][c]) ^ dot(0x0b, s[2][c]) ^ dot(0x0d, s[3][c]);
    t[2] = dot(0x0d, s[0][c]) ^ dot(0x09, s[1][c]) ^ dot(0x0e, s[2][c]) ^ dot(0x0b, s[3][c]);
    t[3] = dot(0x0b, s[0][c]) ^ dot(0x0d, s[1][c]) ^ dot(0x09, s[2][c]) ^ dot(0x0e, s[3][c]);
    s[0][c] = t[0];
    s[1][c] = t[1];
    s[2][c] = t[2];
    s[3][c] = t[3];
  }
}

これで、MixColumns における復号の処理ができるようになりました。

補足ですが、説明の都合上、暗号化・復号の行列が先で、暗号化・復号の多項式が後になりましたが、NIST FIPS 197での本来の説明では、多項式から行列を導出していますのでご了承ください。

おわりに

以上が AES (Rijndael) の MixColumns の処理でやっている行列の掛け算の説明になります。もっと詳しく知りたい人は Rijndael MixColumns – Wikipedia や FIPS 197, Advanced Encryption Standard (AES) あたりを読むと、より理解を深めることができると思います。

最近は中学生がAES暗号化アルゴリズムを実装する時代ですから… ⁶

🎄 この記事は「セキュリティキャンプ修了生進捗 Advent Calendar 2019」の12日目です 🎄

参考文献

AES は米国連邦標準の暗号規格として公開されています ↩
SPN (Substitution Permutation Network Structure) 構造とは、シャノンが対象鍵ブロック暗号について提案した「多くの階層を使うか、拡散 (Diffusion) と攪拌 (Confusion) の繰り返しを使う混合変換 (Mixing Transformation) で安全で実用的な合成暗号は作成できる」というアイデアに基づいています ↩
岡本龍明「現代暗号の誕生と発展：ポスト量子暗号・仮想通貨・新しい暗号」近代科学社 2019 ↩
AES の鍵長が 128, 192, 256 のとき、ラウンド関数を繰り返す回数は 10, 12, 14 回となります ↩
MDS matrix - Wikipedia ↩
C#でAES暗号化アルゴリズムを外部ライブラリに一切頼らず完全実装してみた - Qiita の著者は自己紹介で(2019/12時点では)「もうすぐ高校1年生です」と書いているので中学生と判断しました ↩

晴耕雨読

working in the fields on fine days and reading books on rainy days