晴耕雨読

working in the fields on fine days and reading books on rainy days

アルファベット出現率

暗号解読でアルファベットの出現率を元に解読をする方法には、頻度解析やカシスキーテストなどがありますが、基本的には英語の統計的な性質を利用して解読を行います。 そこで、英語のアルファベット (1〜3文字) のおおよその出現率をまとめました。

1文字

各行の文字は、左側から順番に出現率が高いことを表しています。 E が飛び抜けて一番多く、次いで T, A, O … となっています。 そして最も出現率が低いのは Z です。

文字 出現率
E 13%
T, A, O, N, I, R, S, H 9%〜6%
D, L, U, C, M 4%〜3%
P, F, Y, W, G, B, V 2%〜1%
K, X, J, Q, Z 0.5%〜0.1%

2文字

2つの連続した文字の並びの出現頻度も暗号解読では重要です。 最もよく出てくる2文字は頻度の高い順に並べると次のようになります。

TH, HE, IN, ER, AN, RE, ED, ON, ES, ST, EN, AT, TO, NT, HA, ND, OU, EA, NG, AS, OR, TI, IS, ET, IT, AR, TE, SE, HI, OF

3文字

最もよく出てくる3文字は頻度の高い順に並べると次のようになります。

THE, ING, AND, HER, ERE, ENT, THA, NTH, WAS, ETH, FOR, DTH

補足

暗号化するときに暗号利用モードのCBCモードを使えば、頻度解析はできなくなります。

参考文献

  • Douglas R. Stinson (原著), 桜井 幸一 (翻訳), 古屋 聡一 (翻訳), 檀浦 詠介 (翻訳), 山家 明男 (翻訳), 赤星 信博 (翻訳), 佐野 文彦 (翻訳), 山根 義則 (翻訳), “暗号理論の基礎”, 共立出版, 1996