Internet mail was originally limited to 7-bit ASCII. MIME added support for the use of 8-bit character sets in body parts, and also defined an encoded-word construct so other character sets could be used in certain header field values. However, full internationalization of electronic mail requires additional enhancements to allow the use of Unicode, including characters outside the ASCII repertoire, in mail addresses as well as direct use of Unicode in header fields like "From:", "To:", and "Subject:", without requiring the use of complex encoded-word constructs. This document specifies an enhancement to the Internet Message Format and to MIME that allows use of Unicode in mail addresses and most header field content.

インターネットメールは当初、7ビットのASCIIに限定されていました。 MIMEは、身体の部分の8ビット文字セットを使用するためのサポートを追加し、また、符号化されたワードは、特定のヘッダフィールド値で使用することができるので、他の文字セットを構築定義しました。 」、および:「へ」、:しかし、電子メールの完全な国際化は、同様に「から」のようなヘッダフィールドでのUnicodeの直接の使用などのメールアドレスに、ASCIIレパートリー外の文字を含む、ユニコードの使用を許可するために、追加の拡張機能を必要とし件名:」、複雑なエンコードされたワードの構築物の使用を必要としません。この文書は、インターネットメッセージ形式にし、メールアドレスと、ほとんどのヘッダフィールドの内容でのUnicodeの使用を可能にするMIMEに強化を指定します。

This specification updates Section 6.4 of RFC 2045 to eliminate the restriction prohibiting the use of non-identity content-transfer-encodings on subtypes of "message/".

RFC 2045のこの仕様の更新6.4節には、「/メッセージ」のサブタイプに非同一のコンテンツ転送エンコーディングの使用を禁止する制限を排除します。

1. Introduction
1. はじめに

Internet mail distinguishes a message from its transport and further divides a message between a header and a body [RFC5322]. Internet mail header field values contain a variety of strings that are intended to be user-visible. The range of supported characters for these strings was originally limited to [ASCII] in 7-bit form. MIME [RFC2045] [RFC2046] [RFC2047] provides the ability to use additional character sets, but this support is limited to body part data and to special encoded-word constructs that were only allowed in a limited number of places in header field values.

インターネットメールは、そのトランスポートからのメッセージを区別し、さらにヘッダとボディ[RFC5322]の間でメッセージを分割します。インターネットメールヘッダフィールド値をユーザーに表示することが意図されている文字列のさまざまを含みます。これらの文字列でサポートされている文字の範囲は、当初7ビット形式で[ASCII]に限られていました。 MIME [RFC2045]、[RFC2046]、[RFC2047]は、追加の文字セットを使用する能力を提供するが、このサポートは、本体部分のデータにのみヘッダフィールド値の場所の限られた数で許可された特殊な符号化ワードの構築物に限定されます。

Globalization of the Internet requires support of the much larger set of characters provided by Unicode [RFC5198] in both mail addresses and most header field values. Additionally, complex encoding schemes like encoded-words introduce inefficiencies as well as significant opportunities for processing errors. And finally, native support for the UTF-8 charset is now available on most systems. Hence, it is strongly desirable for Internet mail to support UTF-8 [RFC3629] directly.

インターネットのグローバル化は、メールアドレスと、ほとんどのヘッダフィールド値の両方にUnicodeが提供する文字のはるかに大きいセット[RFC5198]のサポートを必要とします。また、符号化されたワードのような複雑な符号化方式は非効率ならびに処理エラーのための重要な機会を紹介します。そして最後に、UTF-8文字セットのネイティブサポートは、ほとんどのシステム上で利用可能になりました。したがって、インターネットメールを直接UTF-8 [RFC3629]をサポートするために強く望まれています。

This document specifies an enhancement to the Internet Message Format [RFC5322] and to MIME that permits the direct use of UTF-8, rather than only ASCII, in header field values, including mail addresses. A new media type, message/global, is defined for messages that use this extended format. This specification also lifts the MIME restriction on having non-identity content-transfer-encodings on any subtype of the message top-level type so that message/global parts can be safely transmitted across existing mail infrastructure.


This specification is based on a model of native, end-to-end support for UTF-8, which depends on having an "8-bit-clean" environment assured by the transport system. Support for carriage across legacy, 7-bit infrastructure and for processing by 7-bit receivers requires additional mechanisms that are not provided by these specifications.


This specification is a revision of and replacement for [RFC5335]. Section 6 of [RFC6530] describes the change in approach between this specification and the previous version.

この仕様は、[RFC5335]のための改訂と交換です。 [RFC6530]のセクション6は、本明細書および以前のバージョンとの間のアプローチの変化を記述する。

2. Terminology Used in This Specification

A plain ASCII string is fully compatible with [RFC5321] and [RFC5322]. In this document, non-ASCII strings are UTF-8 strings if they are in header field values that contain at least one <UTF8-non-ascii> (see Section 3.1).


Unless otherwise noted, all terms used here are defined in [RFC5321], [RFC5322], [RFC6530], or [RFC6531].


The key words "MUST", "MUST NOT", "REQUIRED", "SHALL", "SHALL NOT", "SHOULD", "SHOULD NOT", "RECOMMENDED", "MAY", and "OPTIONAL" in this document are to be interpreted as described in [RFC2119].

この文書のキーワード "MUST"、 "MUST NOT"、 "REQUIRED"、、、、 "べきではない" "べきである" "ないもの" "ものとし"、 "推奨"、 "MAY"、および "OPTIONAL" はあります[RFC2119]に記載されているように解釈されます。

The term "8-bit" means octets are present in the data with values above 0x7F.


3. Changes to Message Header Fields

To permit non-ASCII Unicode characters in field values, the header definition in [RFC5322] is extended to support the new format. The following sections specify the necessary changes to RFC 5322's ABNF.

フィールド値の非ASCII Unicode文字を可能にするために、[RFC5322]のヘッダ定義は、新しい形式をサポートするように拡張されます。次のセクションでは、RFC 5322のABNFに必要な変更を指定します。

The syntax rules not mentioned below remain defined as in [RFC5322].


Note that this protocol does not change rules in RFC 5322 for defining header field names. The bodies of header fields are allowed to contain Unicode characters, but the header field names themselves must consist of ASCII characters only.

このプロトコルは、ヘッダフィールド名を定義するためにRFC 5322のルールを変更しないことに留意されたいです。ヘッダフィールドの遺体は、Unicode文字を含むように許可されていますが、ヘッダーフィールド名自体はASCII文字のみで構成する必要があります。

Also note that messages in this format require the use of the SMTPUTF8 extension [RFC6531] to be transferred via SMTP.


3.1. UTF-8 Syntax and Normalization
3.1. UTF-8構文および正規化

UTF-8 characters can be defined in terms of octets using the following ABNF [RFC5234], taken from [RFC3629]:

UTF-8文字は[RFC3629]から取られた以下のABNF [RFC5234]を使用して、オクテットで定義することができます。

UTF8-non-ascii = UTF8-2 / UTF8-3 / UTF8-4

UTF8-非ASCII = UTF8-2 / UTF8-3 / UTF8-4

UTF8-2 = <Defined in Section 4 of RFC3629>

UTF8-2 = <RFC3629のセクション4で定義>

UTF8-3 = <Defined in Section 4 of RFC3629>

UTF8-3 = <RFC3629のセクション4で定義>

UTF8-4 = <Defined in Section 4 of RFC3629>

UTF8-4 = <RFC3629のセクション4で定義>

See [RFC5198] for a discussion of Unicode normalization; normalization form NFC [UNF] SHOULD be used. Actually, if one is going to do internationalization properly, one of the most often cited goals is to permit people to spell their names correctly. Since many mailbox local parts reflect personal names, that principle applies to mailboxes as well. The NFKC normalization form [UNF] SHOULD NOT be used because it may lose information that is needed to correctly spell some names in some unusual circumstances.

Unicode正規化の議論のために[RFC5198]を参照。 NFC [UNF]フォーム正規化を使用すべきです。 1は、国際化を行おうとしている場合、実際に、適切に、最も頻繁に引用された目標の一つは、正確に自分の名前を綴るために人々を可能にすることです。多くのメールボックスのローカル部分は個人名を反映しているので、その原理は、同様のメールボックスに適用されます。それは正しく、いくつかの特殊な状況でのいくつかの名前を綴るするために必要な情報を失う可能性があるため、NFKC正規化形式は、[UNF]使用されるべきではありません。

3.2. Syntax Extensions to
3.2. 構文の拡張へ

The following rules extend the ABNF syntax defined in [RFC5322] and [RFC5234] in order to allow UTF-8 content.


VCHAR =/ UTF8-non-ascii


ctext =/ UTF8-non-ascii


atext =/ UTF8-non-ascii

atext = / UTF8-非ASCII

qtext =/ UTF8-non-ascii

qtext = / UTF8-非ASCII

text =/ UTF8-non-ascii ; note that this upgrades the body to UTF-8

テキスト= / UTF8-非ASCII;これは、UTF-8に体をアップグレードしていることに注意してください

dtext =/ UTF8-non-ascii

dtext = / UTF8-非ASCII

The preceding changes mean that the following constructs now allow UTF-8:


1. Unstructured text, used in header fields like "Subject:" or "Content-description:".


2. Any construct that uses atoms, including but not limited to the local parts of addresses and Message-IDs. This includes addresses in the "for" clauses of "Received:" header fields.


3. Quoted strings.
4. Domains.

Note that header field names are not on this list; these are still restricted to ASCII.


3.3. Use of 8-bit UTF-8 in Message-IDs
3.3. メッセージIDは8ビットのUTF-8の使用

Implementers of Message-ID generation algorithms MAY prefer to restrain their output to ASCII since that has some advantages, such as when constructing "In-reply-to:" and "References:" header fields in mailing-list threads where some senders use internationalized addresses and others do not.


3.4. Effects on Line Length Limits
3.4. 行の長さの制限の影響

Section 2.1.1 of [RFC5322] limits lines to 998 characters and recommends that the lines be restricted to only 78 characters. This specification changes the former limit to 998 octets. (Note that, in

[RFC5322]のセクション2.1.1は998文字に行を制限し、ラインのみ78文字に制限することをお勧めします。この仕様は998個のオクテットに元の制限を変更します。 (で、なお

ASCII, octets and characters are effectively the same, but this is not true in UTF-8.) The 78-character limit remains defined in terms of characters, not octets, since it is intended to address display width issues, not line-length issues.


3.5. Changes to MIME Message Type Encoding Restrictions
3.5. MIMEメッセージタイプのエンコーディングに関する制限事項の変更

This specification updates Section 6.4 of [RFC2045]. [RFC2045] prohibits applying a content-transfer-encoding to any subtypes of "message/". This specification relaxes that rule -- it allows newly defined MIME types to permit content-transfer-encoding, and it allows content-transfer-encoding for message/global (see Section 3.7).

この仕様は、[RFC2045]のセクション6.4を更新します。 [RFC2045]「/メッセージ」のいずれかのサブタイプへのコンテンツ転送符号化を適用すること禁止しています。本明細書ではそのルールを緩和する - それは、コンテンツ転送符号化を可能にするために新たに定義されたMIMEタイプを可能にし、それは(セクション3.7を参照)、グローバルメッセージ/のコンテンツ転送エンコードができます。

Background: Normally, transfer of message/global will be done in 8-bit-clean channels, and body parts will have "identity" encodings, that is, no decoding is necessary.


But in the case where a message containing a message/global is downgraded from 8-bit to 7-bit as described in [RFC6152], an encoding might have to be applied to the message. If the message travels multiple times between a 7-bit environment and an environment implementing these extensions, multiple levels of encoding may occur. This is expected to be rarely seen in practice, and the potential complexity of other ways of dealing with the issue is thought to be larger than the complexity of allowing nested encodings where necessary.


3.6. Use of MIME Encoded-Words
3.6. MIMEエンコードされた語の使用

The MIME encoded-words facility [RFC2047] provides the ability to place non-ASCII text, but only in a subset of the places allowed by this extension. Additionally, encoded-words are substantially more complex since they allow the use of arbitrary charsets. Accordingly, encoded-words SHOULD NOT be used when generating header fields for messages employing this extension. Agents MAY, when incorporating material from another message, convert encoded-word use to direct use of UTF-8.


Note that care must be taken when decoding encoded-words because the results after replacing an encoded-word with its decoded equivalent in UTF-8 may be syntactically invalid. Processors that elect to decode encoded-words MUST NOT generate syntactically invalid fields.


3.7. The message/global Media Type
3.7. メッセージ/グローバルメディアタイプ

Internationalized messages in this format MUST only be transmitted as authorized by [RFC6531] or within a non-SMTP environment that supports these messages. A message is a "message/global message" if:


o it contains 8-bit UTF-8 header values as specified in this document, or


o it contains 8-bit UTF-8 values in the header fields of body parts.


The content of a message/global part is otherwise identical to that of a message/rfc822 part.

メッセージ/グローバル一部のコンテンツは、メッセージ/ RFC822部分とそれ以外は同一です。

If an object of this type is sent to a 7-bit-only system, it MUST have an appropriate content-transfer-encoding applied. (Note that a system compliant with MIME that doesn't recognize message/global is supposed to treat it as "application/octet-stream" as described in Section 5.2.4 of [RFC2046].)

このタイプのオブジェクトは、7ビットのみのシステムに送信される場合、それは適切なコンテンツ転送符号化が適用されなければなりません。 ([RFC2046]のセクション5.2.4に記載したように、メッセージは、/グローバル認識しないMIMEに準拠したシステムは、「アプリケーション/オクテットストリーム」として扱うことになっていることに注意してください。)

The registration is as follows:


Type name: message


Subtype name: global


Required parameters: none


Optional parameters: none


Encoding considerations: Any content-transfer-encoding is permitted. The 8-bit or binary content-transfer-encodings are recommended where permitted.


Security considerations: See Section 4.


Interoperability considerations: This media type provides functionality similar to the message/rfc822 content type for email messages with internationalized email headers. When there is a need to embed or return such content in another message, there is generally an option to use this media type and leave the content unchanged or down-convert the content to message/rfc822. Each of these choices will interoperate with the installed base, but with different properties. Systems unaware of internationalized headers will typically treat a message/global body part as an unknown attachment, while they will understand the structure of a message/rfc822. However, systems that understand message/global will provide functionality superior to the result of a down-conversion to message/rfc822. The most interoperable choice depends on the deployed software.

相互運用性の考慮:このメディアタイプは、国際化電子メールのヘッダを持つ電子メールメッセージのメッセージ/ RFC822のコンテンツタイプに似た機能を提供します。別のメッセージでこのようなコンテンツを埋め込むか、返却する必要がある場合は、このメディアタイプを使用すると、そのまま又はダウンコンバートコンテンツはメッセージ/ RFC822にコンテンツを残すためのオプションは、一般的にあります。これらの選択肢のそれぞれには、インストールベースではなく、異なる特性と相互運用します。彼らはメッセージ/ RFC822の構造を理解しながら、国際ヘッダを知らないシステムでは、通常、未知の添付ファイルとしてメッセージ/グローバル身体の部分を扱います。ただし、メッセージ/グローバルを理解するシステムでは、メッセージ/ RFC822へのダウンコンバートの結果に優れた機能を提供します。ほとんどの相互運用可能な選択が展開されたソフトウェアに依存します。

Published specification: RFC 6532

公開された仕様:RFC 6532

Applications that use this media type: SMTP servers and email clients that support multipart/report generation or parsing. Email clients that forward messages with internationalized headers as attachments.


Additional information:


Magic number(s): none


File extension(s): The extension ".u8msg" is suggested.


Macintosh file type code(s): A uniform type identifier (UTI) of "public.utf8-email-message" is suggested. This conforms to "public.message" and "public.composite-content", but does not necessarily conform to "public.utf8-plain-text".


Person & email address to contact for further information: See the Authors' Addresses section of this document.


Intended usage: COMMON


Restrictions on usage: This is a structured media type that embeds other MIME media types. An 8-bit or binary content-transfer-encoding SHOULD be used unless this media type is sent over a 7-bit-only transport.


Author: See the Authors' Addresses section of this document.


Change controller: IETF Standards Process


4. Security Considerations

Because UTF-8 often requires several octets to encode a single character, internationalization may cause header field values (in general) and mail addresses (in particular) to become longer. As specified in [RFC5322], each line of characters MUST be no more than 998 octets, excluding the CRLF. On the other hand, MDA (Mail Delivery Agent) processes that parse, store, or handle email addresses or local parts must take extra care not to overflow buffers, truncate addresses, or exceed storage allotments. Also, they must take care, when comparing, to use the entire lengths of the addresses.

UTF-8は、多くの場合、単一の文字をエンコードするために、いくつかのオクテットを必要とするため、国際化は、ヘッダフィールド値(一般に)とメールアドレス(特に)が長くなることがあります。 [RFC5322]で指定されるように、文字の各行はCRLFを除いせいぜい998個のオクテットでなければなりません。一方、店舗を解析し、MDA(メール配送エージェント)プロセス、または電子メールアドレスまたはローカル部品を扱うには、バッファをオーバーフローしないように細心の注意を取るアドレスを切り捨てる、またはストレージ割り当てを超えなければなりません。比較するときにも、彼らは、アドレスの全体の長さを使用するように、注意しなければなりません。

There are lots of ways to use UTF-8 to represent something equivalent or similar to a particular displayed character or group of characters; see the security considerations in [RFC3629] for details on the problems this can cause. The normalization process described in Section 3.1 is recommended to minimize these issues.

同等または特定の表示された文字または文字のグループに似た何かを表現するためにUTF-8を使用する方法はたくさんあります。これが発生する可能性があります問題の詳細については、[RFC3629]のセキュリティの考慮事項を参照してください。 3.1節で説明した正規化処理は、これらの問題を最小限にすることをお勧めします。

The security impact of UTF-8 headers on email signature systems such as Domain Keys Identified Mail (DKIM), S/MIME, and OpenPGP is discussed in Section 14 of [RFC6530].

そのようなドメインメール(DKIM)を同定キー、S / MIME、およびOpenPGPのような電子メールの署名システムでUTF-8のヘッダーのセキュリティへの影響は[RFC6530]のセクション14に記載されています。

If a user has a non-ASCII mailbox address and an ASCII mailbox address, a digital certificate that identifies that user might have both addresses in the identity. Having multiple email addresses as identities in a single certificate is already supported in PKIX (Public Key Infrastructure using X.509) [RFC5280] and OpenPGP [RFC3156], but there may be user-interface issues associated with the introduction of UTF-8 into addresses in this context.

ユーザーは、非ASCIIメールボックスアドレスとASCIIのメールボックスアドレス、ユーザーがIDで両方のアドレスを持っている可能性があることを特定するデジタル証明書を持っている場合。単一の証明書でのアイデンティティがすでにPKIX(公開鍵インフラストラクチャ使用してX.509)[RFC5280]とのOpenPGP [RFC3156]でサポートされているように、複数のメールアドレスを持つが、UTF-8の導入に関連付けられたユーザーインターフェイスの問題があるかもしれませんこの文脈でのアドレス。

5. IANA Considerations
5. IANAの考慮事項

IANA has updated the registration of the message/global MIME type using the registration form contained in Section 3.7.


