Post Office Protocol Version 3 (POP3) Support for UTF-8

UTF-8のPost Office Protocolバージョン3(POP3)サポート



This specification extends the Post Office Protocol version 3 (POP3) to support international strings encoded in UTF-8 in usernames, passwords, mail addresses, message headers, and protocol-level text strings.

この仕様は、Post Office Protocolバージョン3(POP3)を拡張して、ユーザー名、パスワード、メールアドレス、メッセージヘッダー、およびプロトコルレベルのテキスト文字列でUTF-8でエンコードされた国際文字列をサポートします。

1. Introduction
1. はじめに

This document forms part of the Email Address Internationalization protocols described in the Email Address Internationalization Framework document [RFC6530]. As part of the overall Email Address Internationalization work, email messages can be transmitted and delivered containing a Unicode string encoded in UTF-8 in the header and/or body, and maildrops that are accessed using POP3 [RFC1939] might natively store Unicode characters.

このドキュメントは、電子メールアドレス国際化フレームワークドキュメント[RFC6530]で説明されている電子メールアドレス国際化プロトコルの一部を形成しています。全体的なメールアドレスの国際化作業の一環として、ヘッダーや本文にUTF-8でエンコードされたUnicode文字列を含むメールメッセージを送信および配信できます。また、POP3 [RFC1939]を使用してアクセスされるメールドロップには、Unicode文字がネイティブに格納される場合があります。

This specification extends POP3 using the POP3 extension mechanism [RFC2449] to permit un-encoded UTF-8 [RFC3629] in headers and bodies (e.g., transferred using 8-bit content-transfer-encoding) as described in "Internationalized Email Headers" [RFC6532]. It also adds a mechanism to support login names and passwords containing a UTF-8 string (see Section 1.1 below), a mechanism to support UTF-8 strings in protocol-level response strings, and the ability to negotiate a language for such response strings.

この仕様は、POP3拡張メカニズム[RFC2449]を使用してPOP3を拡張し、「国際化された電子メールヘッダー」で説明されているように、ヘッダーと本文(たとえば、8ビットcontent-transfer-encodingを使用して転送)でエンコードされていないUTF-8 [RFC3629]を許可します。 RFC6532]。また、UTF-8文字列を含むログイン名とパスワードをサポートするメカニズム(以下のセクション1.1を参照)、プロトコルレベルの応答文字列でUTF-8文字列をサポートするメカニズム、およびそのような応答文字列の言語をネゴシエートする機能も追加します。

This specification also adds a new response code to indicate that a message was not delivered because it required UTF-8 mode (as discussed in Section 2) and the server was unable or unwilling to create and deliver a surrogate form of the message as discussed in Section 7 of "IMAP Support for UTF-8" [RFC6855].

この仕様では、(セクション2で説明されているように)UTF-8モードが必要なためメッセージが配信されなかったこと、およびサーバーがメッセージの代理形式を作成および配信できなかったか配信したくないことを示す新しい応答コードも追加されます。 「UTF-8のIMAPサポート」のセクション7 [RFC6855]。

1.1. Conventions Used in This Document
1.1. このドキュメントで使用される規則

The key words "MUST", "MUST NOT", "REQUIRED", "SHALL", "SHALL NOT", "SHOULD", "SHOULD NOT", "RECOMMENDED", "MAY", and "OPTIONAL" in this document are to be interpreted as described in "Key words for use in RFCs to Indicate Requirement Levels" [RFC2119].

このドキュメントのキーワード「MUST」、「MUST NOT」、「REQUIRED」、「SHALL」、「SHALL NOT」、「SHOULD」、「SHOULD NOT」、「RECOMMENDED」、「MAY」、および「OPTIONAL」は、 「要件レベルを示すためのRFCで使用するキーワード」[RFC2119]で説明されているように解釈されます。

The terms "UTF-8 string" or "UTF-8 character" are used to refer to Unicode characters, which may or may not be members of the ASCII repertoire, encoded in UTF-8 [RFC3629], a standard Unicode encoding form. All other specialized terms used in this specification are defined in the Email Address Internationalization framework document.

「UTF-8文字列」または「UTF-8文字」という用語は、標準のUnicodeエンコード形式であるUTF-8 [RFC3629]でエンコードされたASCIIレパートリーのメンバーである場合とそうでない場合があるUnicode文字を指すために使用されます。この仕様で使用される他のすべての専門用語は、電子メールアドレスの国際化フレームワークドキュメントで定義されています。

In examples, "C:" and "S:" indicate lines sent by the client and server, respectively. If a single "C:" or "S:" label applies to multiple lines, then the line breaks between those lines are for editorial clarity only and are not part of the actual protocol exchange.


Note that examples always use ASCII characters due to limitations of the RFC format; otherwise, some examples for the "LANG" command would have appeared incorrectly.


2. "UTF8" Capability
2. 「UTF8」機能

This specification adds a new POP3 Extension [RFC2449] capability response tag and command to specify support for header field information outside the ASCII repertoire. The capability tag and new command and functionality are described below.


CAPA tag: UTF8


Arguments with CAPA tag: USER


Added Commands: UTF8


Standard commands affected: USER, PASS, APOP, LIST, TOP, RETR


Announced states / possible differences: both / no


Commands valid in states: AUTHORIZATION


Specification reference: this document




This capability adds the "UTF8" command to POP3. The "UTF8" command switches the session from the ASCII-only mode of POP3 [RFC1939] to UTF-8 mode. The UTF-8 mode means that all messages transmitted between servers and clients are UTF-8 strings, and both servers and clients can send and accept UTF-8 strings.

この機能は、「UTF8」コマンドをPOP3に追加します。 「UTF8」コマンドは、セッションをPOP3 [RFC1939]のASCII専用モードからUTF-8モードに切り替えます。 UTF-8モードは、サーバーとクライアントの間で送信されるすべてのメッセージがUTF-8文字列であり、サーバーとクライアントの両方がUTF-8文字列を送受信できることを意味します。

2.1. The "UTF8" Command
2.1. 「UTF8」コマンド

The "UTF8" command enables UTF-8 mode. The "UTF8" command has no parameters.

「UTF8」コマンドは、UTF-8モードを有効にします。 「UTF8」コマンドにはパラメーターがありません。

UTF-8 mode has no effect on messages in an ASCII-only maildrop. Messages in native Unicode maildrops can be encoded in UTF-8 using internationalized headers [RFC6532], in 8bit content-transfer-encoding (see Section 2.8 of MIME [RFC2045]), in ASCII, or in any combination of these options. In UTF-8 mode, if the character encoding format of maildrops is UTF-8 or ASCII, the messages are sent to the client as is; if the character encoding format of maildrops is a format other than UTF-8 or ASCII, the messages' encoding format SHOULD be converted to be UTF-8 before they are sent to the client. When UTF-8 mode has not been enabled, character strings outside the ASCII repertoire MUST NOT be sent to the client as is. If a client requests a UTF-8 message when UTF-8 mode is not enabled, the server MUST either send the client a surrogate message that complies with unextended POP and Internet Mail Format without UTF-8 mode support, or fail the request with an -ERR response. See Section 7 of "IMAP Support for UTF-8" [RFC6855] for information about creating a surrogate message and for a discussion of potential issues. Section 5 of this document discusses "UTF8" response codes. The server MAY respond to the "UTF8" command with an -ERR response.

UTF-8モードは、ASCIIのみのメールドロップのメッセージには影響しません。ネイティブUnicodeメールドロップのメッセージは、国際化ヘッダー[RFC6532]、8ビットcontent-transfer-encoding(MIME [RFC2045]のセクション2.8を参照)、ASCII、またはこれらのオプションの任意の組み合わせを使用して、UTF-8でエンコードできます。 UTF-8モードでは、メールドロップの文字エンコード形式がUTF-8またはASCIIの場合、メッセージはそのままクライアントに送信されます。メールドロップの文字エンコード形式がUTF-8またはASCII以外の形式の場合、メッセージのエンコード形式は、クライアントに送信される前にUTF-8に変換する必要があります(SHOULD)。 UTF-8モードが有効になっていない場合、ASCIIレパートリー外の文字列をそのままクライアントに送信してはなりません(MUST NOT)。 UTF-8モードが有効になっていないときにクライアントがUTF-8メッセージを要求する場合、サーバーは、UTF-8モードをサポートしない拡張されていないPOPおよびインターネットメール形式に準拠する代理メッセージをクライアントに送信するか、または-ERR応答。サロゲートメッセージの作成と潜在的な問題の説明については、「UTF-8のIMAPサポート」[RFC6855]のセクション7を参照してください。このドキュメントのセクション5では、「UTF8」応答コードについて説明します。サーバーは、「UTF8」コマンドに-ERR応答で応答してもよい(MAY)。

Note that even in UTF-8 mode, MIME binary content-transfer-encoding as defined in Section 6.2 of MIME [RFC2045] is still not permitted. MIME 8bit content-transfer-encoding (8BITMIME) [RFC6152] is obviously allowed.

UTF-8モードであっても、MIME [RFC2045]のセクション6.2で定義されているMIMEバイナリcontent-transfer-encodingは依然として許可されないことに注意してください。 MIME 8ビットコンテンツ転送エンコーディング(8BITMIME)[RFC6152]は明らかに許可されています。

The octet count (size) of a message reported in a response to the "LIST" command SHOULD match the actual number of octets sent in a "RETR" response (not counting byte-stuffing). Sizes reported elsewhere, such as in "STAT" responses and non-standardized, free-form text in positive status indicators (following "+OK") need not be accurate, but it is preferable if they are.

「LIST」コマンドへの応答で報告されたメッセージのオクテットカウント(サイズ)は、「RETR」応答で送信された実際のオクテット数と一致する必要があります(バイトスタッフィングはカウントしません)。 「STAT」応答やポジティブステータスインジケーター(「+ OK」に続く)の標準化されていない自由形式のテキストなど、他の場所で報告されるサイズは正確である必要はありませんが、正確であることが望ましいです。

Normal operation for maildrops that natively support non-ASCII characters will be for both servers and clients to support the extension discussed in this specification. Upgrading both clients and servers is the only fully satisfactory way to support the capabilities offered by the "UTF8" extension and SMTPUTF8 mail more generally. Servers must, however, anticipate the possibility of a client attempting to access a message that requires this extension without having issued the "UTF8" command. There are no completely satisfactory responses for this case other than upgrading the client to support this specification. One solution, unsatisfactory because the user may be confused by being able to access the message through some means and not others, is that a server MAY choose to reject the command to retrieve the message as discussed in Section 5. Other alternatives, including the possibility of creating and delivering a surrogate form of the message, are discussed in Section 7 of "IMAP Support for UTF-8" [RFC6855].

非ASCII文字をネイティブでサポートするメールドロップの通常の操作は、サーバーとクライアントの両方がこの仕様で説明されている拡張機能をサポートすることです。クライアントとサーバーの両方をアップグレードすることは、「UTF8」拡張機能とSMTPUTF8メールがより一般的に提供する機能をサポートする完全に満足できる唯一の方法です。ただし、サーバーは、クライアントが "UTF8"コマンドを発行せずにこの拡張機能を必要とするメッセージにアクセスしようとする可能性を予期する必要があります。この仕様をサポートするようにクライアントをアップグレードする以外に、このケースに対する完全に満足のいく応答はありません。ユーザーがなんらかの手段でメッセージにアクセスできて混乱する可能性があるため満足できない1つの解決策は、セクション5で説明したように、サーバーがコマンドを拒否してメッセージを取得することを選択することです。メッセージの代理形式を作成して配信する方法については、「UTF-8のIMAPサポート」[RFC6855]のセクション7で説明しています。

Clients MUST NOT issue the "STLS" command [RFC2595] after issuing UTF8; servers MAY (but are not required to) enforce this by rejecting with an -ERR response an "STLS" command issued subsequent to a successful "UTF8" command. (Because this is a protocol error as opposed to a failure based on conditions, an extended response code [RFC2449] is not specified.)

クライアントは、UTF8を発行した後に「STLS」コマンドを発行してはなりません[RFC2595]。サーバーは、「UTF8」コマンドが成功した後に発行された「STLS」コマンドを-ERR応答で拒否することにより、これを強制することができます(ただし必須ではありません)。 (これは条件に基づく障害ではなくプロトコルエラーであるため、拡張応答コード[RFC2449]は指定されていません。)

2.2. USER Argument to "UTF8" Capability
2.2. 「UTF8」機能へのユーザー引数

If the USER argument is included with this capability, it indicates that the server accepts UTF-8 usernames and passwords.


Servers that include the USER argument in the "UTF8" capability response SHOULD apply SASLprep [RFC4013] or one of its Standards Track successors to the arguments of the "USER" and "PASS" commands.

「UTF8」機能応答にUSER引数を含むサーバーは、SASLprep [RFC4013]またはそのStandards Track後続操作の1つを「USER」および「PASS」コマンドの引数に適用する必要があります(SHOULD)。

A client or server that supports APOP and permits UTF-8 in usernames or passwords MUST apply SASLprep or one of its Standards Track successors to the username and password used to compute the APOP digest.

APOPをサポートし、ユーザー名またはパスワードでUTF-8を許可するクライアントまたはサーバーは、APOPダイジェストの計算に使用されるユーザー名とパスワードにSASLprepまたはそのStandards Track後継者の1つを適用する必要があります。

When applying SASLprep, servers MUST reject UTF-8 usernames or passwords that contain a UTF-8 character listed in Section 2.3 of SASLprep. When applying SASLprep to the USER argument, the PASS argument, or the APOP username argument, a compliant server or client MUST treat them as a query string [RFC3454]. When applying SASLprep to the APOP password argument, a compliant server or client MUST treat them as a stored string [RFC3454].

SASLprepを適用する場合、サーバーはSASLprepのセクション2.3に記載されているUTF-8文字を含むUTF-8ユーザー名またはパスワードを拒否する必要があります。 SASLprepをUSER引数、PASS引数、またはAPOPユーザー名引数に適用する場合、準拠サーバーまたはクライアントはそれらをクエリ文字列[RFC3454]として扱う必要があります。 SASLprepをAPOPパスワード引数に適用する場合、準拠するサーバーまたはクライアントは、それらを保存された文字列として扱う必要があります[RFC3454]。

If the server includes the USER argument in the UTF8 capability response, the client MAY use UTF-8 characters with a "USER", "PASS", or "APOP" command; the client MAY do so before issuing the "UTF8" command. Clients MUST NOT use UTF-8 characters when authenticating if the server did not include the USER argument in the UTF8 capability response.

サーバーがUTF8機能の応答にUSER引数を含める場合、クライアントは「USER」、「PASS」、または「APOP」コマンドでUTF-8文字を使用できます。クライアントは、「UTF8」コマンドを発行する前にそうしてもよい(MAY)。サーバーがUTF8機能の応答にUSER引数を含めなかった場合、クライアントは認証時にUTF-8文字を使用してはなりません(MUST NOT)。

The server MUST reject UTF-8 usernames or passwords that fail to comply with the formal syntax in UTF-8 [RFC3629].

サーバーは、UTF-8 [RFC3629]の正式な構文に準拠していないUTF-8ユーザー名またはパスワードを拒否する必要があります。

Use of UTF-8 strings in the "AUTH" command is governed by the POP3 SASL [RFC5034] mechanism.

「AUTH」コマンドでのUTF-8文字列の使用は、POP3 SASL [RFC5034]メカニズムによって管理されています。

3. "LANG" Capability
3. 「LANG」機能

This document adds a new POP3 extension [RFC2449] capability response tag to indicate support for a new command: "LANG".


3.1. Definition
3.1. 定義

The capability tag and new command are described below.




Arguments with CAPA tag: none


Added Commands: LANG


Standard commands affected: All


Announced states / possible differences: both / no


Commands valid in states: AUTHORIZATION, TRANSACTION


Specification reference: this document


3.2. Discussion
3.2. 討論

POP3 allows most +OK and -ERR server responses to include human-readable text that, in some cases, might be presented to the user. But that text is limited to ASCII by the POP3 specification [RFC1939]. The "LANG" capability and command permit a POP3 client to negotiate which language the server uses when sending human-readable text.

POP3では、ほとんどの+ OKおよび-ERRサーバー応答に、場合によってはユーザーに提示される人間が読めるテキストを含めることができます。しかし、そのテキストはPOP3仕様[RFC1939]によってASCIIに制限されています。 「LANG」機能とコマンドにより、POP3クライアントは、サーバーが人間が読めるテキストを送信するときに使用する言語をネゴシエートできます。

The "LANG" command requests that human-readable text included in all subsequent +OK and -ERR responses be localized to a language matching the language range argument (the "basic language range" as described by the "Matching of Language Tags" [RFC4647]). If the command succeeds, the server returns a +OK response followed by a single space, the exact language tag selected, and another space. Human-readable text in the appropriate language then appears in the rest of the line. This, and subsequent protocol-level human-readable text, is encoded in the UTF-8 charset.

「LANG」コマンドは、後続のすべての+ OKおよび-ERR応答に含まれる人間が読めるテキストを、言語範囲引数(「言語タグのマッチング」[RFC4647で説明されている「基本言語範囲」)に一致する言語にローカライズすることを要求します。 ])。コマンドが成功すると、サーバーは+ OK応答を返し、その後に単一のスペース、選択された正確な言語タグ、および別のスペースが続きます。その後、適切な言語で人間が読めるテキストが行の残りの部分に表示されます。これとそれに続くプロトコルレベルの人間が読めるテキストは、UTF-8文字セットでエンコードされます。

If the command fails, the server returns an -ERR response and subsequent human-readable response text continues to use the language that was previously used.


If the client issues a "LANG" command with the special "*" language range argument, it indicates a request to use a language designated as preferred by the server administrator. The preferred language MAY vary based on the currently active user.


If no argument is given and the POP3 server issues a positive response, that response will usually consist of multiple lines. After the initial +OK, for each language tag the server supports, the POP3 server responds with a line for that language. This line is called a "language listing".

引数が指定されておらず、POP3サーバーが肯定応答を発行する場合、その応答は通常複数行で構成されます。最初の+ OKの後、サーバーがサポートする言語タグごとに、POP3サーバーはその言語の行で応答します。この行は「言語リスト」と呼ばれます。

In order to simplify parsing, all POP3 servers are required to use a certain format for language listings. A language listing consists of the language tag [RFC5646] of the message, optionally followed by a single space and a human-readable description of the language in the language itself, using the UTF-8 charset. There is no specific order to the listing of languages; the order may depend on configuration or implementation.


3.3. Examples
3.3. 例

Examples for "LANG" capability usage are shown below.


Note that some examples do not include the correct character accents due to limitations of the RFC format.


      C: USER karen
      S: +OK Hello, karen
      C: PASS password
      S: +OK karen's maildrop contains 2 messages (320 octets)

Client requests deprecated MUL language [ISO639-2]. Server replies with -ERR response.


      C: LANG MUL
      S: -ERR invalid language MUL
      A LANG command with no parameters is a request for
      a language listing.
      C: LANG
      S: +OK Language listing follows:
      S: en English
      S: en-boont English Boontling dialect
      S: de Deutsch
      S: it Italiano
      S: es Espanol
      S: sv Svenska
      S: .

A request for a language listing might fail.


      C: LANG
      S: -ERR Server is unable to list languages

Once the client selects the language, all responses will be in that language, starting with the response to the "LANG" command.


      C: LANG es
      S: +OK es Idioma cambiado

If a server returns an -ERR response to a "LANG" command that specifies a primary language, the current language for responses remains in effect.


      C: LANG uga
      S: -ERR es Idioma <<UGA>> no es conocido
      C: LANG sv
      S: +OK sv Kommandot "LANG" lyckades
      C: LANG *
      S: +OK es Idioma cambiado
4. Non-ASCII Character Maildrops
4. 非ASCII文字のメールドロップ

When a POP3 server uses a native non-ASCII character maildrop, it is the responsibility of the server to comply with the POP3 base specification [RFC1939] and Internet Message Format [RFC5322] when not in UTF-8 mode. When the server is not in UTF-8 mode and the message requires that mode, requests to download the message MAY be rejected (as specified in the next section) or the various alternatives outlined in Section 2.1 above, including creation and delivery of surrogates for the original message, MAY be considered.


5. "UTF8" Response Code
5. 「UTF8」応答コード

Per "POP3 Extension Mechanism" [RFC2449], this document adds a new response code: UTF8, described below.


Complete response code: UTF8


Valid for responses: -ERR


Valid for commands: LIST, TOP, RETR


Response code meaning and expected client behavior: The "UTF8" response code indicates that a failure is due to a request for message content that contains a UTF-8 string when the client is not in UTF-8 mode.

応答コードの意味と予想されるクライアントの動作: "UTF8"応答コードは、クライアントがUTF-8モードでないときに、UTF-8文字列を含むメッセージコンテンツの要求が原因で失敗したことを示します。

The client MAY reissue the command after entering UTF-8 mode.


6. IANA Considerations
6. IANAに関する考慮事項

Sections 2 and 3 of this specification update two capabilities ("UTF8" and "LANG") in the POP3 capability registry [RFC2449].


Section 5 of this specification adds one new response code ("UTF8") to the POP3 response codes registry [RFC2449].

この仕様のセクション5では、POP3応答コードレジストリ[RFC2449]に1つの新しい応答コード( "UTF8")が追加されています。

7. Security Considerations
7. セキュリティに関する考慮事項

The security considerations of UTF-8 [RFC3629], SASLprep [RFC4013], and the Unicode Format for Network Interchange [RFC5198] apply to this specification, particularly with respect to use of UTF-8 strings in usernames and passwords.

特にユーザー名とパスワードでのUTF-8文字列の使用に関して、UTF-8 [RFC3629]、SASLprep [RFC4013]、およびネットワーク交換のUnicode形式[RFC5198]のセキュリティに関する考慮事項がこの仕様に適用されます。

The "LANG *" command might reveal the existence and preferred language of a user to an active attacker probing the system if the active language changes in response to the "USER", "PASS", or "APOP" commands prior to validating the user's credentials. Servers are strongly advised to implement a configuration to prevent this exposure.

「LANG *」コマンドは、ユーザーの検証前に「USER」、「PASS」、または「APOP」コマンドに応答してアクティブな言語が変更された場合、システムを調査しているアクティブな攻撃者にユーザーの存在と優先言語を明らかにする可能性があります。資格情報。サーバーは、この露出を防ぐための構成を実装することを強くお勧めします。

It is possible for a man-in-the-middle attacker to insert a "LANG" command in the command stream, thus, making protocol-level diagnostic responses unintelligible to the user. A mechanism to protect the integrity of the session can be used to defeat such attacks. For example, a client can issue the "STLS" command [RFC2595] before issuing the "LANG" command.


As with other internationalization upgrades, modifications to server authentication code (in this case, to support non-ASCII strings) need to be done with care to avoid introducing vulnerabilities (for example, in string parsing or matching). This is particularly important if the native databases or mailstore of the operating system use some character set or encoding other than Unicode in UTF-8.


