[要約] RFC 6067は、BCP 47 Extension Uに関する要約と目的を提供します。この拡張は、言語タグのサブタグを定義し、特定の言語の変種や地域のバリエーションを識別するために使用されます。
Internet Engineering Task Force (IETF) M. Davis Request for Comments: 6067 Google Category: Informational A. Phillips ISSN: 2070-1721 Lab126 Y. Umaoka IBM December 2010
BCP 47 Extension U
BCP 47拡張機能u
Abstract
概要
This document specifies an Extension to BCP 47 that provides subtags that specify language and/or locale-based behavior or refinements to language tags, according to work done by the Unicode Consortium.
このドキュメントは、Unicodeコンソーシアムの作業に従って、言語および/またはロケールベースの動作または言語タグの改良を指定するサブタグを提供するBCP 47の拡張機能を指定します。
Status of This Memo
本文書の位置付け
This document is not an Internet Standards Track specification; it is published for informational purposes.
このドキュメントは、インターネット標準の追跡仕様ではありません。情報目的で公開されています。
This document is a product of the Internet Engineering Task Force (IETF). It represents the consensus of the IETF community. It has received public review and has been approved for publication by the Internet Engineering Steering Group (IESG). Not all documents approved by the IESG are a candidate for any level of Internet Standard; see Section 2 of RFC 5741.
このドキュメントは、インターネットエンジニアリングタスクフォース(IETF)の製品です。IETFコミュニティのコンセンサスを表しています。公開レビューを受けており、インターネットエンジニアリングステアリンググループ(IESG)からの出版が承認されています。IESGによって承認されたすべてのドキュメントが、あらゆるレベルのインターネット標準の候補者ではありません。RFC 5741のセクション2を参照してください。
Information about the current status of this document, any errata, and how to provide feedback on it may be obtained at http://www.rfc-editor.org/info/rfc6067.
このドキュメントの現在のステータス、任意のERRATA、およびそのフィードバックを提供する方法に関する情報は、http://www.rfc-editor.org/info/rfc6067で取得できます。
Copyright Notice
著作権表示
Copyright (c) 2010 IETF Trust and the persons identified as the document authors. All rights reserved.
Copyright(c)2010 IETF Trustおよび文書著者として特定された人。全著作権所有。
This document is subject to BCP 78 and the IETF Trust's Legal Provisions Relating to IETF Documents (http://trustee.ietf.org/license-info) in effect on the date of publication of this document. Please review these documents carefully, as they describe your rights and restrictions with respect to this document. Code Components extracted from this document must include Simplified BSD License text as described in Section 4.e of the Trust Legal Provisions and are provided without warranty as described in the Simplified BSD License.
このドキュメントは、BCP 78およびIETFドキュメント(http://trustee.ietf.org/license-info)に関連するIETF Trustの法的規定の対象となります。この文書に関するあなたの権利と制限を説明するので、これらの文書を注意深く確認してください。このドキュメントから抽出されたコードコンポーネントには、セクション4.Eで説明されている法的規定のセクション4.Eで説明されており、単純化されたBSDライセンスで説明されているように保証なしで提供される簡略化されたBSDライセンステキストを含める必要があります。
Table of Contents
目次
1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.1. Requirements Language . . . . . . . . . . . . . . . . . . . 2 2. BCP 47 Required Information . . . . . . . . . . . . . . . . . . 2 2.1. Summary . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.1.1. Canonicalization . . . . . . . . . . . . . . . . . . . 5 2.2. Registration Form . . . . . . . . . . . . . . . . . . . . . 6 3. Acknowledgements . . . . . . . . . . . . . . . . . . . . . . . 6 4. IANA Considerations . . . . . . . . . . . . . . . . . . . . . . 6 5. Security Considerations . . . . . . . . . . . . . . . . . . . . 7 6. References . . . . . . . . . . . . . . . . . . . . . . . . . . 7 6.1. Normative References . . . . . . . . . . . . . . . . . . . 7 6.2. Informative References . . . . . . . . . . . . . . . . . . 7
[BCP47] permits the definition and registration of language tag extensions "that contain a language component and are compatible with applications that understand language tags". This document defines an extension for identifying Unicode locale-based variations using language tags. The "singleton" identifier for this extension is 'u'.
[BCP47]は、「言語コンポーネントを含み、言語タグを理解するアプリケーションと互換性のある言語タグ拡張機能の定義と登録を許可します。このドキュメントでは、言語タグを使用してユニコードロケールベースのバリエーションを識別するための拡張機能を定義します。この拡張機能の「シングルトン」識別子は「u」です。
The key words "MUST", "MUST NOT", "REQUIRED", "SHALL", "SHALL NOT", "SHOULD", "SHOULD NOT", "RECOMMENDED", "MAY", and "OPTIONAL" in this document are to be interpreted as described in RFC 2119 [RFC2119].
この文書のキーワード "MUST", "MUST NOT", "REQUIRED", "SHALL", "SHALL NOT", "SHOULD", "SHOULD NOT", "RECOMMENDED", "MAY", および "OPTIONAL" はRFC 2119 [RFC2119]で説明されているように解釈されます。
Language tags, as defined by [BCP47], are useful for identifying the language of content. They are also used as locale identifiers (or can be mapped to locales) in many operating environments and APIs. However, many locale identifiers also require additional "tailorings" or options for specific values within a language, culture, region, or other variation. This extension provides a mechanism for using these additional tailorings within language tags for general interchange.
[BCP47]で定義されている言語タグは、コンテンツの言語を識別するのに役立ちます。また、多くの動作環境やAPIでロケール識別子(またはロケールにマッピングできます)として使用されます。ただし、多くのロケール識別子には、言語、文化、地域、またはその他のバリエーション内の特定の値の追加の「仕立て」またはオプションも必要です。この拡張機能は、一般的なインターチェンジの言語タグ内でこれらの追加の仕立てを使用するためのメカニズムを提供します。
The Unicode Consortium defines a standardized, structured set of locale data and identifiers for locale data in the "Common Locale Data Repository" or "CLDR". The maintaining authority for the extension defined by this document is the Unicode Consortium:
Unicodeコンソーシアムは、「一般的なロケールデータリポジトリ」または「CLDR」のロケールデータの標準化された構造化されたロケールデータと識別子を定義します。このドキュメントで定義されている拡張の維持権は、Unicodeコンソーシアムです。
+---------------+---------------------------------------------------+ | Item | Value | +---------------+---------------------------------------------------+ | Name | Unicode Consortium | | Contact Email | cldr-contact@unicode.org | | Discussion | cldr-users@unicode.org | | List Email | | | URL Location | cldr.unicode.org | | Specification | Unicode Technical Standard #35 Unicode Locale | | | Data Markup Language (LDML), | | | http://unicode.org/reports/tr35/ | | Section | Section 3 Unicode Language and Locale Identifiers | +---------------+---------------------------------------------------+
The specification of extension subtags is provided by Section 3, Key Type Definitions of Unicode Technical Standard #35: Unicode Locale Data Markup Language [UTS35]. As required by BCP 47, subtags follow the language tag ABNF and other rules for the formation of language tags and subtags, are restricted to the ASCII letters and digits, are not case sensitive, and do not exceed eight characters in length. Note that any "well-formed" language tag (see RFC 5646, Section 2.2.9 [BCP47]) is also a well-formed locale identifier.
拡張サブタグの仕様は、セクション3、Unicode Technical Standard#35のキータイプ定義によって提供されます。ユニコードロケールデータマークアップ言語[UTS35]。BCP 47で必要に応じて、サブタグは言語タグABNFおよび言語タグとサブタグの形成のためのその他のルールに従いますが、ASCII文字と数字に制限されており、ケースに敏感ではなく、長さ8文字を超えません。「よく形成された」言語タグ(RFC 5646、セクション2.2.9 [BCP47]を参照)もよく形成されたロケール識別子であることに注意してください。
LDML [UTS35] specifies a canonical representation. LDML is available over the Internet and at no cost, and is available via a royalty-free license at http://unicode.org/copyright.html. LDML is versioned, and each version of LDML is numbered, dated, and stable. Extension subtags, once defined by LDML, are never retracted and never change in meaning in a substantial way.
LDML [UTS35]は、標準表現を指定します。LDMLはインターネット経由で利用でき、無料で利用でき、http://unicode.org/copyright.htmlでロイヤリティフリーライセンスで利用できます。LDMLはバージョンであり、LDMLの各バージョンには番号が付けられ、日付が付けられ、安定されています。LDMLによって定義されると、拡張サブタグは撤回されることはなく、実質的な方法で意味が変化することはありません。
The structure of the Unicode locale extension is determined by the Unicode CLDR Technical Committee, in accordance with the policies and procedures in http://www.unicode.org/consortium/tc-procedures.html, and subject to the Unicode Consortium Policies on http://www.unicode.org/policies/policies.html.
Unicodeロケール拡張の構造は、http://www.unicode.org/consortium/tc-procedures.htmlのポリシーと手順に従って、Unicode CLDR技術委員会によって決定され、Unicode Consortiumポリシーの対象となります。http://www.unicode.org/policies/policies.html。
Changes that can be made by successive versions of LDML [UTS35] by the Unicode Consortium without requiring a new RFC include: the allocation of new attributes, keywords, and types; clarifications or non-material changes to an existing attribute, keyword, or type; and compatible extensions to the overall syntactic structure of attributes, keywords, and types. A new RFC would be required for material changes to an existing attribute, keyword, or type, or an incompatible change to the overall syntactic structure of attributes, keywords, and types; however, such a change would be contrary to the policies of the Unicode Consortium, and thus is not anticipated.
新しいRFCを必要とせずにUnicodeコンソーシアムがLDMLの連続バージョン[UTS35]で行うことができる変更には、新しい属性、キーワード、およびタイプの割り当てが含まれます。既存の属性、キーワード、またはタイプに対する明確化または非物質的な変更。属性、キーワード、およびタイプの全体的な構文構造への互換性のある拡張機能。既存の属性、キーワード、またはタイプの重要な変更、または属性、キーワード、およびタイプの全体的な構文構造への互換性のない変更には、新しいRFCが必要です。ただし、このような変更は、Unicodeコンソーシアムのポリシーに反しているため、予想されていません。
The subtags available for use in the 'u' extension consist of a set of attributes, keys, and types. Attributes, keys, types, and their respective meanings are defined in Section 3 (Unicode Language and Locale Identifiers) of [UTS35]. The following is a summary of that definition:
「u」拡張機能で使用できるサブタグは、属性、キー、およびタイプのセットで構成されています。属性、キー、タイプ、およびそれぞれの意味は、[UTS35]のセクション3(Unicode言語とロケール識別子)で定義されています。以下は、その定義の概要です。
o An 'attribute' is a subtag with a length of three to eight characters following the singleton and preceding any 'keyword' sequences. No attributes were defined at the time of this document's publication.
o 「属性」は、シングルトンに続き、「キーワード」シーケンスに続く3〜8文字の長さのサブタグです。このドキュメントの公開時には、属性は定義されていませんでした。
o A 'keyword' is a sequence of subtags consisting of a 'key' subtag, followed by zero or more 'type' subtags (so a 'key' might appear alone and not be accompanied by a 'type' subtag). A 'key' MUST NOT appear more than once in a language tag's extension string. The order of the 'type' subtags within a 'keyword' is sometimes significant to their interpretation.
o 「キーワード」は、「キー」サブタグで構成されるサブタグのシーケンスであり、その後にゼロ以上の「タイプ」サブタグが続きます(したがって、「キー」は単独で表示され、「タイプ」サブタグを伴わない場合があります)。「キー」は、言語タグの拡張文字列に複数回表示してはなりません。「キーワード」内の「タイプ」サブタグの順序は、彼らの解釈にとって時々重要なものです。
A. A 'key' is a subtag with a length of exactly two characters. Each 'key' is followed by zero or more 'type' subtags.
A.「キー」は、正確に2文字の長さのサブタグです。各「キー」の後には、ゼロ以上の「タイプ」サブタグが続きます。
B. A 'type' is a subtag with a length of three to eight characters following a 'key'. 'Type' subtags are specific to a particular 'key' and the order of the 'type' subtags MAY be significant to the interpretation of the 'keyword'.
B.「タイプ」は、「キー」に続く3〜8文字の長さのサブタグです。「タイプ」サブタグは特定の「キー」に固有であり、「タイプ」サブタグの順序は、「キーワード」の解釈にとって重要な場合があります。
For example, the language tag "de-DE-u-attr-co-phonebk" consists of:
たとえば、言語タグ「de-de-u-attr-co-phonebk」は以下で構成されています。
o The base language tag "de-DE" (German as used in Germany), exactly as defined by [BCP47] using subtags from the IANA Language Subtag Registry.
o IANA言語サブタグレジストリのサブタグを使用して、[BCP47]で定義されているとおり、基本言語タグ「de-de」(ドイツで使用されるドイツ語)。
o The singleton 'u', identifying this extension.
o シングルトン「u」、この拡張機能を特定します。
o The attribute 'attr', which is an example for illustration (no attributes were defined at the time this document was published).
o 属性「属性」は、図の例です(このドキュメントが公開された時点で属性は定義されていません)。
o The keyword 'co-phonebk', consisting to the key 'co' (Collation) and the type 'phonebk' (Phonebook collation order).
o キーワード「Co-PhoneBK」、キー「Co」(照合)とタイプ「PhoneBK」(電話帳照合注文)に構成される。
Only the first occurrence of an attribute or key conveys meaning in a language tag. When interpreting tags containing the Unicode locale extension, duplicate attributes or keywords are ignored in the following way: ignore any attribute that has already appeared in the tag and ignore any keyword whose key has already occurred in the tag.
属性またはキーの最初の発生のみが、言語タグで意味を伝えます。Unicode Locale拡張子を含むタグを解釈する場合、次の方法で既に表示されている属性を無視して、タグで既にキーが発生しているキーワードを無視します。
Successive versions of [UTS35] could define additional attributes, keys, and types. Once defined, attributes, keys, and types will never be removed.
[UTS35]の連続バージョンは、追加の属性、キー、およびタイプを定義できます。定義されたら、属性、キー、およびタイプが削除されることはありません。
Beginning with CLDR version 1.7.2, machine-readable files are available listing the valid attributes, keys, and types for each successive version of [UTS35]. These releases are listed on http://cldr.unicode.org/index/downloads. Each release has an associated data directory of the form "http://unicode.org/Public/cldr/<version>", where "<version>" is replaced by the release number. For example, for version 1.7.2, the "core.zip" file is located at http://unicode.org/Public/cldr/1.7.2/core.zip. Inside the "core.zip" file, the path "common/bcp47" contains the data files defining the valid attributes, keys, and types. The most recent version is always identified by the version "latest" and can be accessed by the URL in Section 2.2.
CLDRバージョン1.7.2から始めて、[UTS35]の連続バージョンごとに有効な属性、キー、およびタイプをリストして、マシン可読ファイルが利用可能です。これらのリリースは、http://cldr.unicode.org/index/downloadsにリストされています。各リリースには、フォーム「http://unicode.org/public/cldr/ <version>」の関連データディレクトリがあり、「<bersion>」はリリース番号に置き換えられます。たとえば、バージョン1.7.2の場合、「core.zip」ファイルはhttp://unicode.org/public/cldr/1.7.2/core.zipにあります。「core.zip」ファイルの内部では、パス「common/bcp47」には、有効な属性、キー、およびタイプを定義するデータファイルが含まれています。最新のバージョンは常に「最新」バージョンで識別され、セクション2.2のURLでアクセスできます。
To get the version information in XML when working with the data files, the XML parser must be validating. When the 'core.zip' file is unzipped, the 'dtd' directory will be at the same level as the 'bcp47' directory; this is required for correct validation. For each release after CLDR 1.8, types introduced in that release are also marked in the data files by the XML attribute "since", such as in the following example: <type name="adp" since="1.9"/>
XMLでバージョン情報を取得するには、データファイルを操作するときに、XMLパーサーが検証する必要があります。「core.zip」ファイルが解凍されると、「dtd」ディレクトリは「bcp47」ディレクトリと同じレベルになります。これは、正しい検証に必要です。CLDR 1.8の後の各リリースについて、そのリリースで導入されたタイプは、次の例のように、XML属性「以降」によってデータファイルにマークされています。
The data is also currently maintained in a source code repository, with each release tagged, for viewing directly without unzipping. For example, see:
データは現在、ソースコードリポジトリにも維持されており、各リリースがタグ付けされて、解凍せずに直接表示されます。たとえば、参照してください:
o http://unicode.org/repos/cldr/tags/release-1-7-2/common/bcp47/
o
o http://unicode.org/repos/cldr/tags/release-1-8/common/bcp47/
o
Some data in the CLDR data files might require reference to LDML [UTS35]. For specific information, see Appendix Q in that document. For example, LDML reserves the type 'codepoints' to define specific code point ranges in Unicode for specific purposes.
CLDRデータファイルの一部のデータは、LDML [UTS35]への参照が必要になる場合があります。特定の情報については、そのドキュメントの付録Qを参照してください。たとえば、LDMLはタイプ「CodePoints」を留保して、特定の目的でUnicodeの特定のコードポイント範囲を定義します。
As required by [BCP47], the use of uppercase or lowercase letters is not significant in the subtags used in this extension. The canonical form for all subtags in the extension is lowercase. The canonical order of attributes is in [US-ASCII] order (that is, numbers before letters, with letters sorted as lowercase US-ASCII code points). The canonical order of keywords is in [US-ASCII] order by key. The order of subtags within a keyword is significant; the meaning of this extension is altered if those subtags are rearranged. Thus, the canonical form of the extension never reorders the subtags within a keyword.
[BCP47]で要求されているように、この拡張機能で使用されているサブタグでは、大文字または小文字の使用は重要ではありません。拡張機能内のすべてのサブタグの正規の形式は小文字です。属性の標準的な順序は[us-ascii]順序です(つまり、文字の前の数字で、文字は小文字のUS-asciiコードポイントとソートされています)。キーワードの標準的な順序は、キーによる[us-ascii]順序です。キーワード内のサブタグの順序は重要です。これらのサブタグが再配置されている場合、この拡張機能の意味は変更されます。したがって、拡張機能の標準形式は、キーワード内のサブタグを再設定することはありません。
Per RFC 5646, Section 3.7 [BCP47]:
RFC 5646、セクション3.7 [BCP47]:
%% Identifier: u Description: Unicode Locale Comments: Subtags for the identification of language and cultural variations. Used to set behavior in locale APIs. Data is located in the "common/bcp47" directory inside the referenced URL. Unicode Technical Standard #35 (LDML) provides additional reference material defining the keys and values. For more details please see <http://cldr.unicode.org/index/bcp47-extension>. Added: 2010-09-02 RFC: RFC 6067 Authority: Unicode Consortium Contact_Email: cldr-contact@unicode.org Mailing_List: cldr-users@unicode.org URL: http://www.unicode.org/Public/cldr/latest/core.zip %%
%%識別子:U説明:Unicode Localeコメント:言語と文化的バリエーションの識別のためのサブタグ。ロケールAPIで動作を設定するために使用されます。データは、参照されるURL内の「Common/BCP47」ディレクトリにあります。Unicode Technical Standard#35(LDML)は、キーと値を定義する追加の参照資料を提供します。詳細については、<http://cldr.unicode.org/index/BCP47-Extension>をご覧ください。追加:2010-09-02 RFC:RFC 6067 Authority:Unicode Consortium contact_email:cldr-contact@unicode.org maeling_list:cldr-users@unicode.org url:http://www.unicode.org/public/cldr/latestestestestestestestestestestestestestestestestest/core.zip %%
Thanks to John Emmons and the rest of the Unicode CLDR Technical Committee for their work in developing the BCP 47 subtags for LDML.
John Emmonsと、LDML向けのBCP 47サブタグの開発に取り組んでくれたUnicode CLDRテクニカル委員会の残りの部分に感謝します。
Thanks also to Doug Ewell, for his many suggestions for improvements to this document.
また、この文書の改善に関する多くの提案をしてくれたダグ・イーウェルにも感謝します。
According to this document, IANA has inserted the record in Section 2.2 into the Language Extensions Registry, according to Section 3.7 (Extensions and the Extensions Registry) of [BCP47], "Tags for Identifying Languages". Per Section 5.2 of [BCP47], there might be occasional (rare) requests by the Unicode Consortium (the "Authority" listed in the record) for maintenance of this record. Changes that can be submitted to IANA without the publication of a new RFC are limited to modification of the Comments, Contact_Email, Mailing_List, and URL fields. Any such requested changes MUST use the domain 'unicode.org' in any new addresses or URIs, MUST explicitly cite this document (so that IANA can reference these requirements), and MUST originate from the 'unicode.org' domain. The domain or authority can only be changed via a new RFC.
このドキュメントによると、IANAは[BCP47]のセクション3.7(拡張機能と拡張レジストリ)、「言語を識別するためのタグ」のセクション3.7(拡張機能と拡張レジストリ)に従って、セクション2.2のレコードを言語拡張レジストリに挿入しました。[BCP47]のセクション5.2に従って、このレコードのメンテナンスのために、Unicodeコンソーシアム(記録に記載されている「権限」)による時折(まれな)要求があるかもしれません。新しいRFCの公開なしでIANAに提出できる変更は、コメント、contact_email、maeling_list、およびurlフィールドの変更に限定されます。そのような要求された変更は、新しいアドレスまたはURIでドメイン「unicode.org」を使用する必要があり、このドキュメントを明示的に引用する必要があり(IANAがこれらの要件を参照できるように)、「unicode.org」ドメインから発生する必要があります。ドメインまたは権限は、新しいRFCを介してのみ変更できます。
The security considerations for this extension are the same as those for [BCP47]. See RFC 5646, Section 6, Security Considerations [BCP47].
この拡張のセキュリティ上の考慮事項は、[BCP47]のセキュリティと同じです。RFC 5646、セクション6、セキュリティに関する考慮事項[BCP47]を参照してください。
[BCP47] Phillips, A., Ed. and M. Davis, Ed., "Tags for Identifying Languages", BCP 47, RFC 5646, September 2009.
[BCP47]フィリップス、A。、編およびM.デイビス編、「言語を識別するためのタグ」、BCP 47、RFC 5646、2009年9月。
[RFC2119] Bradner, S., "Key words for use in RFCs to Indicate Requirement Levels", BCP 14, RFC 2119, March 1997.
[RFC2119] Bradner、S。、「要件レベルを示すためにRFCで使用するためのキーワード」、BCP 14、RFC 2119、1997年3月。
[US-ASCII] International Organization for Standardization, "ISO/IEC 646:1991, Information technology -- ISO 7-bit coded character set for information interchange.", 1991.
[US-ASCII]国際標準化機関、「ISO/IEC 646:1991、情報技術 - 情報交換用のISO 7ビットコード化された文字セット」、1991。
[UTS35] Davis, M., "Unicode Technical Standard #35: Locale Data Markup Language (LDML)", December 2007, <http://www.unicode.org/reports/tr35/>.
[UTS35] Davis、M。、「Unicode Technical Standard#35:Locale Data Markup Language(LDML)」、2007年12月、<http://www.unicode.org/reports/tr35/>。
Section 3: http://unicode.org/reports/ tr35/#Unicode_Language_and_Locale_Identifiers
セクション3:http://unicode.org/reports/ tr35/#unicode_language_and_locale_identifiers
Appendix Q: http://unicode.org/reports/ tr35/#Locale_Extension_Key_and_Type_Data
付録Q:http://unicode.org/reports/ tr35/#locale_extension_key_and_type_data
[ldml-registry] "Registry for Common Locale Data Repository tag elements", September 2009.
[LDML-Registry]「一般的なロケールデータリポジトリタグ要素のレジストリ」、2009年9月。
Authors' Addresses
著者のアドレス
Mark Davis Google
マーク・デイビス・グーグル
EMail: mark@macchiato.com
Addison Phillips Lab126
Addison Phillips Lab126
EMail: addison@lab126.com
Yoshito Umaoka IBM
ヨシートウマオカイブ
EMail: yoshito_umaoka@us.ibm.com