[要約] RFC 6129は、'application/tei+xml'メディアタイプの定義と使用方法に関するものです。このメディアタイプは、XML形式で表現されたテキストエンコーディングイニシアティブ(TEI)ドキュメントを表すために使用されます。目的は、テキストデータの標準化と相互運用性の向上です。
Internet Engineering Task Force (IETF) L. Romary Request for Comments: 6129 TEI Consortium and INRIA Category: Informational S. Lundberg ISSN: 2070-1721 The Royal Library, Copenhagen February 2011
The 'application/tei+xml' Media Type
「アプリケーション/TEI XML」メディアタイプ
Abstract
概要
This document defines the 'application/tei+xml' media type for markup languages defined in accordance with the Text Encoding and Interchange guidelines.
このドキュメントでは、テキストエンコーディングおよびインターチェンジガイドラインに従って定義されたマークアップ言語の「アプリケーション/TEI XML」メディアタイプを定義します。
Status of This Memo
本文書の位置付け
This document is not an Internet Standards Track specification; it is published for informational purposes.
このドキュメントは、インターネット標準の追跡仕様ではありません。情報目的で公開されています。
This document is a product of the Internet Engineering Task Force (IETF). It represents the consensus of the IETF community. It has received public review and has been approved for publication by the Internet Engineering Steering Group (IESG). Not all documents approved by the IESG are a candidate for any level of Internet Standard; see Section 2 of RFC 5741.
このドキュメントは、インターネットエンジニアリングタスクフォース(IETF)の製品です。IETFコミュニティのコンセンサスを表しています。公開レビューを受けており、インターネットエンジニアリングステアリンググループ(IESG)からの出版が承認されています。IESGによって承認されたすべてのドキュメントが、あらゆるレベルのインターネット標準の候補者ではありません。RFC 5741のセクション2を参照してください。
Information about the current status of this document, any errata, and how to provide feedback on it may be obtained at http://www.rfc-editor.org/info/rfc6129.
このドキュメントの現在のステータス、任意のERRATA、およびそのフィードバックを提供する方法に関する情報は、http://www.rfc-editor.org/info/rfc6129で取得できます。
Copyright Notice
著作権表示
Copyright (c) 2011 IETF Trust and the persons identified as the document authors. All rights reserved.
Copyright(c)2011 IETF Trustおよび文書著者として特定された人。全著作権所有。
This document is subject to BCP 78 and the IETF Trust's Legal Provisions Relating to IETF Documents (http://trustee.ietf.org/license-info) in effect on the date of publication of this document. Please review these documents carefully, as they describe your rights and restrictions with respect to this document. Code Components extracted from this document must include Simplified BSD License text as described in Section 4.e of the Trust Legal Provisions and are provided without warranty as described in the Simplified BSD License.
このドキュメントは、BCP 78およびIETFドキュメント(http://trustee.ietf.org/license-info)に関連するIETF Trustの法的規定の対象となります。この文書に関するあなたの権利と制限を説明するので、これらの文書を注意深く確認してください。このドキュメントから抽出されたコードコンポーネントには、セクション4.Eで説明されている法的規定のセクション4.Eで説明されており、単純化されたBSDライセンスで説明されているように保証なしで提供される簡略化されたBSDライセンステキストを含める必要があります。
Table of Contents
目次
1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . 2 2. Recognizing TEI Files . . . . . . . . . . . . . . . . . . . . . 2 3. Fragment Identifier . . . . . . . . . . . . . . . . . . . . . . 4 4. Security Considerations . . . . . . . . . . . . . . . . . . . . 4 4.1. Harmful Content . . . . . . . . . . . . . . . . . . . . . . 4 4.2. Intellectual Property Rights . . . . . . . . . . . . . . . 4 4.3. Authenticity and confidentiality . . . . . . . . . . . . . 5 5. IANA Considerations . . . . . . . . . . . . . . . . . . . . . . 5 5.1. Registration of MIME Type 'application/tei+xml' . . . . . . 5 6. References . . . . . . . . . . . . . . . . . . . . . . . . . . 6 6.1. Normative References . . . . . . . . . . . . . . . . . . . 6 6.2. Informative References . . . . . . . . . . . . . . . . . . 7
Text Encoding and Interchange (TEI) is an international and interdisciplinary standard that is widely used by libraries, museums, publishers, and individual scholars to represent all kinds of textual material for online research and teaching [TEI].
テキストエンコーディングとインターチェンジ(TEI)は、図書館、博物館、出版社、および個々の学者が広く使用して、オンライン調査と教育のためのあらゆる種類のテキスト資料[TEI]によって広く使用されている国際的かつ学際的な基準です。
This document defines the 'application/tei+xml' media type in accordance with [RFC3023] in order to enable generic processing of such documents on the Internet using eXtensible Markup Language (XML) [W3C.REC-xml-20081126] technologies.
このドキュメントでは、拡張可能なマークアップ言語(XML)[W3C.REC-XML-20081126]テクノロジーを使用してインターネット上のこのようなドキュメントの一般的な処理を有効にするために、[RFC3023]に従って「アプリケーション/TEI XML」メディアタイプを定義します。
TEI files are XML documents or fragments having the root element (as defined in [W3C.REC-xml-20081126]) in a TEI namespace. TEI namespace names are defined as a Universal Resource Identifier (URI) [RFC3986] in accordance with [W3C.REC-xml-names-20091208] and begins with http://www.tei-c.org/ns/ followed by the version number of the namespace. The current namespace is http://www.tei-c.org/ns/1.0
TEIファイルは、TEIの名前空間のルート要素([w3c.rec-xml-20081126]で定義されているルート要素を持つxmlドキュメントまたはフラグメントです。TEIの名前空間名は、[w3c.rec-xml-names-20091208]に従って、ユニバーサルリソース識別子(URI)[RFC3986]として定義され、http://www.tei-c.org/ns/で始まります。名前空間のバージョン番号。現在の名前空間はhttp://www.tei-c.org/ns/1.0です
The most common root element names for TEI documents are
TEIドキュメントの最も一般的なルート要素名は
<TEI>
<tei>
<teiCorpus>
<teicorpus>
The teiCorpus documents provide the ability to bundle multiple documents into a single file.
Teicorpusドキュメントは、複数のドキュメントを単一のファイルにバンドルする機能を提供します。
Examples:
例:
A document having <TEI> root element
<tei>ルート要素を持つドキュメント
<?xml version="1.0" encoding="UTF-8" ?> <TEI xmlns="http://www.tei-c.org/ns/1.0"> <teiHeader> ... </teiHeader> <text> ... </text> </TEI>
A document having <teiCorpus> root element
<teicorpus>ルート要素を持つドキュメント
<?xml version="1.0" encoding="UTF-8" ?> <teiCorpus xmlns="http://www.tei-c.org/ns/1.0"> <teiHeader> ... </teiHeader> <TEI> <teiHeader> ... </teiHeader> <text> ... </text> </TEI> <TEI> ... second document ... </TEI> <TEI> ... third document ... </TEI> </teiCorpus>
TEI and teiCorpus files are often given the extensions .tei and .teiCorpus, respectively. There is a third type of file, which often is given the suffix .odd. ODD ("One Document Does it All") is a TEI XML document that includes schema fragments, prose documentation, and reference documentation. It is used for the definition and documentation of XML-based languages, and primarily for the TEI Guidelines [ODD]. In other words, ODD files do not differ from other TEI files in syntax, only in function.
TeiとTeicorpusのファイルには、それぞれ拡張機能がそれぞれ拡張機能と.teicorpusが与えられます。3番目のタイプのファイルがあり、多くの場合、接尾辞が与えられます。ODD( "1つのドキュメントはすべてを実行します")は、スキーマフラグメント、散文ドキュメント、参照ドキュメントを含むTEI XMLドキュメントです。これは、XMLベースの言語の定義とドキュメントに使用され、主にTEIガイドライン[ODD]に使用されます。言い換えれば、奇数ファイルは構文内の他のTEIファイルと違いはありません。
Documents having the media type 'application/tei+xml' use the fragment identifier notation as specified in [RFC3023] for the media type 'application/xml'.
メディアタイプ「アプリケーション/TEI XML」を含むドキュメントメディアタイプ「アプリケーション/XML」に[RFC3023]で指定されているフラグメント識別子表記を使用します。
An XML resource does not in itself compromise data security. When being available on a network simply through the dereferencing of an Internationalized Resource Identifier (IRI) [RFC3987] or a URI, care must be taken to properly interpret the data to prevent unintended access. Hence the security issues of [RFC3986], Section 7, apply. In addition, as this media type uses the "+xml" convention, it shares the same security considerations as described in RFC 3023 [RFC3023], Section 10. In general, security issues related to the use of XML in IETF protocols are treated in RFC 3470 [RFC3470], Section 7. We will not try to duplicate this material, but review some aspects that are important for document-centric XML as applied to text encoding.
XMLリソースは、それ自体がデータセキュリティを損なうわけではありません。国際化されたリソース識別子(IRI)[RFC3987]またはURIの繰り返しを通じてネットワークで利用可能である場合、意図しないアクセスを防ぐためにデータを適切に解釈するように注意する必要があります。したがって、[RFC3986]、セクション7のセキュリティ問題が適用されます。さらに、このメディアタイプは「XML」条約を使用するため、RFC 3023 [RFC3023]、セクション10で説明されているのと同じセキュリティ上の考慮事項を共有しています。一般に、IETFプロトコルでのXMLの使用に関連するセキュリティ問題はRFCで処理されます。3470 [RFC3470]、セクション7。この資料を複製しようとはしませんが、テキストエンコーディングに適用されるドキュメント中心のXMLにとって重要ないくつかの側面をレビューします。
Any application accepting submitted or retrieving TEI XML for processing has to be aware of risks connected with injection of harmful scripts and executable XML. XML inclusion [W3C.REC-xinclude-20061115] and the use of external entities are vulnerable to various forms of spoofing, and can also reveal aspects of a service in a way that may compromise its security. Any vulnerability of these kinds are, however, application specific. The TEI namespaces do not contain such elements.
処理のためにTEI XMLの提出または取得を受け入れるアプリケーションは、有害なスクリプトと実行可能XMLの注入に関連するリスクを認識する必要があります。XMLインクルージョン[W3C.REC-XINCLUDE-20061115]および外部エンティティの使用は、さまざまな形式のスプーフィングに対して脆弱であり、セキュリティを損なう可能性のある方法でサービスの側面を明らかにすることもできます。ただし、これらの種類の脆弱性は、アプリケーション固有です。TEIの名前空間には、そのような要素が含まれていません。
TEI documents often arise in digitization of cultural heritage materials. Texts made accessible in TEI format may be unrestricted in the sense that their distribution may be unlimited by Digital Rights Management [DRM] or Intellectual Property Rights [IPR] constraints. However, TEI documents are heterogeneous. Some parts of a document may be unrestricted, whereas others, such as editorial text and annotations, may be subject to DRM restrictions.
TEI文書は、文化遺産のデジタル化でしばしば発生します。TEI形式でアクセスできるテキストは、デジタル権管理[DRM]または知的財産権[IPR]の制約によって分布が無制限になる可能性があるという意味で無制限になる可能性があります。ただし、TEIドキュメントは異質です。ドキュメントの一部の部分は無制限である可能性がありますが、編集テキストや注釈などの他の部分はDRMの制限の対象となる場合があります。
The TEI format provides means for highly granular attribution, down to the content of individual XML elements. Software agents participating in the exchange or processing TEI may be required to honour markup of this kind. Even when there are no IPR constraints, intellectual property attribution alone requires that document users be able to tell the difference between content from different sources.
TEI形式は、個々のXML要素のコンテンツに至るまで、非常に細い属性の手段を提供します。交換または処理TEIに参加しているソフトウェアエージェントは、この種のマークアップを尊重する必要がある場合があります。IPRの制約がない場合でも、知的財産の帰属だけでは、ドキュメントユーザーが異なるソースからのコンテンツ間の違いを伝えることができます。
Historical archival records are often encoded in TEI and legal document may be binding centuries after they were written. Digitization and encoding of legal texts may require technologies for assuring authenticity, such as cryptographic checksums and electronic signatures.
歴史的なアーカイブの記録は、多くの場合、TEIでエンコードされており、法的文書が書かれてから何世紀にもわたって拘束力があるかもしれません。法的テキストのデジタル化とエンコードには、暗号化チェックサムや電子署名などの信頼性を保証するためのテクノロジーが必要になる場合があります。
Similarly, historical documents may in part or in their entirety be confidential. This may be required by law or by the terms and conditions, such as in the case of donated or deposited text from private sources. A text archive may need content filtering or cryptographic technologies to meet such requirements.
同様に、履歴文書は部分的または全体的に機密性がある場合があります。これは、法律や条件によって必要とされる場合があります。これは、個人のソースからの寄付または預け入れのテキストの場合などです。テキストアーカイブでは、そのような要件を満たすためにコンテンツフィルタリングまたは暗号化技術が必要になる場合があります。
MIME media type name: application
MIMEメディアタイプ名:アプリケーション
MIME subtype name: tei+xml
MIMEサブタイプ名:TEI XML
Required parameters: None
必要なパラメーター:なし
Optional parameters: charset
オプションのパラメーター:charset
the parameter has identical semantics to the charset parameter of the "application/xml" media type as specified in RFC 3023 [RFC3023].
パラメーターには、RFC 3023 [RFC3023]で指定されている「アプリケーション/XML」メディアタイプのcharsetパラメーターに対して同一のセマンティクスがあります。
Encoding considerations:
考慮事項のエンコード:
Identical to those for 'application/xml'. See RFC 3023 [RFC3023], Section 3.2.
「アプリケーション/XML」と同じ。RFC 3023 [RFC3023]、セクション3.2を参照してください。
Security considerations:
セキュリティ上の考慮事項:
See Security Considerations (Section 4) in this specification.
この仕様のセキュリティ上の考慮事項(セクション4)を参照してください。
Interoperability considerations:
相互運用性の考慮事項:
TEI documents are often given the extension '.xml', which is not uncommon for other XML document formats.
TEIドキュメントには、多くの場合、拡張機能「.xml」が与えられます。これは、他のXMLドキュメント形式では珍しいことではありません。
Published specification:
公開された仕様:
This media type registration is for TEI documents [TEI] as described here. TEI syntax is defined in a schema [TEIschema].
このメディアタイプの登録は、ここで説明するように、TEI文書[TEI]用です。TEI構文は、スキーマ[Teischema]で定義されています。
Applications which use this media type:
このメディアタイプを使用するアプリケーション:
There are currently no known applications using the media type 'application/tei+xml'.
現在、メディアタイプ 'Application/TEI XML'を使用した既知のアプリケーションはありません。
Additional information:
追加情報:
Magic number(s):
マジックナンバー:
There is no single initial octet sequence that is always present in TEI documents.
TEIドキュメントには常に存在する初期オクテットシーケンスはありません。
file extension(s):
ファイル拡張子:
Common extensions are '.tei', '.teiCorpus' and '.odd'. See Recognizing TEI files (Section 2) in this specification.
一般的な拡張は「.tei '、' .teicorpus '、' .odd 'です。この仕様のTEIファイル(セクション2)の認識を参照してください。
Macintosh File Type Code(s)
Macintoshファイルタイプコード
TEXT
文章
Object Identifier(s) or OID(s)
オブジェクト識別子またはoid(s)
Not applicable
適用できない
[RFC3023] Murata, M., St. Laurent, S., and D. Kohn, "XML Media Types", RFC 3023, January 2001.
[RFC3023] Murata、M.、St。Laurent、S。、およびD. Kohn、「XML Media Types」、RFC 3023、2001年1月。
[RFC3470] Hollenbeck, S., Rose, M., and L. Masinter, "Guidelines for the Use of Extensible Markup Language (XML) within IETF Protocols", BCP 70, RFC 3470, January 2003.
[RFC3470] Hollenbeck、S.、Rose、M。、およびL. Masinter、「IETFプロトコル内の拡張マークアップ言語(XML)の使用に関するガイドライン」、BCP 70、RFC 3470、2003年1月。
[RFC3986] Berners-Lee, T., Fielding, R., and L. Masinter, "Uniform Resource Identifier (URI): Generic Syntax", STD 66, RFC 3986, January 2005.
[RFC3986] Berners-Lee、T.、Fielding、R。、およびL. Masinter、「Uniform Resource Identifier(URI):Generic Syntax」、Std 66、RFC 3986、2005年1月。
[RFC3987] Duerst, M. and M. Suignard, "Internationalized Resource Identifiers (IRIs)", RFC 3987, January 2005.
[RFC3987] Duerst、M。およびM. Suignard、「国際化されたリソース識別子(IRIS)」、RFC 3987、2005年1月。
[TEI] "TEI Guidelines", <http://www.tei-c.org/Vault/P5/1.8.0/ doc/tei-p5-doc/en/html/>.
[TEI]「TEIガイドライン」、<http://www.tei-c.org/vault/p5/1.8.0/ doc/tei-p5-doc/en/html/>。
[TEIschema] "Schema generated from ODD source", <http://www.tei-c.org/ release/xml/tei/custom/schema/relaxng/tei_all.rng>.
[Teischema]「奇妙なソースから生成されたスキーマ、<http://www.tei-c.org/ release/xml/tei/custom/schema/rackng/tei_all.rng>。
[W3C.REC-xml-20081126] Paoli, J., Yergeau, F., Sperberg-McQueen, C., Maler, E., and T. Bray, "Extensible Markup Language (XML) 1.0 (Fifth Edition)", World Wide Web Consortium Recommendation REC-xml-20081126, November 2008, <http://www.w3.org/TR/2008/REC-xml-20081126>.
[W3C.REC-XML-20081126] Paoli、J.、Yergeau、F.、Sperberg-Mcqueen、C.、Maler、E.、およびT. Bray、「拡張可能なマークアップ言語(XML)1.0(第5版)」、World Wide Web Consortiumの推奨REC-XML-20081126、2008年11月、<http://www.w3.org/tr/2008/REC-XML-20081126>。
[W3C.REC-xml-names-20091208] Bray, T., Hollander, D., Layman, A., Tobin, R., and H. Thompson, "Namespaces in XML 1.0 (Third Edition)", World Wide Web Consortium Recommendation REC-xml-names-20091208, December 2009, <http://www.w3.org/TR/2009/REC-xml-names-20091208>.
[W3C.REC-XML-NAMES-20091208] Bray、T.、Hollander、D.、Layman、A.、Tobin、R.、およびH. Thompson、「XML 1.0の名前空間(第3版)」、World Wide Webコンソーシアムの推奨REC-XML-NAMES-20091208、2009年12月、<http://www.w3.org/tr/2009/rec-xml-names-20091208>。
[DRM] "Digital rights management", <http://en.wikipedia.org/w/ index.php?title=Digital_rights_management& oldid=412653591>.
[DRM]「Digital Rights Management」、<http://en.wikipedia.org/w/ index.php?title = digital_rights_management&oldid = 412653591>。
[IPR] "Intellectual property", <http://en.wikipedia.org/w/ index.php?title=Intellectual_property&oldid=411690322>.
[ipr]「知的財産」、<http://en.wikipedia.org/w/ index.php?title = intellectual_property&oldid = 411690322>。
[ODD] "Getting Started with P5 ODDs", <http://www.tei-c.org/Guidelines/Customization/odds.xml>.
[奇数]「P5オッズを始める」、<http://www.tei-c.org/guidelines/customization/odds.xml>。
[W3C.REC-xinclude-20061115] Marsh, J., Orchard, D., and D. Veillard, "XML Inclusions (XInclude) Version 1.0 (Second Edition)", World Wide Web Consortium Recommendation REC-xinclude-20061115, November 2006, <http://www.w3.org/TR/2006/REC-xinclude-20061115>.
[W3C.REC-XINCLUDE-20061115] Marsh、J.、Orchard、D。、およびD. Veillard、「XML Implusions(Xinclude)バージョン1.0(第2版)」、World Wide Webコンソーシアムの推奨2006、<http://www.w3.org/tr/2006/rec-xinclude-20061115>。
Authors' Addresses
著者のアドレス
Laurent Romary TEI Consortium and INRIA
ローランロマリーテイコンソーシアムとインリア
EMail: laurent.romary@inria.fr URI: http://www.tei-c.org/
Sigfrid Lundberg The Royal Library, Copenhagen Postbox 2149 1016 Koebenhavn K Denmark
Sigfrid Lundberg The Royal Library、Copenhagen Postbox 2149 1016 Koebenhavn K Denmark
EMail: slu@kb.dk URI: http://sigfrid-lundberg.se/