[要約] RFC 5691は、MPEG Surroundマルチチャンネルオーディオを持つエレメンタリーストリームのためのRTPペイロードフォーマットに関するものです。このRFCの目的は、MPEG SurroundオーディオをRTPパケットに効率的にエンコードし、ネットワーク上での伝送をサポートすることです。

Network Working Group                                         F. de Bont
Request for Comments: 5691                           Philips Electronics
Updates: 3640                                                  S. Doehla
Category: Standards Track                                 Fraunhofer IIS
                                                              M. Schmidt
                                                      Dolby Laboratories
                                                        R. Sperschneider
                                                          Fraunhofer IIS
                                                            October 2009
        

RTP Payload Format for Elementary Streams with MPEG Surround Multi-Channel Audio

MPEGサラウンドマルチチャネルオーディオを使用した基本ストリームのRTPペイロード形式

Abstract

概要

This memo describes extensions for the RTP payload format defined in RFC 3640 for the transport of MPEG Surround multi-channel audio. Additional Media Type parameters are defined to signal backwards-compatible transmission inside an MPEG-4 Audio elementary stream. In addition, a layered transmission scheme that doesn't use the MPEG-4 systems framework is presented to transport an MPEG Surround elementary stream via RTP in parallel with an RTP stream containing the downmixed audio data.

このメモは、MPEGサラウンドマルチチャネルオーディオの輸送のためにRFC 3640で定義されているRTPペイロード形式の拡張機能について説明しています。追加のメディアタイプパラメーターは、MPEG-4オーディオ初等ストリーム内の後方互換伝送を信号するように定義されています。さらに、MPEG-4システムフレームワークを使用しない階層化された伝送スキームが、ダウンミックスオーディオデータを含むRTPストリームと並行してMPEGサラウンド初等ストリームを並列に輸送するために提示されます。

Status of This Memo

本文書の位置付け

This document specifies an Internet standards track protocol for the Internet community, and requests discussion and suggestions for improvements. Please refer to the current edition of the "Internet Official Protocol Standards" (STD 1) for the standardization state and status of this protocol. Distribution of this memo is unlimited.

このドキュメントは、インターネットコミュニティのインターネット標準トラックプロトコルを指定し、改善のための議論と提案を要求します。このプロトコルの標準化状態とステータスについては、「インターネット公式プロトコル標準」(STD 1)の現在のエディションを参照してください。このメモの配布は無制限です。

Copyright Notice

著作権表示

Copyright (c) 2009 IETF Trust and the persons identified as the document authors. All rights reserved.

Copyright(c)2009 IETF Trustおよび文書著者として特定された人。全著作権所有。

This document is subject to BCP 78 and the IETF Trust's Legal Provisions Relating to IETF Documents (http://trustee.ietf.org/license-info) in effect on the date of publication of this document. Please review these documents carefully, as they describe your rights and restrictions with respect to this document. Code Components extracted from this document must include Simplified BSD License text as described in Section 4.e of the Trust Legal Provisions and are provided without warranty as described in the BSD License.

このドキュメントは、BCP 78およびIETFドキュメント(http://trustee.ietf.org/license-info)に関連するIETF Trustの法的規定の対象となります。この文書に関するあなたの権利と制限を説明するので、これらの文書を注意深く確認してください。このドキュメントから抽出されたコードコンポーネントには、セクション4.Eで説明されている法的規定のセクション4.Eで説明されており、BSDライセンスに記載されているように保証なしで提供される簡略化されたBSDライセンステキストを含める必要があります。

Table of Contents

目次

   1. Introduction ....................................................2
   2. Conventions .....................................................3
   3. Definitions and Abbreviations ...................................3
      3.1. Definitions ................................................3
      3.2. Abbreviations ..............................................4
   4. Transport of MPEG Surround ......................................4
      4.1. Embedded Spatial Audio Data in AAC Payloads ................4
      4.2. MPEG Surround Elementary Stream ............................5
           4.2.1. Low Bitrate MPEG Surround ...........................7
           4.2.2. High Bitrate MPEG Surround ..........................8
   5. IANA Considerations .............................................8
      5.1. Media Type Registration ....................................9
      5.2. Registration of Mode Definitions with IANA .................9
      5.3. Usage of SDP ..............................................10
   6. Security Considerations ........................................10
   7. References .....................................................11
      7.1. Normative References ......................................11
      7.2. Informative References ....................................11
        
1. Introduction
1. はじめに

MPEG Surround (Spatial Audio Coding, SAC) [23003-1] is an International Standard that was finalized by MPEG in January 2007. It is capable of re-creating N channels based on M < N transmitted channels and additional control data. In the preferred modes of operating the Spatial Audio Coding system, the M channels can either be a single mono channel or a stereo channel pair. The control data represents a significantly lower data rate than the data rate required for transmitting all N channels, making the coding very efficient while at the same time ensuring compatibility with M channel devices.

MPEGサラウンド(SPATIALオーディオコーディング、SAC)[23003-1]は、2007年1月にMPEGによって最終決定された国際標準です。M<N送信チャネルと追加の制御データに基づいてNチャネルを再作成できます。空間オーディオコーディングシステムの操作の好ましいモードでは、Mチャネルは単一のモノチャネルまたはステレオチャネルペアのいずれかになります。制御データは、すべてのNチャネルを送信するために必要なデータレートよりも大幅に低いデータレートを表し、コーディングは非常に効率的であると同時に、Mチャネルデバイスとの互換性を保証します。

The MPEG Surround standard incorporates a number of tools that enable features that allow for broad application of the standard. A key feature is the ability to scale the spatial image quality gradually from very low spatial overhead towards transparency. Another key feature is that the decoder input can be made compatible to existing matrixed surround technologies.

MPEGサラウンド標準には、標準の広範な適用を可能にする機能を可能にする多くのツールが組み込まれています。重要な機能は、非常に低い空間オーバーヘッドから透明性への空間画質を徐々にスケーリングする機能です。もう1つの重要な機能は、デコーダー入力を既存のマトリックスサラウンドテクノロジーと互換性のあるものにすることができることです。

As an example, for 5.1 multi-channel audio, the MPEG Surround encoder creates a stereo (or mono) downmix signal and spatial information describing the full 5.1 material in a highly efficient, parameterised format. The spatial information is transmitted alongside the downmix.

例として、5.1マルチチャネルオーディオの場合、MPEGサラウンドエンコーダーは、非常に効率的なパラメーター化された形式で5.1素材を記述するステレオ(またはモノ)ダウンミックス信号と空間情報を作成します。空間情報は、ダウンミックスに沿って送信されます。

By using MPEG Surround, existing services can easily be upgraded to provide surround sound in a backwards-compatible fashion. While a stereo decoder in an existing legacy consumer device ignores the MPEG Surround data and plays back the stereo signal without any quality degradation, an MPEG-Surround-enabled decoder will deliver high quality, multi-channel audio.

MPEGサラウンドを使用することにより、既存のサービスを簡単にアップグレードして、サラウンドサウンドを後方互換性のある方法で提供できます。既存のレガシーコンシューマデバイスのステレオデコーダーは、MPEGサラウンドデータを無視し、品質の劣化なしにステレオ信号を再生しますが、MPEG-Surround対応デコーダーは高品質のマルチチャネルオーディオを提供します。

The MPEG Surround decoder can operate in modes that render the multi-channel signal to multi-channel or stereo output, or it can operate in a two-channel headphone mode to produce a virtual surround output signal.

MPEGサラウンドデコーダーは、マルチチャネル信号をマルチチャネルまたはステレオ出力にレンダリングするモードで動作します。または、2チャンネルヘッドフォンモードで動作して仮想サラウンド出力信号を生成できます。

2. Conventions
2. 規約

The key words "MUST", "MUST NOT", "REQUIRED", "SHALL", "SHALL NOT", "SHOULD", "SHOULD NOT", "RECOMMENDED", "MAY", and "OPTIONAL" in this document are to be interpreted as described in [RFC2119].

「必須」、「そうしない」、「必須」、「必要」、「しない」、「そうしない」、「そうではない」、「そうでない」、「推奨」、「5月」、および「オプション」は、[RFC2119]に記載されているように解釈される。

3. Definitions and Abbreviations
3. 定義と略語
3.1. Definitions
3.1. 定義

This memo makes use of the definitions specified in [14496-1], [14496-3], [23003-1], and [RFC3640]. Frequently used terms are summed up for convenience:

このメモは、[14496-1]、[14496-3]、[23003-1]、および[RFC3640]で指定された定義を使用しています。頻繁に使用される用語は便利に合計されます:

Access Unit: An MPEG Access Unit is the smallest data entity to which timing information is attributed. In the case of audio, an Access Unit is the smallest individually accessible portion of coded audio data within an elementary stream.

アクセスユニット:MPEGアクセスユニットは、タイミング情報が起因する最小のデータエンティティです。オーディオの場合、アクセスユニットは、基本ストリーム内のコード化されたオーディオデータの個別にアクセス可能な部分が最小です。

AudioSpecificConfig(): Extends the class DecoderSpecificInfo(), as defined in [14496-1], when the objectType indication refers to a stream complying with [14496-3]. AudioSpecificConfig() is used as the configuration structure for MPEG-4 audio as specified in [14496-3]. It contains the field audioObjectType, which distinguishes between the different audio codecs defined in [14496-3], general audio information (e.g., the sampling frequency and number of channels), and further codec-dependent information structures.

audiospecificconfig():[14496-1]で定義されているように、クラスデコーダーSpecificInfo()を拡張します。AudioSpecificConfig()は、[14496-3]で指定されているように、MPEG-4オーディオの構成構造として使用されます。[14496-3]で定義されているさまざまなオーディオコーデック、一般的なオーディオ情報(サンプリング頻度とチャネルの数など)、およびさらにコーデック依存情報構造を区別するフィールドオーディオオブジェクトタイプが含まれています。

SpatialSpecificConfig(): Configuration structure for MPEG Surround audio coding, as specified in [23003-1]. An AudioSpecificConfig() with an audioObjectType of value 30 contains a SpatialSpecificConfig() structure.

[23003-1]で指定されているように、spatialspecificconfig():MPEGサラウンドオーディオコーディングの構成構造。値30のaudioObjectTypeを備えたaudiospecificconfig()には、spatialspecificconfig()構造が含まれています。

3.2. Abbreviations
3.2. 略語
     AOT:    Audio Object Type
     AAC:    Advanced Audio Coding
     ASC:    AudioSpecificConfig() structure
     AU:     Access Unit
     HE AAC: High Efficiency AAC
     PLI:    Profile and Level Indication
     SSC:    SpatialSpecificConfig() structure
        
4. Transport of MPEG Surround
4. MPEGサラウンドの輸送

From a top-level perspective, MPEG Surround data can be subdivided into configuration data contained in the SpatialSpecificConfig() (SSC) and the SpatialFrame(), which contains the MPEG Surround payload. The configuration data can be signaled in-band or out-of-band. In the case of in-band signaling the SSC is conveyed in a SacDataFrame() jointly with a SpatialFrame(). In the case of out-of-band signaling, the SSC is transmitted to the decoder separately, e.g., by Session Description Protocol (SDP) [RFC4566] means.

トップレベルの観点から、MPEGサラウンドデータは、MPEGサラウンドペイロードを含むSpatialspecificConfig()(SSC)およびSpatialFrame()に含まれる構成データに細分化できます。構成データは、帯域または帯域外でシグナルを受けることができます。インバンドシグナル伝達の場合、SSCはSACDATAFRAME()でspatialframe()と共同で伝達されます。バンド外シグナル伝達の場合、SSCは、たとえば、セッション説明プロトコル(SDP)[RFC4566]手段により、デコーダーに個別に送信されます。

SpatialFrame()s may be transmitted either embedded into the downmix stream (Section 4.1) or as individual elementary streams besides the downmix audio stream (Section 4.2).

SpatialFrame()sは、ダウンミックスストリーム(セクション4.1)に埋め込まれたもの、またはダウンミックスオーディオストリーム(セクション4.2)以外の個々の基本ストリームとして送信できます。

The buffer definition for AAC decoders limits the size of an AU, as specified in [14496-3]. For high-bitrate applications that exceed this limit, all MPEG Surround data MUST be put in a separate stream, as defined in Section 4.2.

AACデコーダーのバッファ定義は、[14496-3]で指定されているように、Auのサイズを制限します。この制限を超える高ビトレートアプリケーションの場合、セクション4.2で定義されているように、すべてのMPEGサラウンドデータを別のストリームに配置する必要があります。

4.1. Embedded Spatial Audio Data in AAC Payloads
4.1. AACペイロードに埋め込まれた空間オーディオデータ

[14496-3] defines the extension_payload() as a mechanism for transport of extension data inside AAC payloads. Typical extension data include Spectral Band Replication (SBR) data and MPEG Surround data, i.e., a SacDataFrame() in extension_payload()s of type EXT_SAC_DATA. extension_payload()s reside inside the downmix AAC elementary stream. The resulting single elementary stream is transported as specified in [RFC3640]. As AAC decoders are required to skip unknown extension data, MPEG Surround data can be embedded in backwards-compatible fashion and be transported with the mechanism already described in [RFC3640].

[14496-3]は、AACペイロード内の拡張データの輸送のメカニズムとしてextension_Payload()を定義します。典型的な拡張データには、Spectral Band Replication(SBR)データとMPEGサラウンドデータ、つまりext_sac_dataのタイプのextention_payload()のsacdataframe()が含まれます。extension_payload()sは、ダウンミックスAAC初等ストリーム内に存在します。結果として得られる単一の基本ストリームは、[RFC3640]で指定されているように輸送されます。未知の拡張データをスキップするにはAACデコーダーが必要であるため、MPEGサラウンドデータは後方互換性のある方法で埋め込み、[RFC3640]ですでに説明されているメカニズムで輸送できます。

The SacDataFrame() includes a SpatialFrame() and an optional header that contains an SSC. Any SSC in a SacDataFrame() MUST be identical to the SSC conveyed via SDP for that stream.

sacdataframe()には、spatialframe()とSSCを含むオプションのヘッダーが含まれます。SACDATAFRAME()のSSCは、そのストリームに対してSDPを介して伝達されるSSCと同一でなければなりません。

No new mode is introduced for SpatialFrame()s being embedded into AAC payloads. Either the mode AAC-lbr or the mode AAC-hbr SHOULD be used. The additional Media Type parameters, as defined in Section 5.1, SHOULD be present when SpatialFrame()s are embedded into AAC payloads.

AACペイロードに埋め込まれているSpatialFrame()の新しいモードは導入されていません。モードAAC-LBRまたはモードAAC-HBRのいずれかを使用する必要があります。セクション5.1で定義されている追加のメディアタイプパラメーターは、spatialframe()sがAACペイロードに埋め込まれている場合に存在する必要があります。

For example:

例えば:

   m=audio 5000 RTP/AVP 96
   a=rtpmap:96 mpeg4-generic/48000/2
   a=fmtp:96 streamType=5; profile-level-id=44; mode=AAC-hbr; config=131
     056E598; sizeLength=13; indexLength=3; indexDeltaLength=3; constant
     Duration=2048; MPS-profile-level-id=55; MPS-config=F1B4CF920442029B
     501185B6DA00;
        

In this example, the stream specifies the HE AAC Profile at Level 2 [Profile and Level Indication (PLI) 44] and the config string contains the hexadecimal representation of the HE AAC ASC [audioObjectType=2 (AAC LC); extensionAudioObjectType=5 (SBR); samplingFrequencyIndex=0x6 (24kHz); extensionSamplingFrequencyIndex=0x3 (48kHz); channelConfiguration=2 (2.0 channels)] of the downmix AAC elementary stream that is using explicit backwards-compatible signaling.

この例では、ストリームはレベル2 [プロファイルとレベル表示(PLI)44]のHe AACプロファイルを指定し、構成文字列にはHe AAC ASC [AudioObjectType = 2(AAC LC)の16進表現が含まれています。extensionAudioObjectType = 5(SBR);samplingfrequenceIndex = 0x6(24kHz);extensionsamplingfrequenceIndex = 0x3(48kHz);明示的な後方互換信号を使用しているダウンミックスAAC初等ストリームのChannelConfiguration = 2(2.0チャネル)]。

Furthermore, the stream specifies the MPEG Surround Baseline Profile at Level 3 (PLI55) and the MPS-config string contains the hexadecimal representation of the MPEG Surround ASC [audioObjectType=30 (MPEG Surround); samplingFrequencyIndex=0x3 (48kHz); channelConfiguration=6 (5.1 channels); sacPayloadEmbedding=1; SSC=(48 kHz; 32 slots; 525 tree; ResCoding=1; ResBands=[0,13,13,13])].

さらに、ストリームはレベル3(PLI55)のMPEGサラウンドベースラインプロファイルを指定し、MPS-Config文字列にはMPEGサラウンドASC [AudioObjectType = 30(MPEGサラウンド)の16進表現が含まれています。samplingfrequenceIndex = 0x3(48kHz);ChannelConfiguration = 6(5.1チャネル);sacpayloadembeding = 1;SSC =(48 kHz; 32スロット; 525ツリー;レスキング= 1; resbands = [0,13,13,13]]]。

Note that the a=fmtp line of the example above has been wrapped to fit the page; it would comprise a single line in the SDP file.

上記の例のa = fmtp行は、ページに合うようにラップされていることに注意してください。SDPファイルの単一行を構成します。

4.2. MPEG Surround Elementary Stream
4.2. MPEGサラウンドエレメンタリーストリーム

MPEG Surround SpatialFrame()s can be present in an individual elementary stream. This stream complements the stream containing the downmix audio data, which may be coded by an arbitrary coding scheme. MPEG Surround elementary streams are packetized as specified in [RFC3640]. The mode signaled and used for an MPEG Surround elementary stream MUST be either MPS-hbr or MPS-lbr. The MPS-hbr mode SHALL be used when the frame size may exceed 63 bytes, e.g., when high-bitrate residual coding is in use.

MPEGサラウンドSPATIALFRAME()Sは、個々の基本ストリームに存在する可能性があります。このストリームは、任意のコーディングスキームによってコーディングされる可能性のあるダウンミックスオーディオデータを含むストリームを補完します。MPEGサラウンドの基本ストリームは、[RFC3640]で指定されているようにパケット化されています。MPEGサラウンドエレメンタリーストリームに合図および使用されるモードは、MPS-HBRまたはMPS-LBRのいずれかでなければなりません。MPS-HBRモードは、フレームサイズが63バイトを超える可能性がある場合、たとえば、高bitrate残留コーディングが使用されている場合に使用されます。

The dependency relationships between the MPEG Surround elementary stream and the downmix stream are signaled as specified in [RFC5583].

[RFC5583]で指定されているように、MPEGサラウンドエレメンタリーストリームとダウンミックスストリーム間の依存関係は信号されています。

The media clocks of the MPEG Surround elementary stream and the downmix stream SHALL operate in the same clock domain, i.e., the clocks are derived from a common clock and MUST NOT drift. RTCP sender reports MUST indicate that the stream timestamps are not drifting, i.e., that a single sender report for each stream is sufficient to establish unambiguous timing. The sampling rate of the MPEG Surround signal and the decoded downmix signal MUST be identical.

MPEGサラウンドエレメンタリーストリームとダウンミックスストリームのメディアクロックは、同じクロックドメインで動作するものとします。つまり、クロックは一般的なクロックから派生し、ドリフトしてはなりません。RTCP送信者レポートは、ストリームタイムスタンプが漂流していないことを示す必要があります。つまり、各ストリームの単一の送信者レポートでは、明確なタイミングを確立するのに十分であることが必要です。MPEGサラウンド信号とデコードされたダウンミックス信号のサンプリングレートは同一でなければなりません。

If HE AAC is used as the coding scheme for the downmix, the RTP clock-rate of the downmix MAY be the sampling rate of the AAC core, i.e., the clock-rate of the MPEG Surround elementary stream is an integer multiple of the clock-rate of the downmix stream.

彼がAACがダウンミックスのコーディングスキームとして使用されている場合、ダウンミックスのRTPクロック率はAACコアのサンプリングレートである可能性があります。 - ダウンミックスストリームのレート。

Note that separate RTP streams have different random RTP timestamp offsets, and therefore RTCP MUST be used to synchronize the coded downmix audio data and the MPEG Surround elementary stream.

個別のRTPストリームには異なるランダムRTPタイムスタンプオフセットがあるため、RTCPを使用して、コード化されたダウンミックスオーディオデータとMPEGサラウンドエレメンタリーストリームを同期する必要があることに注意してください。

For example:

例えば:

a=group:DDP L1 L2

A =グループ:DDP L1 L2

   m=audio 5000 RTP/AVP 96
   a=rtpmap:96 mpeg4-generic/48000/2
   a=fmtp:96 streamType=5; profile-level-id=44; mode=AAC-hbr; config=2B1
     18800; sizeLength=13; indexLength=3; indexDeltaLength=3; constantDu
     ration=2048
   a=mid:L1
        
   m=audio 5002 RTP/AVP 97
   a=rtpmap:97 mpeg4-generic/48000/6
   a=fmtp:97 streamType=5; profile-level-id=55; mode=MPS-hbr; config=F1B
     0CF920460029B601189E79E70; sizeLength=13; indexLength=3;  indexDelt
     aLength=3; constantDuration=2048
   a=mid:L2
   a=depend:97 lay L1:96
        

In this example, the first stream specifies the HE AAC Profile at Level 2 (PLI44) and the config string contains the hexadecimal representation of the HE AAC ASC [audioObjectType=2 (AAC LC); extensionAudioObjectType=5 (SBR); samplingFrequencyIndex=0x6 (24kHz); extensionSamplingFrequencyIndex=0x3 (48kHz); channelConfiguration=2 (2.0 channels)].

この例では、最初のストリームはレベル2(PLI44)のHE AACプロファイルを指定し、構成文字列にはHe AAC ASC [AudioObjectType = 2(AAC LC)の16進表現が含まれています。extensionAudioObjectType = 5(SBR);samplingfrequenceIndex = 0x6(24kHz);extensionsamplingfrequenceIndex = 0x3(48kHz);ChannelConfiguration = 2(2.0チャネル)]。

The second stream specifies Baseline MPEG Surround Profile at Level 3 (PLI55) and the config string contains the hexadecimal representation of the ASC [AOT=30(MPEG Surround); 48 kHz; 5.1-ch; sacPayloadEmbedding=0; SSC=(48 kHz; 32 slots; 525 tree; ResCoding=1; ResBands=[7,7,7,7])].

2番目のストリームは、レベル3(PLI55)のベースラインMPEGサラウンドプロファイルを指定し、構成文字列にはASC [AOT = 30(MPEGサラウンド)の16進表現が含まれています。48 kHz;5.1-ch;sacpayloadembeding = 0;SSC =(48 kHz; 32スロット; 525ツリー;レスキング= 1; resbands = [7,7,7,7])]。

Note that the a=fmtp lines of the example above have been wrapped to fit the page; they would each comprise a single line in the SDP file.

上記の例のa = fmtp行は、ページに適合するようにラップされていることに注意してください。それらはそれぞれ、SDPファイルの単一行を構成します。

4.2.1. Low Bitrate MPEG Surround
4.2.1. 低ビットレートMPEGサラウンド

This mode is signaled by mode=MPS-lbr. This mode supports the transport of one or more complete Access Units, each consisting of a single MPEG Surround SpatialFrame(). The AUs can be variably sized and interleaved. The maximum size of a SpatialFrame() is 63 bytes. Fragmentation MUST NOT be used in this mode. Receivers MUST support de-interleaving.

このモードは、mode = mps-lbrによって信号されます。このモードは、それぞれが単一のMPEGサラウンドSpatialFrame()で構成される1つ以上の完全なアクセスユニットの輸送をサポートします。AUSはさまざまなサイズでインターリーブできます。SpatialFrame()の最大サイズは63バイトです。このモードでは、断片化を使用しないでください。受信者は、非介入をサポートする必要があります。

The payload configuration is the same as in the AAC-lbr mode. It consists of the AU Header Section, followed by concatenated AUs. Note that Access Units are byte-aligned. The Auxiliary Section MUST be empty in the MPS-lbr mode. The 1-octet AU-header MUST provide:

ペイロード構成は、AAC-LBRモードと同じです。AUヘッダーセクションで構成され、その後に連結されたAUが続きます。アクセスユニットはバイトアライメントされていることに注意してください。補助セクションは、MPS-LBRモードで空でなければなりません。1-OCTET AU-Headerは次のことを提供する必要があります。

1. the size of each AAC frame, encoded as 6 bits.

1. 6ビットとしてエンコードされた各AACフレームのサイズ。

2. 2 bits of index information for computing the sequence (and hence timing) of each SpatialFrame().

2. 各SpatialFrame()のシーケンス(およびタイミング)を計算するための2ビットのインデックス情報。

The concatenated AU Header Section MUST be preceded by the 16-bit AU-headers-length field.

連結されたAUヘッダーセクションの前には、16ビットAu-Headers-Lengthフィールドが必要です。

In addition to the required Media format parameters, the following parameters MUST be present with fixed values: sizeLength (fixed value 6), indexLength (fixed value 2), and indexDeltaLength (fixed value 2). The parameter maxDisplacement MUST be present when interleaving. SpatialFrame()s always have a fixed duration per AU; the fixed duration MUST be signaled by the Media format parameter constantDuration.

必要なメディア形式のパラメーターに加えて、次のパラメーターは固定値(固定値6)、indexLength(固定値2)、およびインデックスデルタール(固定値2)で存在する必要があります。インターリーブするときは、パラメーターの最大値が存在する必要があります。SpatialFrame()sは常にAUあたりの固定期間があります。固定された期間は、メディア形式のパラメーターConstrumentdurationによって信号を送信する必要があります。

The value of the "config" parameter is the hexadecimal representation of the ASC, as defined in [14496-3], with an AOT of 30 and the sacPayloadEmbedding flag set to 0.

「config」パラメーターの値は、[14496-3]で定義されているASCの16進表現であり、30のAOTとSACPAYLOADEMBEDIDINGフラグが0に設定されています。

The "profile-level-id" parameter SHALL contain a valid PLI for MPEG Surround, as specified in [14496-3].

[14496-3]で指定されているように、「プロファイルレベルID」パラメーターには、MPEGサラウンド用の有効なPLIが含まれます。

4.2.2. High Bitrate MPEG Surround
4.2.2. ハイビットレートMPEGサラウンド

This mode is signaled by mode=MPS-hbr. This mode supports the transportation of either one fragment of an Access Unit or one complete AU or several complete AUs. Each AU consists of a single MPEG Surround SpatialFrame(). The AUs can be variably sized and interleaved. The maximum size of a SpatialFrame() is 8191 bytes. Receivers MUST support de-interleaving.

このモードは、mode = mps-hbrによって信号されます。このモードは、アクセスユニットの1つのフラグメントまたは1つの完全なAUまたは複数の完全なAUのいずれかの輸送をサポートします。各Auは、単一のMPEGサラウンドSpatialFrame()で構成されています。AUSはさまざまなサイズでインターリーブできます。SpatialFrame()の最大サイズは8191バイトです。受信者は、非介入をサポートする必要があります。

The payload configuration is the same as in the AAC-hbr mode. It consists of the AU Header Section, followed by either one SpatialFrame(), a fragment of a SpatialFrame(), or several concatenated SpatialFrame()s. Note that Access Units are byte-aligned. The Auxiliary Section MUST be empty in the MPS-hbr mode. The 2-octet AU-header MUST provide:

ペイロード構成は、AAC-HBRモードと同じです。AUヘッダーセクションで構成され、その後、1つのSpatialFrame()、SpatialFrame()のフラグメント、またはいくつかの連結SpatialFrame()が続きます。アクセスユニットはバイトアライメントされていることに注意してください。補助セクションは、MPS-HBRモードで空でなければなりません。2-OCTET AU-Headerが提供する必要があります。

1. the size of each AAC frame, encoded as 13 bits.

1. 13ビットとしてエンコードされた各AACフレームのサイズ。

2. 3 bits of index information for computing the sequence (and hence timing) of each SpatialFrame(), i.e., the AU-Index or AU-Index-delta field.

2. 各SpatialFrame()のシーケンス(およびタイミング)を計算するための3ビット、つまりAu-IndexまたはAu-Index-Deltaフィールド。

Each AU-Index field MUST be coded with the value 0. The concatenated AU Header Section MUST be preceded by the 16-bit AU-headers-length field.

各Au-Indexフィールドは、値0でコーディングする必要があります。連結されたAUヘッダーセクションの前には、16ビットAu-Headers-Lengthフィールドが必要です。

In addition to the required Media format parameters, the following parameters MUST be present with fixed values: sizeLength (fixed value 13), indexLength (fixed value 3), and indexDeltaLength (fixed value 3). The parameter maxDisplacement MUST be present when interleaving. SpatialFrame()s always have a fixed duration per AU; the fixed duration MUST be signaled by the Media format parameter constantDuration.

必要なメディア形式のパラメーターに加えて、次のパラメーターは固定値(固定値13)、indexLength(固定値3)、およびインデックスデルタール(固定値3)で存在する必要があります。インターリーブするときは、パラメーターの最大値が存在する必要があります。SpatialFrame()sは常にAUあたりの固定期間があります。固定された期間は、メディア形式のパラメーターConstrumentdurationによって信号を送信する必要があります。

The value of the "config" parameter is the hexadecimal representation of the ASC, as defined in [14496-3], with an AOT of 30 and the sacPayloadEmbedding flag set to 0.

「config」パラメーターの値は、[14496-3]で定義されているASCの16進表現であり、30のAOTとSACPAYLOADEMBEDIDINGフラグが0に設定されています。

The "profile-level-id" parameter SHALL contain a valid PLI for MPEG Surround, as specified in [14496-3].

[14496-3]で指定されているように、「プロファイルレベルID」パラメーターには、MPEGサラウンド用の有効なPLIが含まれます。

5. IANA Considerations
5. IANAの考慮事項

This memo defines additional optional format parameters to the Media type "audio" and its subtype "mpeg4-generic". These parameters SHALL only be used in combination with the AAC-lbr or AAC-hbr modes (cf. Section 3.3 of [RFC3640]) of "mpeg4-generic".

このメモは、メディアタイプの「オーディオ」とそのサブタイプ「MPEG4-Generic」に追加のオプション形式パラメーターを定義します。これらのパラメーターは、「MPEG4-GENERIC」のAAC-LBRまたはAAC-HBRモード([RFC3640]のセクション3.3を参照)と組み合わせてのみ使用するものとします。

5.1. Media Type Registration
5.1. メディアタイプの登録

This memo defines the following additional optional parameters, which SHALL be used if MPEG Surround data is present inside the payload of an AAC elementary stream.

このメモは、MPEGサラウンドデータがAAC初等ストリームのペイロード内に存在する場合に使用する次の追加のオプションパラメーターを定義します。

MPS-profile-level-id: A decimal representation of the MPEG Surround Profile and Level indication as defined in [14496-3]. This parameter MUST be used in the capability exchange or session set-up procedure to indicate the MPEG Surround Profile and Level that the decoder must be capable of in order to decode the stream.

MPS-Profile-Level-ID:[14496-3]で定義されているMPEGサラウンドプロファイルとレベル表示の小数表現。このパラメーターは、流れの交換またはセッションのセットアップ手順で使用して、ストリームをデコードするためにデコーダーができる必要があるMPEGサラウンドプロファイルとレベルを示す必要があります。

MPS-config: A hexadecimal representation of an octet string that expresses the AudioSpecificConfig (ASC), as defined in [14496-3], for MPEG Surround. The ASC is mapped onto the hexadecimal octet string in a most significant bit (MSB)-first basis. The AOT in this ASC SHALL have the value 30. The SSC inside the ASC MUST have the sacPayloadEmbedding flag set to 1.

MPS-Config:MPEGサラウンドの[14496-3]で定義されているように、audipecificconfig(ASC)を表現するオクテット文字列の16進表現。ASCは、最も重要なビット(MSB)最初のベースで16進オクテットストリングにマッピングされます。このASCのAOTには値30があります。ASC内のSSCには、SACPAYLOADEMBEDIDINGフラグが1に設定されている必要があります。

5.2. Registration of Mode Definitions with IANA
5.2. IANAによるモード定義の登録

This section of this memo requests the registration of the "MPS-hbr" value and the "MPS-lbr" value for the "mode" parameter of the "mpeg4- generic" media subtype within the media type "audio". The "mpeg4- generic" media subtype is defined in [RFC3640], and [RFC3640] defines a repository for the "mode" parameter. This memo registers the modes "MPS-hbr" and "MPS-lbr" to support MPEG Surround elementary streams.

このメモのこのセクションでは、メディアタイプ「オーディオ」内の「MPEG4-ジェネリック」メディアサブタイプの「モード」パラメーターの「MPS-HBR」値と「MPS-LBR」値の登録を要求します。「MPEG4-ジェネリック」メディアサブタイプは[RFC3640]で定義されており、[RFC3640]は「モード」パラメーターのリポジトリを定義します。このメモは、モード「MPS-HBR」と「MPS-LBR」を登録して、MPEGサラウンドエレメンタリーストリームをサポートします。

Media type name:

メディアタイプ名:

audio

オーディオ

Subtype name:

サブタイプ名:

mpeg4-generic

MPEG4-Generic

Required parameters:

必要なパラメーター:

The "mode" parameter is required by [RFC3640]. This memo specifies the additional modes "MPS-hbr" and "MPS-lbr", in accordance with [RFC3640].

[モード]パラメーターは[RFC3640]で必要です。このメモは、[RFC3640]に従って、追加のモード「MPS-HBR」と「MPS-LBR」を指定します。

Optional parameters:

オプションのパラメーター:

For the modes "AAC-hbr" and "AAC-lbr", this memo specifies the additional optional parameters "MPS-profile-level-id" and "MPS-config". See Section 4.1 for usage details.

モード「AAC-HBR」と「AAC-LBR」の場合、このメモは、追加のオプションパラメーター「MPS-Profile-Level-ID」と「MPS-Config」を指定します。使用法の詳細については、セクション4.1を参照してください。

Optional parameters for the modes "MPS-hbr" and "MPS-lbr" may be used as specified in [RFC3640]. The optional parameters "MPS-profile-level-id" and "MPS-config" SHALL NOT be used for the modes "MPS-hbr" and "MPS-lbr".

モード「MPS-HBR」および「MPS-LBR」のオプションパラメーターは、[RFC3640]で指定されているように使用できます。オプションのパラメーター「MPS-Profile-Level-ID」および「MPS-Config」は、モード「MPS-HBR」および「MPS-LBR」に使用してはなりません。

5.3. Usage of SDP
5.3. SDPの使用

It is assumed that the Media format parameters are conveyed via an SDP message, as specified in Section 4.4 of [RFC3640].

[RFC3640]のセクション4.4で指定されているように、メディア形式のパラメーターはSDPメッセージを介して伝達されると想定されています。

6. Security Considerations
6. セキュリティに関する考慮事項

RTP packets using the payload format defined in this specification are subject to the security considerations discussed in the RTP specification [RFC3550], in the RTP payload format specification for MPEG-4 elementary streams [RFC3640] (which is extended with this memo), and in any applicable RTP profile. The main security considerations for the RTP packet carrying the RTP payload format defined within this memo are confidentiality, integrity, and source authenticity. Confidentiality is achieved by encryption of the RTP payload. Integrity of the RTP packets is achieved through a suitable cryptographic integrity-protection mechanism. Such a cryptographic system may also allow the authentication of the source of the payload. A suitable security mechanism for this RTP payload format should provide confidentiality, integrity protection, and source authentication capable of at least determining if an RTP packet is from a member of the RTP session.

この仕様で定義されたペイロード形式を使用したRTPパケットは、RTP仕様[RFC3550]で説明されているセキュリティ考慮事項、MPEG-4初等ストリーム[RFC3640]のRTPペイロード形式仕様の対象となります(このメモで拡張されます)、および該当するRTPプロファイルで。このメモ内で定義されているRTPペイロード形式を運ぶRTPパケットの主なセキュリティ上の考慮事項は、機密性、整合性、およびソースの信頼性です。機密性は、RTPペイロードの暗号化によって達成されます。RTPパケットの整合性は、適切な暗号整合性保護メカニズムを通じて達成されます。このような暗号システムは、ペイロードのソースの認証を可能にする場合もあります。このRTPペイロード形式の適切なセキュリティメカニズムは、少なくともRTPパケットがRTPセッションのメンバーからであるかどうかを少なくとも決定できる機密性、整合性保護、およびソース認証を提供する必要があります。

The AAC audio codec includes an extension mechanism to transmit extra data within a stream that is gracefully skipped by decoders that do not support this extra data. This covert channel may be used to transmit unauthorized data in an otherwise valid stream.

AACオーディオコーデックには、この追加データをサポートしていないデコーダーによって優雅にスキップされるストリーム内で追加のデータを送信するための拡張メカニズムが含まれています。この秘密のチャネルは、不正なデータを他の方法では有効なストリームで送信するために使用できます。

Note that the appropriate mechanism to provide security to RTP and payloads following this memo may vary. It is dependent on the application, the transport, and the signaling protocol employed. Therefore, a single mechanism is not sufficient; although, if suitable, usage of the Secure Real-time Transport Protocol (SRTP) [RFC3711] is recommended. Other mechanisms that may be used are IPsec [RFC4301] and Transport Layer Security (TLS) [RFC5246] (RTP over TCP); other alternatives may exist.

このメモに従ってRTPとペイロードにセキュリティを提供する適切なメカニズムは異なる場合があることに注意してください。アプリケーション、輸送、および採用されたシグナルプロトコルに依存します。したがって、単一のメカニズムでは十分ではありません。ただし、適切な場合は、安全なリアルタイムトランスポートプロトコル(SRTP)[RFC3711]の使用が推奨されます。使用できる他のメカニズムは、IPSEC [RFC4301]および輸送層セキュリティ(TLS)[RFC5246](TCPを介したRTP)です。他の選択肢が存在する場合があります。

7. References
7. 参考文献
7.1. Normative References
7.1. 引用文献

[14496-1] MPEG, "ISO/IEC International Standard 14496-1 - Coding of audio-visual objects, Part 1 Systems", 2004.

[14496-1] MPEG、「ISO/IEC International Standard 14496-1-オーディオビジュアルオブジェクトのコーディング、パート1システム」、2004年。

[14496-3] MPEG, "ISO/IEC International Standard 14496-3 - Coding of audio-visual objects, Part 3 Audio", 2009.

[14496-3] MPEG、「ISO/IEC International Standard 14496-3-オーディオビジュアルオブジェクトのコーディング、パート3オーディオ」、2009年。

[23003-1] MPEG, "ISO/IEC International Standard 23003-1 - MPEG Surround (MPEG D)", 2007.

[23003-1] MPEG、「ISO/IEC International Standard 23003-1-MPEGサラウンド(MPEG D)」、2007年。

[RFC2119] Bradner, S., "Key words for use in RFCs to Indicate Requirement Levels", BCP 14, RFC 2119, March 1997.

[RFC2119] Bradner、S。、「要件レベルを示すためにRFCで使用するためのキーワード」、BCP 14、RFC 2119、1997年3月。

[RFC3550] Schulzrinne, H., Casner, S., Frederick, R., and V. Jacobson, "RTP: A Transport Protocol for Real-Time Applications", STD 64, RFC 3550, July 2003.

[RFC3550] Schulzrinne、H.、Casner、S.、Frederick、R。、およびV. Jacobson、「RTP:リアルタイムアプリケーション用の輸送プロトコル」、STD 64、RFC 3550、2003年7月。

[RFC3640] van der Meer, J., Mackie, D., Swaminathan, V., Singer, D., and P. Gentric, "RTP Payload Format for Transport of MPEG-4 Elementary Streams", RFC 3640, November 2003.

[RFC3640] van der Meer、J.、Mackie、D.、Swaminathan、V.、Singer、D。、およびP. Gentric、「MPEG-4小川の輸送用のRTPペイロード形式」、RFC 3640、2003年11月。

[RFC4566] Handley, M., Jacobson, V., and C. Perkins, "SDP: Session Description Protocol", RFC 4566, July 2006.

[RFC4566] Handley、M.、Jacobson、V。、およびC. Perkins、「SDP:セッション説明プロトコル」、RFC 4566、2006年7月。

[RFC5583] Schierl, T. and S. Wenger, "Signaling Media Decoding Dependency in the Session Description Protocol (SDP)", RFC 5583, July 2009.

[RFC5583] Schierl、T。およびS. Wenger、「セッション説明プロトコル(SDP)のシグナリングメディアデコード依存関係」、RFC 5583、2009年7月。

7.2. Informative References
7.2. 参考引用

[RFC3711] Baugher, M., McGrew, D., Naslund, M., Carrara, E., and K. Norrman, "The Secure Real-time Transport Protocol (SRTP)", RFC 3711, March 2004.

[RFC3711] Baugher、M.、McGrew、D.、Naslund、M.、Carrara、E。、およびK. Norrman、「The Secure Real-Time Transport Protocol(SRTP)」、RFC 3711、2004年3月。

[RFC4301] Kent, S. and K. Seo, "Security Architecture for the Internet Protocol", RFC 4301, December 2005.

[RFC4301] Kent、S。およびK. SEO、「インターネットプロトコルのセキュリティアーキテクチャ」、RFC 4301、2005年12月。

[RFC5246] Dierks, T. and E. Rescorla, "The Transport Layer Security (TLS) Protocol Version 1.2", RFC 5246, August 2008.

[RFC5246] Dierks、T。およびE. Rescorla、「The Transport Layer Security(TLS)プロトコルバージョン1.2」、RFC 5246、2008年8月。

Authors' Addresses

著者のアドレス

Frans de Bont Philips Electronics High Tech Campus 5 5656 AE Eindhoven, NL

Frans de Bont Philips Electronicsハイテクキャンパス5 5656 AE Eindhoven、NL

   Phone: ++31 40 2740234
   EMail: frans.de.bont@philips.com
        

Stefan Doehla Fraunhofer IIS Am Wolfmantel 33 91058 Erlangen, DE

Stefan Doehla Fraunhofer IIS Am Wolfmantel 33 91058 Erlangen、de

   Phone: +49 9131 776 6042
   EMail: stefan.doehla@iis.fraunhofer.de
        

Malte Schmidt Dolby Laboratories Deutschherrnstr. 15-19 90537 Nuernberg, DE

Malte Schmidt Dolby Laboratories Deutschherrnstr。15-19 90537 Nuernberg、de

   Phone: +49 911 928 91 42
   EMail: malte.schmidt@dolby.com
        

Ralph Sperschneider Fraunhofer IIS Am Wolfmantel 33 91058 Erlangen, DE

Ralph Sperschneider fraunhofer iis am wolfmantel 33 91058 Erlangen、de

   Phone: +49 9131 776 6167
   EMail: ralph.sperschneider@iis.fraunhofer.de