[要約] 要約:RFC 2429は、ITU-T Rec. H.263ビデオ(H.263+)のRTPペイロード形式に関する仕様です。 目的:このRFCの目的は、H.263+ビデオのRTPペイロード形式を定義し、ビデオストリームの効率的な転送と再生を可能にすることです。

Network Working Group
Request for Comments: 2429                                    C. Bormann
Category: Standards Track                                   Univ. Bremen
                                                                L. Cline
                                                              G. Deisher
                                                               T. Gardos
                                                             C. Maciocco
                                                               D. Newell
                                                                   Intel
                                                                  J. Ott
                                                            Univ. Bremen
                                                             G. Sullivan
                                                              PictureTel
                                                               S. Wenger
                                                               TU Berlin
                                                                  C. Zhu
                                                                   Intel
                                                            October 1998
        

RTP Payload Format for the 1998 Version of ITU-T Rec. H.263 Video (H.263+)

ITU-T Rec。1998バージョンのRTPペイロード形式。 H.263ビデオ(H.263 +)

Status of this Memo

本文書の状態

This document specifies an Internet standards track protocol for the Internet community, and requests discussion and suggestions for improvements. Please refer to the current edition of the "Internet Official Protocol Standards" (STD 1) for the standardization state and status of this protocol. Distribution of this memo is unlimited.

このドキュメントは、インターネットコミュニティのインターネット標準トラックプロトコルを指定し、改善のための議論と提案を要求します。このプロトコルの標準化状態とステータスについては、「インターネット公式プロトコル標準」(STD 1)の最新版を参照してください。このメモの配布は無制限です。

Copyright Notice

著作権表示

Copyright (C) The Internet Society (1998). All Rights Reserved.

Copyright(C)The Internet Society(1998)。全著作権所有。

1. Introduction
1. はじめに

This document specifies an RTP payload header format applicable to the transmission of video streams generated based on the 1998 version of ITU-T Recommendation H.263 [4]. Because the 1998 version of H.263 is a superset of the 1996 syntax, this format can also be used with the 1996 version of H.263 [3], and is recommended for this use by new implementations. This format does not replace RFC 2190, which continues to be used by existing implementations, and may be required for backward compatibility in new implementations. Implementations using the new features of the 1998 version of H.263 shall use the format described in this document.

このドキュメントは、1998年版のITU-T勧告H.263 [4]に基づいて生成されたビデオストリームの送信に適用可能なRTPペイロードヘッダー形式を規定しています。 H.263の1998バージョンは1996構文のスーパーセットであるため、このフォーマットは1996バージョンのH.263 [3]でも使用でき、新しい実装での使用に推奨されています。この形式は、既存の実装で引き続き使用されているRFC 2190に代わるものではなく、新しい実装での下位互換性のために必要になる場合があります。 H.263の1998バージョンの新機能を使用する実装では、このドキュメントで説明されている形式を使用するものとします。

The 1998 version of ITU-T Recommendation H.263 added numerous coding options to improve codec performance over the 1996 version. The 1998 version is referred to as H.263+ in this document. Among the new options, the ones with the biggest impact on the RTP payload specification and the error resilience of the video content are the slice structured mode, the independent segment decoding mode, the reference picture selection mode, and the scalability mode. This section summarizes the impact of these new coding options on packetization. Refer to [4] for more information on coding options.

ITU-T勧告H.263の1998バージョンでは、1996バージョンよりもコーデックのパフォーマンスを向上させるために、多数のコーディングオプションが追加されました。このドキュメントでは、1998年のバージョンをH.263 +と呼んでいます。新しいオプションの中で、RTPペイロード仕様とビデオコンテンツのエラー耐性に最も大きな影響を与えるのは、スライス構造化モード、独立セグメントデコードモード、参照ピクチャ選択モード、およびスケーラビリティモードです。このセクションでは、これらの新しいコーディングオプションがパケット化に与える影響をまとめています。コーディングオプションの詳細については、[4]を参照してください。

The slice structured mode was added to H.263+ for three purposes: to provide enhanced error resilience capability, to make the bitstream more amenable to use with an underlying packet transport such as RTP, and to minimize video delay. The slice structured mode supports fragmentation at macroblock boundaries.

スライス構造化モードは、3つの目的でH.263 +に追加されました。拡張されたエラー耐性機能を提供すること、ビットストリームをRTPなどの基礎となるパケット転送で使用しやすくし、ビデオ遅延を最小限にすることです。スライス構造化モードは、マクロブロック境界での断片化をサポートします。

With the independent segment decoding (ISD) option, a video picture frame is broken into segments and encoded in such a way that each segment is independently decodable. Utilizing ISD in a lossy network environment helps to prevent the propagation of errors from one segment of the picture to others.

独立セグメントデコード(ISD)オプションを使用すると、ビデオ画像フレームがセグメントに分割され、各セグメントが独立してデコードできるようにエンコードされます。損失の多いネットワーク環境でISDを使用すると、画像の1つのセグメントから他のセグメントへのエラーの伝播を防ぐのに役立ちます。

The reference picture selection mode allows the use of an older reference picture rather than the one immediately preceding the current picture. Usually, the last transmitted frame is implicitly used as the reference picture for inter-frame prediction. If the reference picture selection mode is used, the data stream carries information on what reference frame should be used, indicated by the temporal reference as an ID for that reference frame. The reference picture selection mode can be used with or without a back channel, which provides information to the encoder about the internal status of the decoder. However, no special provision is made herein for carrying back channel information.

参照画像選択モードでは、現在の画像の直前の参照画像ではなく、古い参照画像を使用できます。通常、最後に送信されたフレームは、フレーム間予測の参照画像として暗黙的に使用されます。参照画像選択モードが使用される場合、データストリームは、どの参照フレームを使用すべきかについての情報を運び、その参照フレームのIDとして時間参照によって示されます。参照画像選択モードは、バックチャネルの有無に関係なく使用でき、デコーダーの内部ステータスに関する情報をエンコーダーに提供します。しかしながら、チャネル情報を戻すための特別な規定はここでは行われない。

H.263+ also includes bitstream scalability as an optional coding mode. Three kinds of scalability are defined: temporal, signal-to-noise ratio (SNR), and spatial scalability. Temporal scalability is achieved via the disposable nature of bi-directionally predicted frames, or B-frames. (A low-delay form of temporal scalability known as P-picture temporal scalability can also be achieved by using the reference picture selection mode described in the previous paragraph.) SNR scalability permits refinement of encoded video frames, thereby improving the quality (or SNR). Spatial scalability is similar to SNR scalability except the refinement layer is twice the size of the base layer in the horizontal dimension, vertical dimension, or both.

H.263 +には、オプションのコーディングモードとしてビットストリームのスケーラビリティも含まれています。 3種類のスケーラビリティが定義されています。時間的、信号対雑音比(SNR)、および空間的スケーラビリティです。時間的スケーラビリティは、双方向予測フレーム、つまりBフレームの使い捨ての性質によって実現されます。 (Pピクチャの時間スケーラビリティとして知られている低遅延の時間スケーラビリティは、前の段落で説明した参照画像選択モードを使用して実現することもできます。)SNRスケーラビリティにより、符号化されたビデオフレームを微調整できるため、品質(またはSNR)が向上します。 )。空間スケーラビリティは、リファインメントレイヤーが水平方向、垂直方向、またはその両方のベースレイヤーのサイズの2倍であることを除いて、SNRスケーラビリティに似ています。

2. Usage of RTP
2. RTPの使用法

When transmitting H.263+ video streams over the Internet, the output of the encoder can be packetized directly. All the bits resulting from the bitstream including the fixed length codes and variable length codes will be included in the packet, with the only exception being that when the payload of a packet begins with a Picture, GOB, Slice, EOS, or EOSBS start code, the first two (all-zero) bytes of the start code are removed and replaced by setting an indicator bit in the payload header.

H.263 +ビデオストリームをインターネット経由で送信する場合、エンコーダの出力を直接パケット化できます。固定長コードと可変長コードを含むビットストリームから生成されるすべてのビットがパケットに含まれますが、唯一の例外は、パケットのペイロードがピクチャ、GOB、スライス、EOS、またはEOSBS開始コードで始まる場合です。 、開始コードの最初の2バイト(すべてゼロ)は削除され、ペイロードヘッダーにインジケータービットを設定することによって置き換えられます。

For H.263+ bitstreams coded with temporal, spatial, or SNR scalability, each layer may be transported to a different network address. More specifically, each layer may use a unique IP address and port number combination. The temporal relations between layers shall be expressed using the RTP timestamp so that they can be synchronized at the receiving ends in multicast or unicast applications.

時間的、空間的、またはSNRのスケーラビリティでコード化されたH.263 +ビットストリームの場合、各レイヤーは異なるネットワークアドレスに転送されます。より具体的には、各層は一意のIPアドレスとポート番号の組み合わせを使用できます。レイヤー間の時間的関係は、RTPタイムスタンプを使用して表現されるため、マルチキャストまたはユニキャストアプリケーションの受信側で同期できます。

The H.263+ video stream will be carried as payload data within RTP packets. A new H.263+ payload header is defined in section 4. This section defines the usage of the RTP fixed header and H.263+ video packet structure.

H.263 +ビデオストリームは、RTPパケット内のペイロードデータとして伝送されます。新しいH.263 +ペイロードヘッダーは、セクション4で定義されています。このセクションでは、RTP固定ヘッダーとH.263 +ビデオパケット構造の使用法を定義します。

2.1 RTP Header Usage
2.1 RTPヘッダーの使用

Each RTP packet starts with a fixed RTP header. The following fields of the RTP fixed header are used for H.263+ video streams:

各RTPパケットは、固定RTPヘッダーで始まります。 RTP固定ヘッダーの次のフィールドは、H.263 +ビデオストリームに使用されます。

Marker bit (M bit): The Marker bit of the RTP header is set to 1 when the current packet carries the end of current frame, and is 0 otherwise.

マーカービット(Mビット):RTPヘッダーのマーカービットは、現在のパケットが現在のフレームの終わりを運ぶときに1に設定され、それ以外の場合は0に設定されます。

Payload Type (PT): The Payload Type shall specify the H.263+ video payload format.

ペイロードタイプ(PT):ペイロードタイプは、H.263 +ビデオペイロード形式を指定します。

Timestamp: The RTP Timestamp encodes the sampling instance of the first video frame data contained in the RTP data packet. The RTP timestamp shall be the same on successive packets if a video frame occupies more than one packet. In a multilayer scenario, all pictures corresponding to the same temporal reference should use the same timestamp. If temporal scalability is used (if B-frames are present), the timestamp may not be monotonically increasing in the RTP stream. If B-frames are transmitted on a separate layer and address, they must be synchronized properly with the reference frames. Refer to the 1998 ITU-T Recommendation H.263 [4] for information on required transmission order to a decoder. For an H.263+ video stream, the RTP timestamp is based on a 90 kHz clock, the same as that of the RTP payload for H.261 stream [5]. Since both the H.263+ data and the RTP header contain time information, it is required that those timing information run synchronously. That is, both the RTP timestamp and the temporal reference (TR in the picture header of H.263) should carry the same relative timing information. Any H.263+ picture clock frequency can be expressed as 1800000/(cd*cf) source pictures per second, in which cd is an integer from 1 to 127 and cf is either 1000 or 1001. Using the 90 kHz clock of the RTP timestamp, the time increment between each coded H.263+ picture should therefore be a integer multiple of (cd*cf)/20. This will always be an integer for any "reasonable" picture clock frequency (for example, it is 3003 for 29.97 Hz NTSC, 3600 for 25 Hz PAL, 3750 for 24 Hz film, and 1500, 1250 and 1200 for the computer display update rates of 60, 72 and 75 Hz, respectively). For RTP packetization of hypothetical H.263+ bitstreams using "unreasonable" custom picture clock frequencies, mathematical rounding could become necessary for generating the RTP timestamps.

タイムスタンプ:RTPタイムスタンプは、RTPデータパケットに含まれる最初のビデオフレームデータのサンプリングインスタンスをエンコードします。ビデオフレームが複数のパケットを占める場合、RTPタイムスタンプは連続するパケットで同じでなければなりません。多層シナリオでは、同じ時間参照に対応するすべての画像で同じタイムスタンプを使用する必要があります。時間的スケーラビリティが使用されている場合(Bフレームが存在する場合)、RTPストリームでタイムスタンプが単調に増加しない場合があります。 Bフレームが別のレイヤーとアドレスで送信される場合、それらは参照フレームと正しく同期する必要があります。デコーダーに必要な送信順序については、1998 ITU-T勧告H.263 [4]を参照してください。 H.263 +ビデオストリームの場合、RTPタイムスタンプは90 kHzクロックに基づいており、H.261ストリームのRTPペイロードと同じです[5]。 H.263 +データとRTPヘッダーの両方に時間情報が含まれているため、これらのタイミング情報が同期して実行される必要があります。つまり、RTPタイムスタンプと時間参照(H.263の画像ヘッダーのTR)の両方が同じ相対タイミング情報を伝える必要があります。 H.263 +の画像クロック周波数は、1秒あたり1800000 /(cd * cf)ソース画像として表現できます。cdは1〜127の整数で、cfは1000または1001です。RTPの90 kHzクロックの使用したがって、コード化された各H.263 +画像間の時間増分は、(cd * cf)/ 20の整数倍でなければなりません。これは、「妥当な」画像クロック周波数の場合は常に整数です(たとえば、29.97 Hz NTSCの場合は3003、25 Hz PALの場合は3600、24 Hzフィルムの場合は3750、コンピュータディスプレイの更新レートの場合は1500、1250、1200です。それぞれ60、72、75 Hzです)。 「不合理な」カスタム画像クロック周波数を使用した架空のH.263 +ビットストリームのRTPパケット化では、RTPタイムスタンプを生成するために数学的な丸めが必要になる可能性があります。

2.2 Video Packet Structure
2.2 ビデオパケット構造

A section of an H.263+ compressed bitstream is carried as a payload within each RTP packet. For each RTP packet, the RTP header is followed by an H.263+ payload header, which is followed by a number of bytes of a standard H.263+ compressed bitstream. The size of the H.263+ payload header is variable depending on the payload involved as detailed in the section 4. The layout of the RTP H.263+ video packet is shown as:

H.263 +圧縮ビットストリームのセクションは、各RTPパケット内のペイロードとして伝送されます。各RTPパケットでは、RTPヘッダーの後にH.263 +ペイロードヘッダーが続き、その後に標準のH.263 +圧縮ビットストリームのバイト数が続きます。 H.263 +ペイロードヘッダーのサイズは、セクション4で説明するように、関与するペイロードに応じて可変です。RTPH.263 +ビデオパケットのレイアウトは次のように表示されます。

      0                   1                   2                   3
      0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     |    RTP Header                                               ...
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     |    H.263+ Payload Header                                    ...
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     |    H.263+ Compressed Data Stream                            ...
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        

Any H.263+ start codes can be byte aligned by an encoder by using the stuffing mechanisms of H.263+. As specified in H.263+, picture, slice, and EOSBS starts codes shall always be byte aligned, and GOB and EOS start codes may be byte aligned. For packetization purposes, GOB start codes should be byte aligned; however, since this is not required in H.263+, there may be some cases where GOB start codes are not aligned, such as when transmitting existing content, or when using H.263 encoders that do not support GOB start code alignment. In this case, follow-on packets (see section 5.2) should be used for packetization.

H.263 +のスタッフィングメカニズムを使用することにより、H.263 +スタートコードをエンコーダでバイトアラインすることができます。 H.263 +で指定されているように、ピクチャ、スライス、およびEOSBSの開始コードは常にバイト単位で整列し、GOBおよびEOSの開始コードはバイト単位で整列することができます。パケット化のために、GOB開始コードはバイト単位で整列する必要があります。ただし、これはH.263 +では必要ないため、既存のコンテンツを送信するときや、GOBスタートコードのアライメントをサポートしないH.263エンコーダーを使用するときなど、GOBスタートコードがアライメントされない場合があります。この場合、後続パケット(セクション5.2を参照)をパケット化に使用する必要があります。

All H.263+ start codes (Picture, GOB, Slice, EOS, and EOSBS) begin with 16 zero-valued bits. If a start code is byte aligned and it occurs at the beginning of a packet, these two bytes shall be removed from the H.263+ compressed data stream in the packetization process and shall instead be represented by setting a bit (the P bit) in the payload header.

すべてのH.263 +スタートコード(画像、GOB、スライス、EOS、およびEOSBS)は、16個のゼロ値ビットで始まります。開始コードがバイトアラインされていて、パケットの先頭にある場合、これらの2バイトは、パケット化プロセスでH.263 +圧縮データストリームから削除され、代わりにビット(Pビット)を設定することによって表されます。ペイロードヘッダー内。

3. Design Considerations
3. 設計上の考慮事項

The goals of this payload format are to specify an efficient way of encapsulating an H.263+ standard compliant bitstream and to enhance the resiliency towards packet losses. Due to the large number of different possible coding schemes in H.263+, a copy of the picture header with configuration information is inserted into the payload header when appropriate. The use of that copy of the picture header along with the payload data can allow decoding of a received packet even in such cases in which another packet containing the original picture header becomes lost.

このペイロード形式の目的は、H.263 +標準に準拠したビットストリームをカプセル化する効率的な方法を指定し、パケット損失に対する回復力を高めることです。 H.263 +にはさまざまなコーディングスキームが多数あるため、構成情報を含む画像ヘッダーのコピーがペイロードヘッダーに適切に挿入されます。ペイロードデータと共に画像ヘッダーのコピーを使用すると、元の画像ヘッダーを含む別のパケットが失われた場合でも、受信したパケットをデコードできます。

There are a few assumptions and constraints associated with this H.263+ payload header design. The purpose of this section is to point out various design issues and also to discuss several coding options provided by H.263+ that may impact the performance of network-based H.263+ video.

このH.263 +ペイロードヘッダーの設計には、いくつかの仮定と制約があります。このセクションの目的は、さまざまな設計上の問題を指摘し、ネットワークベースのH.263 +ビデオのパフォーマンスに影響を与える可能性があるH.263 +によって提供されるいくつかのコーディングオプションについて説明することです。

o The optional slice structured mode described in Annex K of H.263+ [4] enables more flexibility for packetization. Similar to a picture segment that begins with a GOB header, the motion vector predictors in a slice are restricted to reside within its boundaries. However, slices provide much greater freedom in the selection of the size and shape of the area which is represented as a distinct decodable region. In particular, slices can have a size which is dynamically selected to allow the data for each slice to fit into a chosen packet size. Slices can also be chosen to have a rectangular shape which is conducive for minimizing the impact of errors and packet losses on motion compensated prediction. For these reasons, the use of the slice structured mode is strongly recommended for any applications used in environments where significant packet loss occurs.

o H.263 + [4]のAnnex Kで説明されているオプションのスライス構造化モードにより、パケット化の柔軟性が向上します。 GOBヘッダーで始まる画像セグメントと同様に、スライス内の予測動きベクトルはその境界内に存在するように制限されています。ただし、スライスを使用すると、個別のデコード可能な領域として表される領域のサイズと形状をより自由に選択できます。特に、スライスは、各スライスのデータが選択したパケットサイズに収まるように動的に選択されるサイズを持つことができます。スライスは、動き補償予測に対するエラーとパケット損失の影響を最小限に抑えるのに役立つ長方形の形状を持つように選択することもできます。これらの理由により、重大なパケット損失が発生する環境で使用されるアプリケーションには、スライス構造化モードの使用を強くお勧めします。

o In non-rectangular slice structured mode, only complete slices should be included in a packet. In other words, slices should not be fragmented across packet boundaries. The only reasonable need for a slice to be fragmented across packet boundaries is when the encoder which generated the H.263+ data stream could not be influenced by an awareness of the packetization process (such as when sending H.263+ data through a network other than the one to which the encoder is attached, as in network gateway implementations). Optimally, each packet will contain only one slice.

o長方形以外のスライス構造化モードでは、完全なスライスのみをパケットに含める必要があります。つまり、スライスはパケットの境界を越えて断片化されるべきではありません。スライスがパケット境界を越えてフラグメント化される唯一の合理的な必要性は、H.263 +データストリームを生成したエンコーダーがパケット化プロセスの認識の影響を受けない場合です(ネットワーク経由でH.263 +データを送信する場合など)。ネットワークゲートウェイの実装のように、エンコーダーが接続されているもの以外)。最適には、各パケットにはスライスが1つだけ含まれます。

o The independent segment decoding (ISD) described in Annex R of [4] prevents any data dependency across slice or GOB boundaries in the reference picture. It can be utilized to further improve resiliency in high loss conditions.

o [4]の付録Rで説明されている独立セグメントデコード(ISD)は、参照ピクチャのスライスまたはGOB境界をまたがるデータ依存を防ぎます。高損失状態での回復力をさらに向上させるために利用できます。

o If ISD is used in conjunction with the slice structure, the rectangular slice submode shall be enabled and the dimensions and quantity of the slices present in a frame shall remain the same between each two intra-coded frames (I-frames), as required in H.263+. The individual ISD segments may also be entirely intra coded from time to time to realize quick error recovery without adding the latency time associated with sending complete INTRA-pictures.

o ISDをスライス構造と組み合わせて使用​​する場合、長方形スライスサブモードを有効にし、フレーム内に存在するスライスの寸法と数量を、2つのイントラ符号化フレーム(Iフレーム)間で同じにする必要があります。 H.263 +。個々のISDセグメントは、完全なイントラ画像の送信に関連する待ち時間を追加することなく、迅速なエラー回復を実現するために、時々完全にイントラコード化されることもあります。

o When the slice structure is not applied, the insertion of a (preferably byte-aligned) GOB header can be used to provide resync boundaries in the bitstream, as the presence of a GOB header eliminates the dependency of motion vector prediction across GOB boundaries. These resync boundaries provide natural locations for packet payload boundaries.

o スライス構造が適用されない場合、GOBヘッダーの存在により、GOB境界をまたぐモーションベクトル予測の依存性が排除されるため、ビットストリームに再同期境界を提供するために(できればバイト境界で整列した)GOBヘッダーを挿入できます。これらの再同期境界は、パケットペイロード境界の自然な場所を提供します。

o H.263+ allows picture headers to be sent in an abbreviated form in order to prevent repetition of overhead information that does not change from picture to picture. For resiliency, sending a complete picture header for every frame is often advisable. This means that (especially in cases with high packet loss probability in which picture header contents are not expected to be highly predictable), the sender may find it advisable to always set the subfield UFEP in PLUSPTYPE to '001' in the H.263+ video bitstream. (See [4] for the definition of the UFEP and PLUSPTYPE fields).

o H.263 +では、画像ごとに変化しないオーバーヘッド情報の繰り返しを防ぐために、画像ヘッダーを省略形で送信できます。回復力を高めるために、フレームごとに完全な画像ヘッダーを送信することをお勧めします。これは、(特に、ピクチャヘッダーの内容が高度に予測可能でないと予想されるパケット損失の可能性が高い場合)、H.263 +でPLUSPTYPEのサブフィールドUFEPを常に「001」に設定することをお勧めします。ビデオビットストリーム。 (UFEPおよびPLUSPTYPEフィールドの定義については、[4]を参照してください)。

o In a multi-layer scenario, each layer may be transmitted to a different network address. The configuration of each layer such as the enhancement layer number (ELNUM), reference layer number (RLNUM), and scalability type should be determined at the start of the session and should not change during the course of the session.

o 多層シナリオでは、各層が異なるネットワークアドレスに送信される場合があります。拡張層番号(ELNUM)、参照層番号(RLNUM)、スケーラビリティタイプなどの各層の構成は、セッションの開始時に決定する必要があり、セッション中に変更しないでください。

o All start codes can be byte aligned, and picture, slice, and EOSBS start codes are always byte aligned. The boundaries of these syntactical elements provide ideal locations for placing packet boundaries.

o すべての開始コードはバイト単位で整列でき、画像、スライス、およびEOSBS開始コードは常にバイト単位で整列されます。これらの構文要素の境界は、パケット境界を配置するための理想的な場所を提供します。

o We assume that a maximum Picture Header size of 504 bits is sufficient. The syntax of H.263+ does not explicitly prohibit larger picture header sizes, but the use of such extremely large picture headers is not expected.

o ピクチャヘッダーの最大サイズは504ビットで十分であると想定しています。 H.263 +の構文は、より大きい画像ヘッダーサイズを明示的に禁止していませんが、そのような非常に大きい画像ヘッダーの使用は想定されていません。

4. H.263+ Payload Header
4. H.263 +ペイロードヘッダー

For H.263+ video streams, each RTP packet carries only one H.263+ video packet. The H.263+ payload header is always present for each H.263+ video packet. The payload header is of variable length. A 16 bit field of the basic payload header may be followed by an 8 bit field for Video Redundancy Coding (VRC) information, and/or by a variable length extra picture header as indicated by PLEN. These optional fields appear in the order given above when present.

H.263 +ビデオストリームの場合、各RTPパケットは1つのH.263 +ビデオパケットのみを伝送します。 H.263 +ペイロードヘッダーは、各H.263 +ビデオパケットに常に存在します。ペイロードヘッダーは可変長です。基本ペイロードヘッダーの16ビットフィールドの後には、ビデオ冗長コーディング(VRC)情報用の8ビットフィールド、および/またはPLENで示される可変長の追加の画像ヘッダーが続く場合があります。これらのオプションのフィールドは、存在する場合、上記の順序で表示されます。

If an extra picture header is included in the payload header, the length of the picture header in number of bytes is specified by PLEN. The minimum length of the payload header is 16 bits, corresponding to PLEN equal to 0 and no VRC information present.

ペイロードヘッダーに追加の画像ヘッダーが含まれる場合、画像ヘッダーの長さ(バイト数)がPLENによって指定されます。ペイロードヘッダーの最小長は16ビットで、0に等しいPLENに対応し、VRC情報はありません。

The remainder of this section defines the various components of the RTP payload header. Section five defines the various packet types that are used to carry different types of H.263+ coded data, and section six summarizes how to distinguish between the various packet types.

このセクションの残りの部分では、RTPペイロードヘッダーのさまざまなコンポーネントを定義します。セクション5では、さまざまなタイプのH.263 +コード化データの伝送に使用されるさまざまなパケットタイプを定義し、セクション6では、さまざまなパケットタイプを区別する方法を要約します。

4.1 General H.263+ payload header
4.1 一般的なH.263 +ペイロードヘッダー

The H.263+ payload header is structured as follows:

H.263 +ペイロードヘッダーの構造は次のとおりです。

      0                   1
      0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     |   RR    |P|V|   PLEN    |PEBIT|
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        

RR: 5 bits Reserved bits. Shall be zero.

RR:5ビット予約ビット。ゼロでなければならない。

P: 1 bit Indicates the picture start or a picture segment (GOB/Slice) start or a video sequence end (EOS or EOSBS). Two bytes of zero bits then have to be prefixed to the payload of such a packet to compose a complete picture/GOB/slice/EOS/EOSBS start code. This bit allows the omission of the two first bytes of the start codes, thus improving the compression ratio.

P:1ビットピクチャの開始またはピクチャセグメント(GOB /スライス)の開始またはビデオシーケンスの終了(EOSまたはEOSBS)を示します。次に、完全な画像/ GOB /スライス/ EOS / EOSBS開始コードを構成するために、このようなパケットのペイロードの前に2ビットのゼロビットを付加する必要があります。このビットにより、開始コードの最初の2バイトを省略できるため、圧縮率が向上します。

V: 1 bit Indicates the presence of an 8 bit field containing information for Video Redundancy Coding (VRC), which follows immediately after the initial 16 bits of the payload header if present. For syntax and semantics of that 8 bit VRC field see section 4.2.

V:1ビットペイロードヘッダーの最初の16ビットが存在する場合は、その直後に続くビデオ冗長コーディング(VRC)の情報を含む8ビットフィールドの存在を示します。その8ビットVRCフィールドの構文とセマンティクスについては、セクション4.2を参照してください。

PLEN: 6 bits Length in bytes of the extra picture header. If no extra picture header is attached, PLEN is 0. If PLEN>0, the extra picture header is attached immediately following the rest of the payload header. Note the length reflects the omission of the first two bytes of the picture start code (PSC). See section 5.1.

PLEN:追加の画像ヘッダーの6ビット長(バイト単位)。追加の画像ヘッダーが添付されていない場合、PLENは0です。PLEN> 0の場合、追加の画像ヘッダーは、ペイロードヘッダーの残りの直後に追加されます。長さは、ピクチャスタートコード(PSC)の最初の2バイトの省略を反映していることに注意してください。セクション5.1を参照してください。

PEBIT: 3 bits Indicates the number of bits that shall be ignored in the last byte of the picture header. If PLEN is not zero, the ignored bits shall be the least significant bits of the byte. If PLEN is zero, then PEBIT shall also be zero.

PEBIT:3ビットピクチャヘッダーの最後のバイトで無視されるビット数を示します。 PLENがゼロでない場合、無視されるビットはバイトの最下位ビットになります。 PLENがゼロの場合、PEBITもゼロになります。

4.2 Video Redundancy Coding Header Extension
4.2 ビデオ冗長コーディングヘッダー拡張

Video Redundancy Coding (VRC) is an optional mechanism intended to improve error resilience over packet networks. Implementing VRC in H.263+ will require the Reference Picture Selection option described in Annex N of [4]. By having multiple "threads" of independently inter-frame predicted pictures, damage of individual frame will cause distortions only within its own thread but leave the other threads unaffected. From time to time, all threads converge to a so-called sync frame (an INTRA picture or a non-INTRA picture which is redundantly represented within multiple threads); from this sync frame, the independent threads are started again. For more information on codec support for VRC see [7].

ビデオ冗長コーディング(VRC)は、パケットネットワークでのエラー耐性を向上させることを目的としたオプションのメカニズムです。 H.263 +にVRCを実装するには、[4]の付録Nで説明されている参照画像選択オプションが必要です。独立したフレーム間予測画像の複数の「スレッド」を持つことにより、個々のフレームの損傷は、それ自体のスレッド内でのみ歪みを引き起こしますが、他のスレッドは影響を受けません。時々、すべてのスレッドは、いわゆる同期フレーム(複数のスレッド内で重複して表されるINTRAピクチャまたは非INTRAピクチャ)に収束します。この同期フレームから、独立したスレッドが再び開始されます。 VRCのコーデックサポートの詳細については、[7]を参照してください。

P-picture temporal scalability is another use of the reference picture selection mode and can be considered a special case of VRC in which only one copy of each sync frame may be sent. It offers a thread-based method of temporal scalability without the increased delay caused by the use of B pictures. In this use, sync frames sent in the first thread of pictures are also used for the prediction of a second thread of pictures which fall temporally between the sync frames to increase the resulting frame rate. In this use, the pictures in the second thread can be discarded in order to obtain a reduction of bit rate or decoding complexity without harming the ability to decode later pictures. A third or more threads can also be added as well, but each thread is predicted only from the sync frames (which are sent at least in thread 0) or from frames within the same thread.

Pピクチャの時間スケーラビリティは、参照ピクチャ選択モードのもう1つの用途であり、各同期フレームの1つのコピーのみを送信できるVRCの特殊なケースと見なすことができます。 Bピクチャの使用による遅延の増加なしに、時間ベースのスケーラビリティのスレッドベースの方法を提供します。この使用では、画像の最初のスレッドで送信された同期フレームは、同期フレームの間に一時的に入る画像の第2スレッドの予測にも使用され、結果のフレームレートが増加します。この使用では、2番目のスレッドの画像を破棄して、後の画像をデコードする機能を損なうことなく、ビットレートまたはデコードの複雑さを減らすことができます。 3つ以上のスレッドを追加することもできますが、各スレッドは、同期フレーム(少なくともスレッド0で送信される)または同じスレッド内のフレームからのみ予測されます。

While a VRC data stream is - like all H.263+ data - totally self-contained, it may be useful for the transport hierarchy implementation to have knowledge about the current damage status of each thread. On the Internet, this status can easily be determined by observing the marker bit, the sequence number of the RTP header, and the thread-id and a circling "packet per thread" number. The latter two numbers are coded in the VRC header extension.

すべてのH.263 +データと同様に、VRCデータストリームは完全に自己完結型ですが、トランスポート階層の実装が各スレッドの現在の損傷状態に関する知識を持っていると便利です。インターネットでは、このステータスは、マーカービット、RTPヘッダーのシーケンス番号、およびスレッドIDと循環する「スレッドごとのパケット」番号を確認することで簡単に判断できます。後者の2つの番号は、VRCヘッダー拡張でコーディングされます。

The format of the VRC header extension is as follows:

VRCヘッダー拡張の形式は次のとおりです。

      0 1 2 3 4 5 6 7
     +-+-+-+-+-+-+-+-+
     | TID | Trun  |S|
     +-+-+-+-+-+-+-+-+
        

TID: 3 bits Thread ID. Up to 7 threads are allowed. Each frame of H.263+ VRC data will use as reference information only sync frames or frames within the same thread. By convention, thread 0 is expected to be the "canonical" thread, which is the thread from which the sync frame should ideally be used. In the case of corruption or loss of the thread 0 representation, a representation of the sync frame with a higher thread number can be used by the decoder. Lower thread numbers are expected to contain equal or better representations of the sync frames than higher thread numbers in the absence of data corruption or loss. See [7] for a detailed discussion of VRC.

TID:3ビットのスレッドID。最大7つのスレッドが許可されます。 H.263 + VRCデータの各フレームは、同期情報または同じスレッド内のフレームのみを参照情報として使用します。慣例により、スレッド0は「正規の」スレッドであると予想されます。これは、同期フレームを理想的に使用する必要があるスレッドです。スレッド0表現の破損または損失の場合、より大きなスレッド番号を持つ同期フレームの表現をデコーダーで使用できます。スレッド数が少ないと、データの破損や損失がない場合に、スレッド数が多い場合と同等またはそれ以上の同期フレームの表現が含まれることが期待されます。 VRCの詳細については、[7]を参照してください。

Trun: 4 bits Monotonically increasing (modulo 16) 4 bit number counting the packet number within each thread.

Trun:4ビット単調増加(モジュロ16)4ビットの数値で、各スレッド内のパケット番号をカウントします。

S: 1 bit A bit that indicates that the packet content is for a sync frame. An encoder using VRC may send several representations of the same "sync" picture, in order to ensure that regardless of which thread of pictures is corrupted by errors or packet losses, the reception of at least one representation of a particular picture is ensured (within at least one thread). The sync picture can then be used for the prediction of any thread. If packet losses have not occurred, then the sync frame contents of thread 0 can be used and those of other threads can be discarded (and similarly for other threads). Thread 0 is considered the "canonical" thread, the use of which is preferable to all others. The contents of packets having lower thread numbers shall be considered as having a higher processing and delivery priority than those with higher thread numbers. Thus packets having lower thread numbers for a given sync frame shall be delivered first to the decoder under loss-free and low-time-jitter conditions, which will result in the discarding of the sync contents of the higher-numbered threads as specified in Annex N of [4].

S:1ビットパケットの内容が同期フレーム用であることを示すビット。 VRCを使用するエンコーダーは、同じ「同期」画像のいくつかの表現を送信できます。エラーまたはパケット損失によって画像のどのスレッドが破損していても、特定の画像の少なくとも1つの表現の受信が保証されるようにします。少なくとも1つのスレッド)。同期画像は、任意のスレッドの予測に使用できます。パケット損失が発生していない場合は、スレッド0の同期フレームの内容を使用し、他のスレッドの同期フレームの内容を破棄できます(他のスレッドでも同様です)。スレッド0は「標準」スレッドと見なされ、他のすべてのスレッドよりも使用することが推奨されます。スレッド番号が小さいパケットの内容は、スレッド番号が大きいパケットよりも処理および配信の優先順位が高いと見なされます。したがって、所定の同期フレームのスレッド番号が小さいパケットは、損失のない低時間ジッターの条件下で最初にデコーダーに配信される必要があります。これにより、付録に指定されている番号の大きいスレッドの同期コンテンツが破棄されます。 [4]のN。

5. Packetization schemes
5. パケット化スキーム
5.1 Picture Segment Packets and Sequence Ending Packets (P=1)
5.1 ピクチャセグメントパケットとシーケンス終了パケット(P = 1)

A picture segment packet is defined as a packet that starts at the location of a Picture, GOB, or slice start code in the H.263+ data stream. This corresponds to the definition of the start of a video picture segment as defined in H.263+. For such packets, P=1 always.

ピクチャセグメントパケットは、H.263 +データストリーム内のピクチャ、GOB、またはスライススタートコードの位置から始まるパケットとして定義されます。これは、H.263 +で定義されているビデオ画像セグメントの開始の定義に対応しています。そのようなパケットの場合、常にP = 1です。

An extra picture header can sometimes be attached in the payload header of such packets. Whenever an extra picture header is attached as signified by PLEN>0, only the last six bits of its picture start code, '100000', are included in the payload header. A complete H.263+ picture header with byte aligned picture start code can be conveniently assembled on the receiving end by prepending the sixteen leading '0' bits.

このようなパケットのペイロードヘッダーには、追加の画像ヘッダーが添付されることがあります。 PLEN> 0で示される追加の画像ヘッダーが添付されている場合は常に、その画像開始コードの最後の6ビット(100000)のみがペイロードヘッダーに含まれます。バイトアラインメントピクチャスタートコードを備えた完全なH.263 +ピクチャヘッダーは、先頭の16個の「0」ビットを前に付けることにより、受信側で簡単に組み立てることができます。

When PLEN>0, the end bit position corresponding to the last byte of the picture header data is indicated by PEBIT. The actual bitstream data shall begin on an 8-bit byte boundary following the payload header.

PLEN> 0の場合、ピクチャヘッダーデータの最後のバイトに対応する終了ビット位置はPEBITで示されます。実際のビットストリームデータは、ペイロードヘッダーに続く8ビットバイト境界で開始します。

A sequence ending packet is defined as a packet that starts at the location of an EOS or EOSBS code in the H.263+ data stream. This delineates the end of a sequence of H.263+ video data (more H.263+ video data may still follow later, however, as specified in ITU-T Recommendation H.263). For such packets, P=1 and PLEN=0 always.

シーケンス終了パケットは、H.263 +データストリームのEOSまたはEOSBSコードの場所で始まるパケットとして定義されます。これは、一連のH.263 +ビデオデータの終わりを示しています(ただし、ITU-T勧告H.263で指定されているように、さらに多くのH.263 +ビデオデータが後に続く場合があります)。そのようなパケットの場合、常にP = 1およびPLEN = 0です。

The optional header extension for VRC may or may not be present as indicated by the V bit flag.

VRCのオプションのヘッダー拡張は、Vビットフラグで示されるように存在する場合と存在しない場合があります。

5.1.1 Packets that begin with a Picture Start Code
5.1.1 画像開始コードで始まるパケット

Any packet that contains the whole or the start of a coded picture shall start at the location of the picture start code (PSC), and should normally be encapsulated with no extra copy of the picture header. In other words, normally PLEN=0 in such a case. However, if the coded picture contains an incomplete picture header (UFEP = "000"), then a representation of the complete (UFEP = "001") picture header may be attached during packetization in order to provide greater error resilience. Thus, for packets that start at the location of a picture start code, PLEN shall be zero unless both of the following conditions apply: 1) The picture header in the H.263+ bitstream payload is incomplete (PLUSPTYPE present and UFEP="000"), and

コード化された画像の全体または開始を含むパケットは、画像開始コード(PSC)の位置から開始し、通常は画像ヘッダーの追加のコピーなしでカプセル化する必要があります。つまり、このような場合は通常PLEN = 0です。ただし、コード化された画像に不完全な画像ヘッダー(UFEP = "000")が含まれている場合、完全な(UFEP = "001")画像ヘッダーの表現をパケット化中に添付して、エラー耐性を高めることができます。したがって、画像開始コードの位置で始まるパケットの場合、次の両方の条件が当てはまらない限り、PLENはゼロになります。1)H.263 +ビットストリームペイロードの画像ヘッダーが不完全(PLUSPTYPEが存在し、UFEP = "000) ")、そして

2) The additional picture header which is attached is not incomplete (UFEP="001").

2)添付されている追加の画像ヘッダーは不完全ではありません(UFEP = "001")。

A packet which begins at the location of a Picture, GOB, slice, EOS, or EOSBS start code shall omit the first two (all zero) bytes from the H.263+ bitstream, and signify their presence by setting P=1 in the payload header.

ピクチャ、GOB、スライス、EOS、またはEOSBSスタートコードの場所で始まるパケットは、H.263 +ビットストリームから最初の2バイト(すべてゼロ)を省略し、ペイロードヘッダー。

Here is an example of encapsulating the first packet in a frame (without an attached redundant complete picture header):

以下は、フレーム内の最初のパケットをカプセル化する例です(冗長な完全な画像ヘッダーが付加されていません)。

      0                   1                   2                   3
      0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     |   RR    |1|V|0|0|0|0|0|0|0|0|0| bitstream data without the    |
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     | first two 0 bytes of the PSC                                ...
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        
5.1.2 Packets that begin with GBSC or SSC
5.1.2 GBSCまたはSSCで始まるパケット

For a packet that begins at the location of a GOB or slice start code, PLEN may be zero or may be nonzero, depending on whether a redundant picture header is attached to the packet. In environments with very low packet loss rates, or when picture header contents are very seldom likely to change (except as can be detected from the GFID syntax of H.263+), a redundant copy of the picture header is not required. However, in less ideal circumstances a redundant picture header should be attached for enhanced error resilience, and its presence is indicated by PLEN>0.

GOBまたはスライススタートコードの場所で始まるパケットの場合、冗長な画像ヘッダーがパケットに添付されているかどうかに応じて、PLENはゼロまたはゼロ以外の場合があります。パケット損失率が非常に低い環境、または画像ヘッダーの内容がほとんど変更されない場合(H.263 +のGFID構文から検出できる場合を除く)、画像ヘッダーの冗長コピーは必要ありません。ただし、あまり理想的でない状況では、エラー耐性を強化するために冗長な画像ヘッダーを添付する必要があり、その存在はPLEN> 0で示されます。

Assuming a PLEN of 9 and P=1, below is an example of a packet that begins with a byte aligned GBSC or a SSC:

PLENが9でP = 1であると想定すると、バイトアラインGBSCまたはSSCで始まるパケットの例を以下に示します。

      0                   1                   2                   3
      0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     |   RR    |1|V|0 0 1 0 0 1|PEBIT|1 0 0 0 0 0| picture header    |
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     | starting with TR, PTYPE ...                                   |
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     | ...                                           | bitstream     |
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     | data starting with GBSC/SSC without its first two 0 bytes   ...
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        

Notice that only the last six bits of the picture start code, '100000', are included in the payload header. A complete H.263+ picture header with byte aligned picture start code can be conveniently assembled if needed on the receiving end by prepending the sixteen leading '0' bits.

ペイロードヘッダーに含まれているのは、ピクチャスタートコードの最後の6ビット「100000」だけであることに注意してください。バイトアラインメントピクチャスタートコードを備えた完全なH.263 +ピクチャヘッダーは、先頭の16個の「0」ビットを前に付けることにより、必要に応じて受信側で簡単に組み立てることができます。

5.1.3 Packets that Begin with an EOS or EOSBS Code
5.1.3 EOSまたはEOSBSコードで始まるパケット

For a packet that begins with an EOS or EOSBS code, PLEN shall be zero, and no Picture, GOB, or Slice start codes shall be included within the same packet. As with other packets beginning with start codes, the two all-zero bytes that begin the EOS or EOSBS code at the beginning of the packet shall be omitted, and their presence shall be indicated by setting the P bit to 1 in the payload header.

EOSまたはEOSBSコードで始まるパケットの場合、PLENはゼロで、ピクチャ、GOB、またはスライススタートコードは同じパケット内に含まれません。開始コードで始まる他のパケットと同様に、パケットの先頭でEOSまたはEOSBSコードを開始する2つのすべてゼロのバイトは省略され、その存在はペイロードヘッダーのPビットを1に設定することで示されます。

System designers should be aware that some decoders may interpret the loss of a packet containing only EOS or EOSBS information as the loss of essential video data and may thus respond by not displaying some subsequent video information. Since EOS and EOSBS codes do not actually affect the decoding of video pictures, they are somewhat unnecessary to send at all. Because of the danger of misinterpretation of the loss of such a packet (which can be detected by the sequence number), encoders are generally to be discouraged from sending EOS and EOSBS.

システム設計者は、一部のデコーダーがEOSまたはEOSBS情報のみを含むパケットの損失を本質的なビデオデータの損失として解釈し、後続のビデオ情報を表示しないことで応答する場合があることに注意する必要があります。 EOSおよびEOSBSコードは実際にはビデオ画像のデコードに影響しないため、送信する必要はまったくありません。このようなパケット(シーケンス番号によって検出される可能性があります)の損失を誤って解釈する危険性があるため、エンコーダーは通常、EOSおよびEOSBSを送信しないようにしてください。

Below is an example of a packet containing an EOS code:

以下は、EOSコードを含むパケットの例です。

      0                   1                   2
      0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     |   RR    |1|V|0|0|0|0|0|0|0|0|0|1|1|1|1|1|1|0|0|
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        

5.2 Encapsulating Follow-On Packet (P=0)

5.2 後続パケットのカプセル化(P = 0)

A Follow-on packet contains a number of bytes of coded H.263+ data which does not start at a synchronization point. That is, a Follow-On packet does not start with a Picture, GOB, Slice, EOS, or EOSBS header, and it may or may not start at a macroblock boundary. Since Follow-on packets do not start at synchronization points, the data at the beginning of a follow-on packet is not independently decodable. For such packets, P=0 always. If the preceding packet of a Follow-on packet got lost, the receiver may discard that Follow-on packet as well as all other following Follow-on packets. Better behavior, of course, would be for the receiver to scan the interior of the packet payload content to determine whether any start codes are found in the interior of the packet which can be used as resync points. The use of an attached copy of a picture header for a follow-on packet is useful only if the interior of the packet or some subsequent follow-on packet contains a resync code such as a GOB or slice start code. PLEN>0 is allowed, since it may allow resync in the interior of the packet. The decoder may also be resynchronized at the next segment or picture packet.

フォローオンパケットには、同期ポイントで開始しないコード化されたH.263 +データのバイト数が含まれています。つまり、Follow-Onパケットは、Picture、GOB、Slice、EOS、またはEOSBSヘッダーで開始されず、マクロブロック境界で開始される場合と開始されない場合があります。後続パケットは同期ポイントで開始しないため、後続パケットの先頭のデータは個別にデコードできません。そのようなパケットの場合、常にP = 0です。後続パケットの先行パケットが失われた場合、受信者はその後続パケットだけでなく、後続の他のすべての後続パケットも破棄する可能性があります。もちろん、より良い動作は、レシーバーがパケットペイロードコンテンツの内部をスキャンして、再同期ポイントとして使用できる開始コードがパケットの内部にあるかどうかを判断することです。後続のパケットに画像ヘッダーの添付コピーを使用すると、パケットの内部または後続の後続のパケットに、GOBやスライススタートコードなどの再同期コードが含まれている場合にのみ役立ちます。 PLEN> 0は、パケットの内部での再同期を許可する場合があるため、許可されます。デコーダはまた、次のセグメントまたは画像パケットで再同期されてもよい。

Here is an example of a follow-on packet (with PLEN=0):

以下は、PLEN = 0の後続パケットの例です。

      0                   1                   2                   3
      0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
     |   RR    |0|V|0|0|0|0|0|0|0|0|0| bitstream data              ...
     +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
        
6. Use of this payload specification
6. このペイロード仕様の使用

There is no syntactical difference between a picture segment packet and a Follow-on packet, other than the indication P=1 for picture segment or sequence ending packets and P=0 for Follow-on packets. See the following for a summary of the entire packet types and ways to distinguish between them.

ピクチャセグメントパケットと後続パケットの構文上の違いはありませんが、ピクチャセグメントまたはシーケンス終了パケットの場合はP = 1、後続パケットの場合はP = 0と表示されます。パケットタイプ全体の概要とそれらを区別する方法については、以下を参照してください。

It is possible to distinguish between the different packet types by checking the P bit and the first 6 bits of the payload along with the header information. The following table shows the packet type for permutations of this information (see also the picture/GOB/Slice header descriptions in H.263+ for details):

ヘッダー情報とともにペイロードのPビットと最初の6ビットをチェックすることで、異なるパケットタイプを区別できます。次の表は、この情報の順列のパケットタイプを示しています(詳細については、H.263 +のpicture / GOB / Sliceヘッダーの説明も参照してください)。

--------------+--------------+----------------------+-------------------
 First 6 bits | P-Bit | PLEN |  Packet              |  Remarks
 of Payload   |(payload hdr.)|                      |
--------------+--------------+----------------------+-------------------
 100000       |   1   |  0   |  Picture             |  Typical Picture
 100000       |   1   | > 0  |  Picture             |  Note UFEP
 1xxxxx       |   1   |  0   |  GOB/Slice/EOS/EOSBS |  See possible GNs
 1xxxxx       |   1   | > 0  |  GOB/Slice           |  See possible GNs
 Xxxxxx       |   0   |  0   |  Follow-on           |
 Xxxxxx       |   0   | > 0  |  Follow-on           |  Interior Resync
--------------+--------------+----------------------+-------------------
        

The details regarding the possible values of the five bit Group Number (GN) field which follows the initial "1" bit when the P-bit is "1" for a GOB, Slice, EOS, or EOSBS packet are found in section 5.2.3 of [4].

GOB、スライス、EOS、またはEOSBSパケットのPビットが「1」の場合、最初の「1」ビットに続く5ビットのグループ番号(GN)フィールドの可能な値に関する詳細は、セクション5.2にあります。 [4]の3。

As defined in this specification, every start of a coded frame (as indicated by the presence of a PSC) has to be encapsulated as a picture segment packet. If the whole coded picture fits into one packet of reasonable size (which is dependent on the connection characteristics), this is the only type of packet that may need to be used. Due to the high compression ratio achieved by H.263+ it is often possible to use this mechanism, especially for small spatial picture formats such as QCIF and typical Internet packet sizes around 1500 bytes.

この仕様で定義されているように、(PSCの存在によって示される)コード化フレームのすべての開始は、画像セグメントパケットとしてカプセル化する必要があります。コード化された画像全体が(接続特性に依存する)妥当なサイズの1つのパケットに収まる場合、これが使用する必要がある唯一のタイプのパケットです。 H.263 +によって達成された高い圧縮率のために、特にQCIFなどの小さな空間画像フォーマットや約1500バイトの一般的なインターネットパケットサイズに対して、このメカニズムを使用することがしばしば可能です。

If the complete coded frame does not fit into a single packet, two different ways for the packetization may be chosen. In case of very low or zero packet loss probability, one or more Follow-on packets may be used for coding the rest of the picture. Doing so leads to minimal coding and packetization overhead as well as to an optimal use of the maximal packet size, but does not provide any added error resilience.

完全なコード化フレームが単一のパケットに収まらない場合、パケット化に2つの異なる方法を選択できます。パケット損失確率が非常に低いかゼロの場合、1つまたは複数の後続パケットを使用して、残りの画像をコーディングできます。これを行うと、コーディングとパケット化のオーバーヘッドが最小限に抑えられ、最大パケットサイズが最適に使用されますが、エラー回復力は追加されません。

The alternative is to break the picture into reasonably small partitions - called Segments - (by using the Slice or GOB mechanism), that do offer synchronization points. By doing so and using the Picture Segment payload with PLEN>0, decoding of the transmitted packets is possible even in such cases in which the Picture packet containing the picture header was lost (provided any necessary reference picture is available). Picture Segment packets can also be used in conjunction with Follow-on packets for large segment sizes.

別の方法は、(スライスまたはGOBメカニズムを使用して)セグメントと呼ばれるかなり小さなパーティションに画像を分割し、同期ポイントを提供することです。これを行い、PLEN> 0のピクチャーセグメントペイロードを使用することにより、ピクチャーヘッダーを含むピクチャーパケットが失われた(必要な参照ピクチャーがある場合)場合でも、送信されたパケットのデコードが可能です。ピクチャセグメントパケットは、大きなセグメントサイズの後続パケットと組み合わせて使用​​することもできます。

7. Security Considerations
7. セキュリティに関する考慮事項

RTP packets using the payload format defined in this specification are subject to the security considerations discussed in the RTP specification [1], and any appropriate RTP profile (for example [2]). This implies that confidentiality of the media streams is achieved by encryption. Because the data compression used with this payload format is applied end-to-end, encryption may be performed after compression so there is no conflict between the two operations.

この仕様で定義されたペイロード形式を使用するRTPパケットは、RTP仕様[1]および適切なRTPプロファイル([2]など)で説明されているセキュリティ上の考慮事項の対象となります。これは、メディアストリームの機密性が暗号化によって達成されることを意味します。このペイロード形式で使用されるデータ圧縮はエンドツーエンドで適用されるため、圧縮後に暗号化を実行して、2つの操作が競合しないようにすることができます。

A potential denial-of-service threat exists for data encodings using compression techniques that have non-uniform receiver-end computational load. The attacker can inject pathological datagrams into the stream which are complex to decode and cause the receiver to be overloaded. However, this encoding does not exhibit any significant non-uniformity.

受信側の計算負荷が均一でない圧縮技術を使用したデータエンコーディングには、潜在的なサービス拒否の脅威が存在します。攻撃者は、デコードが複雑な病理学的データグラムをストリームに挿入し、レシーバーに過負荷をかける可能性があります。ただし、このエンコーディングでは、大きな不均一性は発生しません。

As with any IP-based protocol, in some circumstances a receiver may be overloaded simply by the receipt of too many packets, either desired or undesired. Network-layer authentication may be used to discard packets from undesired sources, but the processing cost of the authentication itself may be too high. In a multicast environment, pruning of specific sources may be implemented in future versions of IGMP [5] and in multicast routing protocols to allow a receiver to select which sources are allowed to reach it.

他のIPベースのプロトコルと同様に、状況によっては、受信側は、必要以上に多くのパケットを受信しただけで過負荷になる場合があります。ネットワーク層認証は、望ましくないソースからのパケットを破棄するために使用できますが、認証自体の処理コストが高すぎる可能性があります。マルチキャスト環境では、特定のソースのプルーニングがIGMP [5]の将来のバージョンとマルチキャストルーティングプロトコルに実装され、レシーバーが到達可能なソースを選択できるようになります。

A security review of this payload format found no additional considerations beyond those in the RTP specification.

このペイロード形式のセキュリティレビューでは、RTP仕様以外の考慮事項は見つかりませんでした。

8. Addresses of Authors
8. 著者のアドレス
   Carsten Bormann
   Universitaet Bremen FB3 TZI      EMail: cabo@tzi.org
   Postfach 330440                  Phone: +49.421.218-7024
   D-28334 Bremen, GERMANY          Fax:   +49.421.218-7000
        
   Linda Cline
   Intel Corp. M/S JF3-206          EMail: lscline@jf.intel.com
   2111 NE 25th Avenue              Phone: +1 503 264 3501
   Hillsboro, OR 97124, USA         Fax:   +1 503 264 3483
        
   Gim Deisher
   Intel Corp. M/S JF2-78           EMail: gim.l.deisher@intel.com
   2111 NE 25th Avenue              Phone: +1 503 264 3758
   Hillsboro, OR 97124, USA         Fax:   +1 503 264 9372
        
   Tom Gardos
   Intel Corp. M/S JF2-78           EMail: thomas.r.gardos@intel.com
   2111 NE 25th Avenue              Phone: +1 503 264 6459
   Hillsboro, OR 97124, USA         Fax:   +1 503 264 9372
        
   Christian Maciocco
   Intel Corp. M/S JF3-206          EMail: christian.maciocco@intel.com
   2111 NE 25th Avenue              Phone: +1 503 264 1770
   Hillsboro, OR 97124, USA         Fax:   +1 503 264 9428
        
   Donald Newell
   Intel Corp. M/S JF3-206          EMail: donald.newell@intel.com
   2111 NE 25th Avenue              Phone: +1 503 264 9234
   Hillsboro, OR 97124, USA         Fax:   +1 503 264 9428
   Joerg Ott
   Universitaet Bremen FB3 TZI      EMail: jo@tzi.org
   Postfach 330440                  Phone: +49.421.218-7024
   D-28334 Bremen, GERMANY          Fax:   +49.421.218-7000
        
   Gary Sullivan
   PictureTel Corp. M/S 635         EMail: garys@pictel.com
   100 Minuteman Road               Phone: +1 978 623 4324
   Andover, MA 01810, USA           Fax:   +1 978 749 2804
        
   Stephan Wenger
   Technische Universitaet Berlin FB13
   Sekr. FR 6-3                     EMail: stewe@cs.tu-berlin.de
   Franklinstr. 28/29               Phone: +49.30.314-73160
   D-10587 Berlin, GERMANY          Fax:   +49.30.314-25156
        
   Chad Zhu
   Intel Corp. M/S JF3-202          EMail: czhu@ix.netcom.com
   2111 NE 25th Avenue              Phone: +1 503 264 6004
   Hillsboro, OR 97124, USA         Fax:   +1 503 264 1805
        
9. References
9. 参考文献

[1] Schulzrinne, H., Casner, S., Frederick, R., and V. Jacobson, "RTP : A Transport Protocol for Real-Time Applications", RFC 1889, January 1996.

[1] Schulzrinne、H.、Casner、S.、Frederick、R。、およびV. Jacobson、「RTP:A Transport Protocol for Real-Time Applications」、RFC 1889、1996年1月。

[2] Schulzrinne, H., "RTP Profile for Audio and Video Conference with Minimal Control", RFC 1890, January 1996.

[2] Schulzrinne、H。、「Minimal Controlを使用したオーディオおよびビデオ会議のRTPプロファイル」、RFC 1890、1996年1月。

[3] "Video Coding for Low Bit Rate Communication," ITU-T Recommendation H.263, March 1996.

[3] 「低ビットレート通信用のビデオコーディング」、ITU-T勧告H.263、1996年3月。

[4] "Video Coding for Low Bit Rate Communication," ITU-T Recommendation H.263, January 1998.

[4] 「低ビットレート通信用のビデオコーディング」、ITU-T勧告H.263、1998年1月。

[5] Turletti, T. and C. Huitema, "RTP Payload Format for H.261 Video Streams", RFC 2032, October 1996.

[5] Turletti、T.およびC. Huitema、「RTP Payload Format for H.261 Video Streams」、RFC 2032、1996年10月。

[6] Zhu, C., "RTP Payload Format for H.263 Video Streams", RFC 2190, September 1997.

[6] Zhu、C。、「RTP Payload Format for H.263 Video Streams」、RFC 2190、1997年9月。

[7] S. Wenger, "Video Redundancy Coding in H.263+," Proc. Audio-Visual Services over Packet Networks, Aberdeen, U.K., September 1997.

[7] S.ウェンガー、「H.263 +のビデオ冗長コーディング」、Proc。パケットネットワーク上のオーディオビジュアルサービス、アバディーン、イギリス、1997年9月。

10. 完全な著作権表示

Copyright (C) The Internet Society (1998). All Rights Reserved.

Copyright(C)The Internet Society(1998)。全著作権所有。

This document and translations of it may be copied and furnished to others, and derivative works that comment on or otherwise explain it or assist in its implementation may be prepared, copied, published and distributed, in whole or in part, without restriction of any kind, provided that the above copyright notice and this paragraph are included on all such copies and derivative works. However, this document itself may not be modified in any way, such as by removing the copyright notice or references to the Internet Society or other Internet organizations, except as needed for the purpose of developing Internet standards in which case the procedures for copyrights defined in the Internet Standards process must be followed, or as required to translate it into languages other than English.

このドキュメントとその翻訳はコピーして他のユーザーに提供することができ、コメントまたはその他の方法で説明したり、その実装を支援する二次的著作物は、いかなる種類の制限なしに、全体または一部を準備、コピー、公開、および配布することができますただし、上記の著作権表示とこの段落は、そのようなすべてのコピーと派生物に含まれています。ただし、このドキュメント自体は、著作権に関する通知を削除したり、インターネットソサエティや他のインターネット組織への参照を削除したりするなど、いかなる方法でも変更できません。ただし、インターネット標準を開発する目的で必要な場合は除きます。インターネット標準のプロセスに従うか、または必要に応じて、それを英語以外の言語に翻訳する必要があります。

The limited permissions granted above are perpetual and will not be revoked by the Internet Society or its successors or assigns.

上記で付与された制限付きのアクセス許可は永続的であり、インターネットソサエティまたはその後継者または譲受人によって取り消されることはありません。

This document and the information contained herein is provided on an "AS IS" basis and THE INTERNET SOCIETY AND THE INTERNET ENGINEERING TASK FORCE DISCLAIMS ALL WARRANTIES, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO ANY WARRANTY THAT THE USE OF THE INFORMATION HEREIN WILL NOT INFRINGE ANY RIGHTS OR ANY IMPLIED WARRANTIES OF MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE.

このドキュメントとここに含まれる情報は「現状有姿」で提供され、インターネット社会およびインターネット技術タスクフォースは、明示または黙示を問わず、ここに記載されている情報の使用が保証するものに限定されないいかなる保証も含め、一切の保証を否認します。商品性または特定の目的への適合性に関する権利または黙示の保証を侵害すること。