[要約] 要約: RFC 8316は、分散型のサービスレベル契約(SLA)違反の検出のための自律ネットワーキングの使用事例について説明しています。目的: このRFCの目的は、自律ネットワーキングを使用して、分散型のSLA違反の検出を実現する方法を提案することです。

Internet Research Task Force (IRTF)                             J. Nobre
Request for Comments: 8316           University of Vale do Rio dos Sinos
Category: Informational                                     L. Granville
ISSN: 2070-1721                  Federal University of Rio Grande do Sul
                                                                A. Clemm
                                                                  Huawei
                                                      A. Gonzalez Prieto
                                                                  VMware
                                                           February 2018
        

Autonomic Networking Use Case for Distributed Detection of Service Level Agreement (SLA) Violations

サービスレベルアグリーメント(SLA)違反の分散検出のための自律型ネットワーキングの使用例

Abstract

概要

This document describes an experimental use case that employs autonomic networking for the monitoring of Service Level Agreements (SLAs). The use case is for detecting violations of SLAs in a distributed fashion. It strives to optimize and dynamically adapt the autonomic deployment of active measurement probes in a way that maximizes the likelihood of detecting service-level violations with a given resource budget to perform active measurements. This optimization and adaptation should be done without any outside guidance or intervention.

このドキュメントでは、サービスレベルアグリーメント(SLA)の監視にオートノミックネットワーキングを使用する実験的なユースケースについて説明します。このユースケースは、分散方式でSLAの違反を検出するためのものです。これは、アクティブな測定を実行するために特定のリソースバジェットでサービスレベル違反を検出する可能性を最大化する方法で、アクティブな測定プローブのオートノミック展開を最適化および動的に適合させるよう努めています。この最適化と適応は、外部のガイダンスや介入なしで行う必要があります。

This document is a product of the IRTF Network Management Research Group (NMRG). It is published for informational purposes.

この文書はIRTFネットワーク管理研究グループ(NMRG)の製品です。情報提供を目的として公開されています。

Status of This Memo

本文書の状態

This document is not an Internet Standards Track specification; it is published for informational purposes.

このドキュメントはInternet Standards Trackの仕様ではありません。情報提供を目的として公開されています。

This document is a product of the Internet Research Task Force (IRTF). The IRTF publishes the results of Internet-related research and development activities. These results might not be suitable for deployment. This RFC represents the consensus of the Network Management Research Group of the Internet Research Task Force (IRTF). Documents approved for publication by the IRSG are not candidates for any level of Internet Standard; see Section 2 of RFC 7841.

この文書は、Internet Research Task Force(IRTF)の製品です。 IRTFは、インターネット関連の研究開発活動の結果を公開しています。これらの結果は、展開に適さない可能性があります。このRFCは、Internet Research Task Force(IRTF)のNetwork Management Research Groupのコンセンサスを表しています。 IRSGによる公開が承認されたドキュメントは、どのレベルのインターネット標準の候補にもなりません。 RFC 7841のセクション2をご覧ください。

Information about the current status of this document, any errata, and how to provide feedback on it may be obtained at https://www.rfc-editor.org/info/rfc8316.

このドキュメントの現在のステータス、正誤表、およびフィードバックの提供方法に関する情報は、https://www.rfc-editor.org/info/rfc8316で入手できます。

Copyright Notice

著作権表示

Copyright (c) 2018 IETF Trust and the persons identified as the document authors. All rights reserved.

Copyright(c)2018 IETF Trustおよびドキュメントの作成者として識別された人物。全著作権所有。

This document is subject to BCP 78 and the IETF Trust's Legal Provisions Relating to IETF Documents (https://trustee.ietf.org/license-info) in effect on the date of publication of this document. Please review these documents carefully, as they describe your rights and restrictions with respect to this document.

この文書は、BCP 78およびIETF文書に関するIETFトラストの法的規定(https://trustee.ietf.org/license-info)の対象であり、この文書の発行日に有効です。これらのドキュメントは、このドキュメントに関するあなたの権利と制限を説明しているため、注意深く確認してください。

Table of Contents

目次

   1.  Introduction  . . . . . . . . . . . . . . . . . . . . . . . .   3
   2.  Definitions and Acronyms  . . . . . . . . . . . . . . . . . .   5
   3.  Current Approaches  . . . . . . . . . . . . . . . . . . . . .   6
   4.  Use Case Description  . . . . . . . . . . . . . . . . . . . .   7
   5.  A Distributed Autonomic Solution  . . . . . . . . . . . . . .   8
   6.  Intended User Experience  . . . . . . . . . . . . . . . . . .  10
   7.  Implementation Considerations . . . . . . . . . . . . . . . .  11
     7.1.  Device-Based Self-Knowledge and Decisions . . . . . . . .  11
     7.2.  Interaction with Other Devices  . . . . . . . . . . . . .  11
   8.  Comparison with Current Solutions . . . . . . . . . . . . . .  12
   9.  Related IETF Work . . . . . . . . . . . . . . . . . . . . . .  12
   10. IANA Considerations . . . . . . . . . . . . . . . . . . . . .  13
   11. Security Considerations . . . . . . . . . . . . . . . . . . .  13
   12. Informative References  . . . . . . . . . . . . . . . . . . .  13
   Acknowledgements  . . . . . . . . . . . . . . . . . . . . . . . .  16
   Authors' Addresses  . . . . . . . . . . . . . . . . . . . . . . .  16
        
1. Introduction
1. はじめに

The Internet has been growing dramatically in terms of size, capacity, and accessibility in recent years. Communication requirements of distributed services and applications running on top of the Internet have become increasingly demanding. Some examples are real-time interactive video or financial trading. Providing such services involves stringent requirements in terms of acceptable latency, loss, and jitter.

近年、インターネットはサイズ、容量、およびアクセシビリティの面で劇的に成長しています。インターネット上で実行される分散サービスおよびアプリケーションの通信要件は、ますます厳しくなっています。いくつかの例は、リアルタイムのインタラクティブビデオや金融取引です。このようなサービスを提供するには、許容可能な遅延、損失、ジッターに関して厳しい要件が伴います。

Performance requirements lead to the articulation of Service Level Objectives (SLOs) that must be met. Those SLOs are part of Service Level Agreements (SLAs) that define a contract between the provider and the consumer of a service. SLOs, in effect, constitute a service-level guarantee that the consumer of the service can expect to receive (and often has to pay for). Likewise, the provider of a service needs to ensure that the service-level guarantee and associated SLOs are met. Some examples of clauses that relate to SLOs can be found in [RFC7297].

パフォーマンス要件は、満たす必要があるサービスレベル目標(SLO)の明確化につながります。これらのSLOは、サービスのプロバイダーとコンシューマー間の契約を定義するサービスレベルアグリーメント(SLA)の一部です。実際には、SLOは、サービスの消費者が受け取ることを期待できる(そしてしばしば代償を払わなければならない)というサービスレベルの保証を構成します。同様に、サービスのプロバイダーは、サービスレベルの保証と関連するSLOが満たされていることを確認する必要があります。 SLOに関連する条項のいくつかの例は、[RFC7297]にあります。

Violations of SLOs can be associated with significant financial loss, which can by divided into two categories. First, there is the loss that can be incurred by the user of a service when the agreed service levels are not provided. For example, a financial brokerage's stock orders might suffer losses when it is unable to execute stock transactions in a timely manner. An electronic retailer may lose customers when its online presence is perceived by customers as sluggish. An online gaming provider may not be able to provide fair access to online players, resulting in frustrated players who are lost as customers. In each case, the failure of a service provider to meet promised service-level guarantees can have a substantial financial impact on users of the service. Second, there is the loss that is incurred by the provider of a service who is unable to meet promised SLOs. Those losses can take several forms, such as penalties for violating the service level agreement and even loss of future revenue due to reduced customer satisfaction (which, in many cases, is more serious). Hence, SLOs are a key concern for the service provider. In order to ensure that SLOs are not being violated, service levels need to be continuously monitored at the network infrastructure layer in order to know, for example, when mitigating actions need to be taken. To that end, service-level measurements must take place.

SLOの違反は重大な経済的損失に関連する可能性があり、2つのカテゴリに分類できます。まず、合意されたサービスレベルが提供されない場合、サービスのユーザーが被る損失があります。たとえば、金融証券会社の株式注文は、株式取引をタイムリーに実行できない場合に損失を被る可能性があります。電子小売業者は、オンラインでの存在感が顧客によって鈍感であると認識されると、顧客を失う可能性があります。オンラインゲームプロバイダーは、オンラインプレーヤーに公正なアクセスを提供できない場合があり、顧客として失ったイライラしたプレーヤーが発生する可能性があります。いずれの場合も、サービスプロバイダーが約束されたサービスレベル保証を満たせないことは、サービスのユーザーに大きな経済的影響を与える可能性があります。第二に、約束されたSLOを満たすことができないサービスのプロバイダーが被る損失があります。これらの損失は、サービスレベルアグリーメントへの違反に対するペナルティや、顧客満足度の低下(多くの場合、より深刻なもの)による将来の収益の損失など、いくつかの形をとることがあります。したがって、SLOはサービスプロバイダーにとって重要な関心事です。 SLOが違反されていないことを確認するために、たとえば、軽減措置を講じる必要がある時期を知るために、ネットワークインフラストラクチャレイヤーでサービスレベルを継続的に監視する必要があります。そのためには、サービスレベルの測定を行う必要があります。

Network measurements can be performed using active or passive measurement techniques. In passive measurements, production traffic is observed, and no monitoring traffic is created by the measurement process itself. That is, network conditions are checked in a non-intrusive way. In the context of IP Flow Information Export (IPFIX), several documents were produced that define how to export data associated with flow records, i.e., data that is collected as part of passive measurement mechanisms, generally applied against flows of production traffic (e.g., [RFC7011]). In addition, it is possible to collect real data traffic (not just summarized flow records) with time-stamped packets, possibly sampled (e.g., per [RFC5474]), as a means of measuring and inferring service levels. Active measurements, on the other hand, are more intrusive to the network in the sense that they involve injecting synthetic test traffic into the network to measure network service levels, as opposed to simply observing production traffic. The IP Performance Metrics (IPPM) Working Group produced documents that describe active measurement mechanisms such as the One-Way Active Measurement Protocol (OWAMP) [RFC4656], the Two-Way Active Measurement Protocol (TWAMP) [RFC5357], and the Cisco Service-Level Assurance Protocol [RFC6812]. In addition, there are some mechanisms that do not cleanly fit into either active or passive categories, such as Performance and Diagnostic Metrics (PDM) Destination Option techniques [RFC8250].

ネットワーク測定は、アクティブまたはパッシブ測定手法を使用して実行できます。パッシブ測定では、実稼働トラフィックが観察され、測定プロセス自体によって監視トラフィックは作成されません。つまり、ネットワークの状態は、邪魔にならない方法でチェックされます。 IPフロー情報エクスポート(IPFIX)のコンテキストでは、フローレコードに関連するデータ、つまり、一般に生産トラフィックのフローに対して適用されるパッシブ測定メカニズムの一部として収集されるデータ(たとえば、 [RFC7011])。さらに、サービスレベルを測定および推論する手段として、(たとえば、[RFC5474]に従って)サンプリングされた可能性のあるタイムスタンプ付きパケットを使用して、(要約されたフローレコードだけでなく)実際のデータトラフィックを収集することができます。一方、アクティブな測定は、単純に本番トラフィックを観察するのではなく、ネットワークに合成テストトラフィックを注入してネットワークサービスレベルを測定するという意味で、ネットワークに対してより侵入的です。 IP Performance Metrics(IPPM)ワーキンググループは、One-Way Active Measurement Protocol(OWAMP)[RFC4656]、Two-Way Active Measurement Protocol(TWAMP)[RFC5357]、Cisco Serviceなどのアクティブな測定メカニズムを説明するドキュメントを作成しましたレベル保証プロトコル[RFC6812]。さらに、パフォーマンスおよび診断メトリック(PDM)宛先オプション手法[RFC8250]など、アクティブカテゴリまたはパッシブカテゴリのいずれにも完全に適合しないメカニズムがいくつかあります。

Active measurement mechanisms offer a high level of control over what and how to measure. They do not require inspecting production traffic. Because of this, active measurements usually offer better accuracy and privacy than passive measurement mechanisms. Traffic encryption and regulations that limit the amount of payload inspection that can occur are non-issues. Furthermore, active measurement mechanisms are able to detect end-to-end network performance problems in a fine-grained way (e.g., simulating the traffic that must be handled considering specific SLOs). As a result, active measurements are often preferred over passive measurement for SLA monitoring. Measurement probes must be hosted in network devices and measurement sessions must be activated to compute the current network metrics (for example, metrics such as the ones described in [RFC4148], although note that [RFC4148] was obsoleted by [RFC6248]). This activation should be dynamic in order to follow changes in network conditions, such as those related to routes being added or new customer demands.

アクティブな測定メカニズムにより、何をどのように測定するかを高度に制御できます。生産トラフィックを検査する必要はありません。このため、アクティブ測定では通常、パッシブ測定メカニズムよりも精度とプライバシーが向上します。発生する可能性があるペイロード検査の量を制限するトラフィックの暗号化と規制は問題ではありません。さらに、アクティブな測定メカニズムにより、エンドツーエンドのネットワークパフォーマンスの問題をきめ細かく検出できます(たとえば、特定のSLOを考慮して処理する必要のあるトラフィックのシミュレーション)。その結果、SLAモニタリングでは、アクティブ測定がパッシブ測定よりも優先されることがよくあります。現在のネットワークメトリックを計算するには、測定プローブをネットワークデバイスでホストし、測定セッションをアクティブにする必要があります(たとえば、[RFC4148]で説明されているものなどのメトリック。ただし、[RFC4148]は[RFC6248]に置き換えられていることに注意してください)。追加されるルートに関連するものや新しい顧客の要求など、ネットワークの状態の変化に対応するために、このアクティブ化は動的である必要があります。

While offering many advantages, active measurements are expensive in terms of network resource consumption. Active measurements generally involve measurement probes that generate synthetic test traffic that is directed at a responder. The responder needs to timestamp test traffic it receives and reflect it back to the originating measurement probe. The measurement probe subsequently processes the returned packets along with time-stamping information in order to compute service levels. Accordingly, active measurements consume substantial CPU cycles as well as memory of network devices to generate and process test traffic. In addition, synthetic traffic increases network load. Thus, active measurements compete for resources with other functions, including routing and switching.

アクティブ測定は多くの利点を提供しますが、ネットワークリソース消費の点でコストがかかります。アクティブ測定には、通常、レスポンダーに向けられた模擬テストトラフィックを生成する測定プローブが含まれます。レスポンダは、受信したテストトラフィックにタイムスタンプを付けて、元の測定プローブに反映する必要があります。その後、測定プローブは、サービスレベルを計算するために、返されたパケットとタイムスタンプ情報を処理します。したがって、アクティブな測定では、テストトラフィックを生成して処理するために、実質的なCPUサイクルとネットワークデバイスのメモリが消費されます。さらに、合成トラフィックはネットワーク負荷を増加させます。したがって、アクティブな測定は、ルーティングやスイッチングなどの他の機能とリソースを奪い合います。

The resources required and traffic generated by the active measurement sessions are, in a large part, a function of the number of measured network destinations. (In addition, the amount of traffic generated for each measurement plays a role that, in turn, influences the accuracy of the measurement.) When more destinations are measured, a greater number of resources are consumed and more traffic is needed to perform the measurements. Thus, to have better monitoring coverage, it is necessary to deploy more sessions, which consequently increases consumed resources. Otherwise, enabling the observation of just a small subset of all network flows can lead to insufficient coverage.

必要なリソースとアクティブな測定セッションによって生成されるトラフィックは、主に測定されたネットワーク宛先の数の関数です。 (さらに、各測定で生成されるトラフィックの量は、測定の精度に影響を与える役割を果たします。)より多くの宛先が測定されると、より多くのリソースが消費され、測定を実行するためにより多くのトラフィックが必要になります。したがって、より適切な監視カバレッジを実現するには、より多くのセッションを展開する必要があり、その結果、消費されるリソースが増加します。それ以外の場合、すべてのネットワークフローのごく一部の監視のみを有効にすると、カバレッジが不十分になる可能性があります。

Furthermore, while some end-to-end service levels can be determined by adding up the service levels observed across different path segments, the same is not true for all service levels. For example, the end-to-end delay or packet loss from a node A to a node C routed via a node B can often be computed simply by adding delays (or loss) from A to B and from B to C. This allows the decomposition of a large set of end-to-end measurements into a much smaller set of segment measurements. However, end-to-end jitter and mean opinion scores cannot be decomposed as easily and, for higher accuracy, must be measured end-to-end.

さらに、いくつかのエンドツーエンドのサービスレベルは、異なるパスセグメント全体で観察されたサービスレベルを合計することによって決定できますが、同じことがすべてのサービスレベルに当てはまるわけではありません。たとえば、ノードAからノードBを経由してルーティングされるノードCへのエンドツーエンドの遅延またはパケット損失は、AからBおよびBからCへの遅延(または損失)を追加するだけで計算できることがよくあります。これにより、エンドツーエンドの測定値の大きなセットを、はるかに小さなセグメント測定値のセットに分解。ただし、エンドツーエンドのジッターと平均オピニオンスコアは簡単には分解できないため、より正確にエンドツーエンドで測定する必要があります。

Hence, the decision about how to place measurement probes becomes an important management activity. The goal is to obtain the maximum benefits of service-level monitoring with a limited amount of measurement overhead. Specifically, the goal is to maximize the number of service-level violations that are detected with a limited number of resources.

したがって、測定プローブの配置方法に関する決定は、重要な管理アクティビティになります。目標は、限られた量の測定オーバ​​ーヘッドでサービスレベルモニタリングの最大のメリットを得ることにあります。具体的には、目標は、限られた数のリソースで検出されるサービスレベル違反の数を最大化することです。

The use case and the solution approach described in this document address an important practical issue. They are intended to provide a basis for further experimentation to lead to solutions for wider deployment. This document represents the consensus of the IRTF's Network Management Research Group (NMRG). It was discussed extensively and received three separate in-depth reviews.

このドキュメントで説明されているユースケースとソリューションアプローチは、重要な実際的な問題に対処しています。これらは、さらなる実験の基盤を提供して、より広範な展開のためのソリューションに導くことを目的としています。このドキュメントは、IRTFのネットワーク管理研究グループ(NMRG)の合意を表します。それは広範囲にわたって議論され、3つの個別の詳細なレビューを受けました。

2. Definitions and Acronyms
2. 定義と頭字語

Active Measurements: Techniques to measure service levels that involve generating and observing synthetic test traffic

アクティブ測定:模擬テストトラフィックの生成と監視を含むサービスレベルを測定する手法

Passive Measurements: Techniques used to measure service levels based on observation of production traffic

パッシブ測定:生産トラフィックの観測に基づいてサービスレベルを測定するために使用される手法

Autonomic Network: A network containing exclusively autonomic nodes, requiring no configuration, and deriving all required information through self-knowledge, discovery, or intent.

自律型ネットワーク:自律型ノードのみを含み、構成を必要とせず、自己認識、発見、または意図を介して必要なすべての情報を導出するネットワーク。

Autonomic Service Agent (ASA): An agent implemented on an autonomic node that implements an autonomic function, either in part (in the case of a distributed function, as in the context of this document) or whole

オートノミックサービスエージェント(ASA):オートノミック機能を実装するオートノミックノードに実装されたエージェント。一部(このドキュメントのコンテキストでは、分散機能の場合)または全体

Measurement Session: A communications association between a probe and a responder used to send and reflect synthetic test traffic for active measurements

測定セッション:アクティブな測定用の模擬テストトラフィックを送信および反映するために使用される、プローブとレスポンダー間の通信アソシエーション

Probe: The source of synthetic test traffic in an active measurement

プローブ:アクティブな測定における模擬テストトラフィックのソース

Responder: The destination for synthetic test traffic in an active measurement

レスポンダ:アクティブな測定での模擬テストトラフィックの宛先

SLA: Service Level Agreement

SLA:サービスレベルアグリーメント

SLO: Service Level Objective

SLO:サービスレベル目標

P2P: Peer-to-Peer

P2P:ピアツーピア

(Note: The definitions for "Autonomic Network" and "Autonomic Service Agent" are borrowed from [RFC7575]).

(注:「オートノミックネットワーク」と「オートノミックサービスエージェント」の定義は、[RFC7575]から借用したものです)。

3. Current Approaches
3. 現在のアプローチ

For feasible deployments of active measurement solutions to distribute the available measurement sessions along the network, the current best practice consists of relying entirely on the human administrator's expertise to infer the best location to activate such sessions. This is done through several steps. First, it is necessary to collect traffic information in order to grasp the traffic matrix. Then, the administrator uses this information to infer the best destinations for measurement sessions. After that, the administrator activates sessions on the chosen subset of destinations, taking the available resources into account. This practice, however, does not scale well because it is still labor intensive and error-prone for the administrator to determine which sessions should be activated given the set of critical flows that needs to be measured. Even worse, this practice completely fails in networks where the most critical flows change rapidly, resulting in dynamic changes to what would be the most important destinations. For example, this can be the case in modern cloud environments. This is because fast reactions are necessary to reconfigure the sessions, and administrators are just not quick enough in computing and activating the new set of required sessions every time the network traffic pattern changes. Finally, the current practice for active measurements usually covers only a fraction of the network flows that should be observed, which invariably leads to the damaging consequence of undetected SLA violations.

アクティブな測定ソリューションを適切に展開して、利用可能な測定セッションをネットワーク上で分散させる場合、現在のベストプラクティスは、人間の管理者の専門知識に完全に依存して、そのようなセッションをアクティブにする最適な場所を推測することです。これは、いくつかの手順で行われます。まず、交通マトリックスを把握するためには、交通情報を収集する必要があります。次に、管理者はこの情報を使用して、測定セッションに最適な宛先を推測します。その後、管理者は使用可能なリソースを考慮して、選択した宛先のサブセットでセッションをアクティブ化します。ただし、測定が必要な一連の重要なフローを考慮して、アクティブ化するセッションを管理者が決定するのは依然として労働集約的でエラーが発生しやすいため、この方法はうまく拡張できません。さらに悪いことに、この手法は、最も重要なフローが急速に変化するネットワークでは完全に失敗し、その結果、最も重要な宛先となるものに動的な変化が生じます。たとえば、最近のクラウド環境ではこれが当てはまる場合があります。これは、セッションを再構成するには高速な対応が必要であり、管理者はネットワークトラフィックパターンが変化するたびに必要な新しいセッションのセットを計算してアクティブ化するのに十分な速さがないためです。最後に、アクティブ測定の現在の慣行は通常、監視する必要があるネットワークフローのほんの一部しかカバーしていないため、SLA違反が検出されずに有害な結果を招くことがあります。

4. Use Case Description
4. ユースケースの説明

The use case involves a service-level provider that needs to monitor the network to detect service-level violations using active service-level measurements and wants to be able to do so with minimal human intervention. The goal is to conduct the measurements in an effective manner to maximize the percentage of detected service-level violations. The service-level provider has a bounded resource budget with regard to measurements that can be performed, specifically the number of measurements that can be conducted concurrently from any one network device and possibly the total amount of measurement traffic on the network. However, while at any one point in time the number of measurements conducted is limited, it is possible for a device to change which destinations to measure over time. This can be exploited to achieve a balance of eventually covering all possible destinations using a reasonable amount of "sampling" where measurement coverage of a destination cannot be continuous. The solution needs to be dynamic and able to cope with network conditions that may change over time. The solution should also be embeddable inside network devices that control the deployment of active measurement mechanisms.

ユースケースには、アクティブなサービスレベル測定を使用してサービスレベル違反を検出するためにネットワークを監視する必要があり、最小限の人間の介入でそれを実行できるようにしたいサービスレベルプロバイダーが含まれます。目標は、効果的な方法で測定を行い、検出されたサービスレベル違反の割合を最大化することです。サービスレベルプロバイダーには、実行可能な測定、特に1つのネットワークデバイスから同時に実行できる測定の数、および場合によってはネットワーク上の測定トラフィックの総量に関して、限られたリソースバジェットがあります。ただし、任意の時点で実行される測定の数は限られていますが、デバイスは測定する宛先を時間の経過とともに変更することができます。これは、宛先の測定カバレッジが連続的でない場合に、妥当な量の「サンプリング」を使用して、最終的にすべての可能な宛先をカバーするバランスを達成するために利用できます。ソリューションは動的であり、時間とともに変化する可能性のあるネットワーク条件に対処できる必要があります。このソリューションは、アクティブな測定メカニズムの展開を制御するネットワークデバイスの内部に埋め込むこともできます。

The goal is to conduct the measurements in a smart manner that ensures that the network is broadly covered and that the likelihood of detecting service-level violations is maximized. In order to maximize that likelihood, it is reasonable to focus measurement resources on destinations that are more likely to incur a violation, while spending fewer resources on destinations that are more likely to be in compliance. In order to do this, there are various aspects that can be exploited, including past measurements (destinations close to a service-level threshold requiring more focus than destinations farther from it), complementation with passive measurements such as flow data (to identify network destinations that are currently popular and critical), and observations from other parts of the network. In addition, measurements can be coordinated among different network devices to avoid hitting the same destination at the same time and to share results that may be useful in future probe placement.

目標は、ネットワークが広くカバーされ、サービスレベル違反を検出する可能性が最大化されることを保証するスマートな方法で測定を行うことです。その可能性を最大化するために、違反が発生する可能性が高い宛先に測定リソースを集中させる一方で、準拠している可能性が高い宛先に費やすリソースを少なくすることは妥当です。これを行うには、過去の測定値(サービスレベルのしきい値に近い宛先と、それより遠い宛先よりも多くの焦点を必要とする宛先)、フローデータなどのパッシブ測定(ネットワークの宛先を識別するため)の補完など、活用できるさまざまな側面があります。現在人気があり、批判的です)、ネットワークの他の部分からの観察。さらに、異なるネットワークデバイス間で測定を調整して、同じ宛先に同時に到達することを回避し、将来のプローブ配置に役立つ可能性のある結果を共有できます。

Clearly, static solutions will have severe limitations. At the same time, human administrators cannot be in the loop for continuous dynamic reconfigurations of measurement probes. Thus, an automated solution, or ideally an autonomic solution, is needed so that network measurements are automatically orchestrated and dynamically reconfigured from within the network. This can be accomplished using an autonomic solution that is distributed, using ASAs that are implemented on nodes in the network.

明らかに、静的ソリューションには厳しい制限があります。同時に、人間の管理者は、測定プローブの継続的な動的再構成のループに入ることができません。したがって、ネットワーク測定がネットワーク内から自動的に調整され、動的に再構成されるように、自動化ソリューション、または理想的にはオートノミックソリューションが必要です。これは、ネットワーク内のノードに実装されているASAを使用して、分散された自律型ソリューションを使用して実現できます。

5. A Distributed Autonomic Solution
5. 分散型オートノミックソリューション

The use of Autonomic Networking (AN) [RFC7575] can help such detection through an efficient activation of measurement sessions. Such an approach, along with a detailed assessment confirming its viability, is described in [P2PBNM-Nobre-2012]. The problem to be solved by AN in the present use case is how to steer the process of measurement session activation by a complete solution that sets all necessary parameters for this activation to operate efficiently, reliably, and securely, with no required human intervention other than setting overall policy.

オートノミックネットワーキング(AN)[RFC7575]を使用すると、測定セッションを効率的にアクティブ化することで、このような検出を支援できます。そのようなアプローチは、その実行可能性を確認する詳細な評価とともに、[P2PBNM-Nobre-2012]で説明されています。現在のユースケースでANが解決する問題は、このアクティブ化に必要なすべてのパラメーターを設定して測定セッションのアクティブ化のプロセスを操作し、このアクティブ化に必要なすべてのパラメーターを効率的、確実、かつ安全に操作して、人間以外の人が介入する必要がない方法です。全体的なポリシーの設定。

When a node first comes online, it has no information about which measurements are more critical than others. In the absence of information about past measurements and information from measurement peers, it may start with an initial set of measurement sessions, possibly randomly seeding a set of starter measurements and perhaps taking a round-robin approach for subsequent measurement rounds. However, as measurements are collected, a node will gain an increasing amount of information that it can utilize to refine its strategy of selecting measurement targets going forward. For one, it may take note of which targets returned measurement results very close to service-level thresholds; these targets may require closer scrutiny compared to others. Second, it may utilize observations that are made by its measurement peers in order to conclude which measurement targets may be more critical than others and to ensure that proper overall measurement coverage is obtained (so that not every node incidentally measures the same targets, while other targets are not measured at all).

ノードが最初にオンラインになったとき、どの測定が他よりも重要であるかについての情報はありません。過去の測定に関する情報や測定ピアからの情報がない場合は、最初の測定セッションのセットから開始し、場合によっては一連のスターター測定値をランダムにシードし、その後の測定ラウンドでラウンドロビンアプローチを取る可能性があります。ただし、測定値が収集されると、ノードはますます多くの情報を取得して、今後測定対象を選択する戦略を洗練するために利用できます。 1つは、サービスレベルのしきい値に非常に近い測定結果を返したターゲットに注意することです。これらのターゲットは、他のターゲットと比較してより綿密な調査が必要になる場合があります。第二に、測定ピアが他の測定ターゲットよりも重要であると結論付け、適切な全体的な測定カバレッジが確実に得られるようにするために、測定ピアによって行われた観測を利用することができます(すべてのノードが偶然同じターゲットを測定するのではなく、ターゲットはまったく測定されません)。

We advocate for embedding P2P technology in network devices in order to use autonomic control loops to make decisions about measurement sessions.

自律制御ループを使用して測定セッションに関する決定を行うために、ネットワークデバイスにP2Pテクノロジーを埋め込むことを推奨します。

Specifically, we advocate for network devices to implement an autonomic function that monitors service levels for violations of SLOs and that determines which measurement sessions to set up at any given point in time based on current and past observations of the node and of other peer nodes.

具体的には、SLOの違反のサービスレベルを監視し、ノードおよび他のピアノードの現在および過去の観測に基づいて、任意の時点で設定する測定セッションを決定するオートノミック機能を実装するネットワークデバイスを推奨します。

By performing these functions locally and autonomically on the device itself, which measurements to conduct can be modified quickly based on local observations while taking local resource availability into account. This allows a solution to be more robust and react more dynamically to rapidly changing service levels than a solution that has to rely on central coordination. However, in order to optimize decisions about which measurements to conduct, a node will need to communicate with other nodes. This allows a node to take into account other nodes' observations in addition to its own in its decisions.

これらの機能をデバイス自体でローカルかつ自律的に実行することにより、実行する測定を、ローカルのリソースの可用性を考慮しながら、ローカルの観測に基づいてすばやく変更できます。これにより、中央の調整に依存する必要のあるソリューションよりも、ソリューションがより堅牢になり、急速に変化するサービスレベルに動的に対応できるようになります。ただし、実行する測定に関する決定を最適化するために、ノードは他のノードと通信する必要があります。これにより、ノードは自身の決定に加えて、他のノードの観測を考慮することができます。

For example, remote destinations whose observed service levels are on the verge of violating stated objectives may require closer monitoring than remote destinations that are comfortably within a range of tolerance. A distributed autonomic solution also allows nodes to coordinate their probing decisions to collectively achieve the best possible measurement coverage. Because the number of resources available for monitoring, exchanging measurement data, and coordinating with other nodes is limited, a node may be interested in identifying other nodes whose observations are similar to and correlated with its own. This helps a node prioritize and decide which other nodes to coordinate and exchange data with. All of this requires the use of a P2P overlay.

たとえば、監視されたサービスレベルが指定された目的に違反する寸前のリモート宛先は、許容範囲内で快適なリモート宛先よりも綿密な監視を必要とする場合があります。分散型オートノミックソリューションでは、ノードがプロービングの決定を調整して、可能な限り最高の測定カバレッジを集合的に実現することもできます。監視、測定データの交換、および他のノードとの調整に使用できるリソースの数は限られているため、ノードは、自身の観測に類似しており、それと相関する他のノードを特定することに関心を持つ場合があります。これは、ノードが優先順位を付け、データを調整および交換する他のノードを決定するのに役立ちます。これにはすべて、P2Pオーバーレイを使用する必要があります。

A P2P overlay is essential for several reasons:

P2Pオーバーレイはいくつかの理由で不可欠です。

o It makes it possible for nodes (or more specifically, the ASAs that are deployed on those nodes) in the network to autonomically set up measurement sessions without having to rely on a central management system or controller to perform configuration operations associated with configuring measurement probes and responders.

o ネットワーク内のノード(より具体的には、それらのノードに展開されているASA)が、中央管理システムまたはコントローラーに依存して測定プローブの構成に関連する構成操作を実行する必要なく、測定セッションを自律的にセットアップすることが可能になります。レスポンダー。

o It facilitates the exchange of data between different nodes to share measurement results so that each node can refine its measurement strategy based not just on its own observations, but also on observations from its peers.

o 異なるノード間でデータを交換して測定結果を共有し、各ノードが自身の観測だけでなく、ピアからの観測にも基づいて測定戦略を改善できるようにします。

o It allows nodes to coordinate their measurements to obtain the best possible test coverage and avoid measurements that have a very low likelihood of detecting service-level violations.

o これにより、ノードは測定を調整して、可能な限り最高のテストカバレッジを取得し、サービスレベル違反を検出する可能性が非常に低い測定を回避できます。

The provisioning of the P2P overlay should be transparent for the network administrator. An Autonomic Control Plane such as defined in [ACP] provides an ideal candidate for the P2P overlay to run on.

P2Pオーバーレイのプロビジョニングは、ネットワーク管理者にとって透過的である必要があります。 [ACP]で定義されているような自律制御プレーンは、P2Pオーバーレイを実行するための理想的な候補を提供します。

An autonomic solution for the distributed detection of SLA violations provides several benefits. First, it provides efficiency; this solution should optimize the resource consumption and avoid resource starvation on the network devices. A device that is "self-aware" of its available resources will be able to adjust measurement activities rapidly as needed, without requiring a separate control loop involving resource monitoring by an external system. Second, placing logic about where to conduct measurements into the node enables rapid control loops that allow devices to react instantly to observations and adjust their measurement strategy. For example, a device could decide to adjust the amount of synthetic test traffic being sent during the measurement itself depending on results observed so far on this and other concurrent measurement sessions. As a result, the solution could decrease the time necessary to detect SLA violations. Adaptivity features of an autonomic loop could capture the network dynamics faster than a human administrator or even a central controller. Finally, the solution could help to reduce the workload of human administrators.

SLA違反の分散検出のためのオートノミックソリューションには、いくつかの利点があります。まず、効率が向上します。このソリューションは、リソース消費を最適化し、ネットワークデバイスのリソース不足を回避する必要があります。利用可能なリソースを「自己認識」しているデバイスは、外部システムによるリソース監視を伴う個別の制御ループを必要とせずに、必要に応じて測定アクティビティを迅速に調整できます。次に、ノードのどこに測定を行うかに関するロジックを配置することで、デバイスが観測に即座に反応して測定戦略を調整できるようにする高速制御ループが可能になります。たとえば、デバイスは、このセッションおよび他の同時測定セッションでこれまでに観察された結果に応じて、測定中に送信される模擬テストトラフィックの量を調整することを決定できます。その結果、ソリューションはSLA違反の検出に必要な時間を短縮できます。オートノミックループのアダプティビティ機能は、人間の管理者や中央コントローラーよりも速くネットワークダイナミクスをキャプチャできます。最後に、このソリューションは、管理者の作業負荷を軽減するのに役立ちます。

In practice, these factors combine to maximize the likelihood of SLA violations being detected while operating within a given resource budget, allowing a continuous measurement strategy that takes into account past measurement results to be conducted, observations of other measures such as link utilization or flow data, measurement results shared between network devices, and future measurement activities coordinated among nodes. Combined, this can result in efficient measurement decisions that achieve a golden balance between offering broad network coverage and honing in on service-level "hot spots".

実際には、これらの要因が組み合わさって、特定のリソースバジェット内で動作しているときにSLA違反が検出される可能性を最大化し、過去の測定結果、リンク使用率やフローデータなどの他の測定の観測を考慮した継続的な測定戦略を可能にします、ネットワークデバイス間で共有される測定結果、ノード間で調整される将来の測定アクティビティ。これを組み合わせると、効率的な測定結果が得られ、幅広いネットワークカバレッジの提供とサービスレベルの「ホットスポット」への適合との間の絶妙なバランスが得られます。

6. Intended User Experience
6. 意図したユーザーエクスペリエンス

The autonomic solution should not require any human intervention in the distributed detection of SLA violations. By virtue of the solution being autonomic, human users will not have to plan which measurements to conduct in a network, which is often a very labor-intensive task that requires detailed analysis of traffic matrices and network topologies and is not prone to easy dynamic adjustment. Likewise, they will not have to configure measurement probes and responders.

オートノミックソリューションは、SLA違反の分散型検出に人間の介入を必要としません。ソリューションがオートノミックであるため、人間のユーザーはネットワークで実行する測定を計画する必要がなくなります。これは、多くの場合非常に労働集約的なタスクであり、トラフィックマトリックスとネットワークトポロジの詳細な分析が必要であり、簡単に動的に調整する傾向がありません。 。同様に、測定プローブとレスポンダを構成する必要もありません。

There are some ways in which a human administrator may still interact with the solution. First, the human administrator will, of course, be notified and obtain reports about service-level violations that are observed. Second, a human administrator may set policies regarding how closely to monitor the network for service-level violations and how many resources to spend. For example, an administrator may set a resource budget that is assigned to network devices for measurement operations. With that given budget, the number of SLO violations that are detected will be maximized. Alternatively, an administrator may set a target for the percentage of SLO violations that must be detected, i.e., a target for the ratio between the number of detected SLO violations and the number of total SLO violations that are actually occurring (some of which might go undetected). In that case, the solution will aim to minimize the resources spent (i.e., the amount of test traffic and number of measurement sessions) that are required to achieve that target.

人間の管理者がソリューションと対話する方法はいくつかあります。最初に、もちろん、人間の管理者は通知を受け、監視されているサービスレベル違反に関するレポートを取得します。第二に、人間の管理者は、サービスレベル違反についてネットワークをどの程度注意深く監視するか、および費やすリソースの数に関するポリシーを設定できます。たとえば、管理者は、測定操作のためにネットワークデバイスに割り当てられるリソースバジェットを設定できます。その所定の予算で、検出されるSLO違反の数は最大化されます。または、管理者は、検出する必要があるSLO違反のパーセンテージの目標を設定することもできます。つまり、検出されたSLO違反の数と実際に発生しているSLO違反の総数の比率の目標を設定できます(一部は発生する可能性があります)未検出)。その場合、ソリューションは、その目標を達成するために必要なリソース(つまり、テストトラフィックの量と測定セッションの数)を最小限に抑えることを目的としています。

7. Implementation Considerations
7. 実装に関する考慮事項

The active measurement model assumes that a typical infrastructure will have multiple network segments, multiple Autonomous Systems (ASes), and a reasonably large number of routers. It also considers that multiple SLOs can be in place at a given time. Since interoperability in a heterogeneous network is a goal, features found on different active measurement mechanisms (e.g., OWAMP, TWAMP, and Cisco Service Level Assurance Protocol) and device programmability interfaces (such as Juniper's Junos API or Cisco's Embedded Event Manager) could be used for the implementation. The autonomic solution should include and/or reference specific algorithms, protocols, metrics, and technologies for the implementation of distributed detection of SLA violations as a whole.

アクティブな測定モデルでは、一般的なインフラストラクチャに複数のネットワークセグメント、複数の自律システム(AS)、およびかなり多数のルーターがあると想定しています。また、同時に複数のSLOを配置できることも考慮しています。異機種混在ネットワークでの相互運用性が目標であるため、さまざまなアクティブな測定メカニズム(OWAMP、TWAMP、Cisco Service Level Assurance Protocolなど)およびデバイスプログラマビリティインターフェイス(JuniperのJunos APIやCiscoのEmbedded Event Managerなど)にある機能を使用できます実装のため。オートノミックソリューションは、SLA違反全体の分散検出を実装するための特定のアルゴリズム、プロトコル、メトリック、およびテクノロジーを含むか、参照する必要があります。

Finally, it should be noted that there are multiple deployment scenarios, including deployment scenarios that involve physical devices hosting autonomic functions or virtualized infrastructure hosting the same. Co-deployment in conjunction with Virtual Network Functions (VNFs) is a possibility for further study.

最後に、オートノミック機能をホストする物理デバイスまたはそれをホストする仮想化インフラストラクチャを含むデプロイメントシナリオを含む、複数のデプロイメントシナリオがあることに注意してください。仮想ネットワーク機能(VNF)と組み合わせた共同展開は、今後の調​​査の可能性です。

7.1. Device-Based Self-Knowledge and Decisions
7.1. デバイスベースの自己認識と決定

Each device has self-knowledge about the local SLA monitoring. This could be in the form of historical measurement data and SLOs. Besides that, the devices would have algorithms that could decide which probes should be activated at a given time. The choice of which algorithm is better for a specific situation would be also autonomic.

各デバイスには、ローカルSLAモニタリングに関する自己認識があります。これは、過去の測定データとSLOの形式である可能性があります。さらに、デバイスには、特定の時間にアクティブ化するプローブを決定できるアルゴリズムがあります。特定の状況に適したアルゴリズムの選択も自律的です。

7.2. Interaction with Other Devices
7.2. 他のデバイスとの相互作用

Network devices should share information about service-level measurement results. This information can speed up the detection of SLA violations and increase the number of detected SLA violations. For example, if one device detects that a remote destination is in danger of violating an SLO, other devices may conduct additional measurements to the same destination or other destinations in its proximity. For any given network device, the exchange of data may be more important with some devices (for example, devices in the same network neighborhood or devices that are "correlated" by some other means) than with others. Defining the network devices that exchange measurement data (i.e., management peers) creates a new topology. Different approaches could be used to define this topology (e.g., correlated peers [P2PBNM-Nobre-2012]). To bootstrap peer selection, each device should use its known neighbors (e.g., FIB and RIB tables) as initial seeds to identify possible peers. It should be noted that a solution will benefit if topology information and network discovery functions are provided by the underlying autonomic framework. A solution will need to be able to discover measurement peers as well as measurement targets, specifically measurement targets that support active measurement responders and that will be able to respond to measurement requests and reflect measurement traffic as needed.

ネットワークデバイスは、サービスレベルの測定結果に関する情報を共有する必要があります。この情報により、SLA違反の検出を高速化し、検出されるSLA違反の数を増やすことができます。たとえば、1つのデバイスがリモート宛先がSLOに違反する危険があることを検出した場合、他のデバイスが同じ宛先またはその近くにある他の宛先に対して追加の測定を実行する可能性があります。特定のネットワークデバイスの場合、データの交換は、他のデバイスよりも、一部のデバイス(たとえば、同じネットワーク近隣内のデバイス、または他の何らかの方法で「相関」しているデバイス)の方が重要な場合があります。測定データを交換するネットワークデバイス(管理ピアなど)を定義すると、新しいトポロジが作成されます。このトポロジを定義するには、さまざまなアプローチを使用できます(たとえば、相関ピア[P2PBNM-Nobre-2012])。ピア選択をブートストラップするには、各デバイスは既知のネイバー(FIBテーブルやRIBテーブルなど)を初期シードとして使用して、可能なピアを識別します。トポロジ情報とネットワーク検出機能が、基礎となるオートノミックフレームワークによって提供されている場合、ソリューションはメリットがあることに注意してください。ソリューションは、測定ピアだけでなく測定ターゲット、特にアクティブな測定レスポンダをサポートし、測定要求に応答し、必要に応じて測定トラフィックを反映できる測定ターゲットを検出できる必要があります。

8. Comparison with Current Solutions
8. 現在のソリューションとの比較

There is no standardized solution for distributed autonomic detection of SLA violations. Current solutions are restricted to ad hoc scripts running on a per-node fashion to automate some administrator actions. There are some proposals for passive probe activation (e.g., DECON [DECON] and CSAMP [CSAMP]), but these do not focus on autonomic features.

SLA違反の分散型自律検出のための標準化されたソリューションはありません。現在のソリューションは、一部の管理者アクションを自動化するためにノードごとに実行されるアドホックスクリプトに制限されています。パッシブプローブのアクティブ化に関する提案はいくつかありますが(DECON [DECON]やCSAMP [CSAMP]など)、これらはオートノミック機能に焦点を当てていません。

9. 関連IETF作業

This section discusses related IETF work and is provided for reference. This section is not exhaustive; rather, it provides an overview of the various initiatives and how they relate to autonomic distributed detection of SLA violations.

このセクションでは、関連するIETFの作業について説明し、参照用に提供されています。このセクションは完全ではありません。むしろ、さまざまなイニシアチブの概要と、それらがSLA違反の自律分散検出にどのように関係するかを示しています。

1. LMAP: The Large-Scale Measurement of Broadband Performance Working Group standardizes the LMAP measurement system for performance management of broadband access devices. The autonomic solution could be relevant to LMAP because it deploys measurement probes and could be used for screening for SLA violations. Besides that, a solution to decrease the workload of human administrators in service providers is probably highly desirable.

1. LMAP:ブロードバンドパフォーマンスの大規模測定ワーキンググループは、ブロードバンドアクセスデバイスのパフォーマンス管理用にLMAP測定システムを標準化しています。オートノミックソリューションは、測定プローブを展開し、SLA違反のスクリーニングに使用できるため、LMAPに関連している可能性があります。それ以外にも、サービスプロバイダーの人間の管理者の作業負荷を軽減するソリューションが非常に望ましいでしょう。

2. IPFIX: IP Flow Information Export (IPFIX) Working Group (now concluded) aimed to standardize IP flows (i.e., netflows). IPFIX uses measurement probes (i.e., metering exporters) to gather flow data. In this context, the autonomic solution for the activation of active measurement probes could possibly be extended to also address passive measurement probes. Besides that, flow information could be used in making decisions regarding probe activation.

2. IPFIX:IPフロー(つまり、ネットフロー)を標準化することを目的としたIPフロー情報エクスポート(IPFIX)ワーキンググループ(現在は結論)。 IPFIXは測定プローブ(つまり、メータリングエクスポーター)を使用してフローデータを収集します。このコンテキストでは、アクティブな測定プローブをアクティブにするためのオートノミックソリューションを拡張して、パッシブな測定プローブにも対応することができます。その上、フロー情報は、プローブのアクティブ化に関する決定を行う際に使用できます。

3. ALTO: The Application-Layer Traffic Optimization Working Group aims to provide topological information at a higher abstraction layer, which can be based upon network policy, and with application-relevant service functions located in it. Their work could be leveraged to define the topology for network devices that exchange measurement data.

3. ALTO:アプリケーションレイヤートラフィック最適化ワーキンググループは、ネットワークポリシーに基づいて、アプリケーション関連のサービス機能を配置することで、より高い抽象化レイヤーでトポロジー情報を提供することを目的としています。彼らの作業を活用して、測定データを交換するネットワークデバイスのトポロジを定義できます。

10. IANA Considerations
10. IANAに関する考慮事項

This document has no IANA actions.

このドキュメントにはIANAアクションはありません。

11. Security Considerations
11. セキュリティに関する考慮事項

The security of this solution hinges on the security of the network underlay, i.e., the Autonomic Control Plane. If the Autonomic Control Plane were to be compromised, an attacker could undermine the effectiveness of measurement coordination by reporting fraudulent measurement results to peers. This would cause measurement probes to be deployed in an ineffective manner that would increase the likelihood that violations of SLOs go undetected.

このソリューションのセキュリティは、ネットワークアンダーレイ、つまりオートノミックコントロールプレーンのセキュリティにかかっています。オートノミックコントロールプレーンが侵害された場合、攻撃者は不正な測定結果をピアに報告することにより、測定の調整の有効性を損なう可能性があります。これにより、測定プローブが非効率的な方法で展開され、SLOの違反が検出されなくなる可能性が高くなります。

Likewise, the security of the solution hinges on the security of the deployment mechanism for autonomic functions (in this case, the autonomic function that conducts the service-level measurements). If an attacker were able to hijack an autonomic function, it could try to exhaust or exceed the resources that should be spent on autonomic measurements in order to deplete network resources, including network bandwidth due to higher-than-necessary volumes of synthetic test traffic generated by measurement probes. Again, it could also lead to reporting of misleading results; among other things, this could result in non-optimal selection of measurement targets and, in turn, an increase in the likelihood that service-level violations go undetected.

同様に、ソリューションのセキュリティは、オートノミック機能(この場合は、サービスレベルの測定を行うオートノミック機能)のデプロイメントメカニズムのセキュリティにかかっています。攻撃者がオートノミック機能をハイジャックできた場合、生成された合成テストトラフィックが必要以上に多いためにネットワーク帯域幅を含む、ネットワークリソースを使い果たすために、オートノミック測定に費やすべきリソースを使い果たしたり超えたりする可能性があります。測定プローブによる。この場合も、誤解を招く結果が報告される可能性があります。特に、これにより測定ターゲットの選択が最適でなくなり、サービスレベル違反が検出されなくなる可能性が高まります。

12. Informative References
12. 参考引用

[ACP] Eckert, T., Ed., Behringer, M., Ed., and S. Bjarnason, "An Autonomic Control Plane (ACP)", Work in Progress, draft-ietf-anima-autonomic-control-plane-13, December 2017.

[ACP] Eckert、T.、Ed。、Behringer、M.、Ed。、およびS. Bjarnason、「An Autonomic Control Plane(ACP)」、Work in Progress、draft-ietf-anima-autonomic-control-plane- 2017年12月13日。

[CSAMP] Sekar, V., Reiter, M., Willinger, W., Zhang, H., Kompella, R., and D. Andersen, "CSAMP: A System for Network-Wide Flow Monitoring", NSDI USENIX Symposium Networked Systems Design and Implementation, April 2008.

[CSAMP] Sekar、V.、Reiter、M.、Willinger、W.、Zhang、H.、Kompella、R。、およびD. Andersen、「CSAMP:A System for Network-Wide Monitoring Monitoring」、NSDI USENIX Symposium Networkedシステムの設計と実装、2008年4月。

[DECON] di Pietro, A., Huici, F., Costantini, D., and S. Niccolini, "DECON: Decentralized Coordination for Large-Scale Flow Monitoring", IEEE INFOCOM Workshops, DOI 10.1109/INFCOMW.2010.5466642, March 2010.

[DECON] di Pietro、A.、Huici、F.、Costantini、D。、およびS. Niccolini、「DECON:Decentralized Coordination for Large-scale Flow Monitoring」、IEEE INFOCOM Workshops、DOI 10.1109 / INFCOMW.2010.5466642、March 2010 。

[P2PBNM-Nobre-2012] Nobre, J., Granville, L., Clemm, A., and A. Gonzalez Prieto, "Decentralized Detection of SLA Violations Using P2P Technology, 8th International Conference Network and Service Management (CNSM)", 8th International Conference on Network and Service Management (CNSM), 2012, <http://ieeexplore.ieee.org/xpls/ abs_all.jsp?arnumber=6379997>.

[P2PBNM-Nobre-2012] Nobre、J.、Granville、L.、Clemm、A。、およびA. Gonzalez Prieto、「P2Pテクノロジーを使用したSLA違反の分散型検出、第8回国際会議ネットワークおよびサービス管理(CNSM)」、第8回ネットワークおよびサービス管理に関する国際会議(CNSM)、2012年、<http://ieeexplore.ieee.org/xpls/ abs_all.jsp?arnumber = 6379997>。

[RFC4148] Stephan, E., "IP Performance Metrics (IPPM) Metrics Registry", BCP 108, RFC 4148, DOI 10.17487/RFC4148, August 2005, <https://www.rfc-editor.org/info/rfc4148>.

[RFC4148] Stephan、E。、「IP Performance Metrics(IPPM)Metrics Registry」、BCP 108、RFC 4148、DOI 10.17487 / RFC4148、2005年8月、<https://www.rfc-editor.org/info/rfc4148> 。

[RFC4656] Shalunov, S., Teitelbaum, B., Karp, A., Boote, J., and M. Zekauskas, "A One-way Active Measurement Protocol (OWAMP)", RFC 4656, DOI 10.17487/RFC4656, September 2006, <https://www.rfc-editor.org/info/rfc4656>.

[RFC4656] Shalunov、S.、Teitelbaum、B.、Karp、A.、Boote、J。、およびM. Zekauskas、「A One-way Active Measurement Protocol(OWAMP)」、RFC 4656、DOI 10.17487 / RFC4656、9月2006、<https://www.rfc-editor.org/info/rfc4656>。

[RFC5357] Hedayat, K., Krzanowski, R., Morton, A., Yum, K., and J. Babiarz, "A Two-Way Active Measurement Protocol (TWAMP)", RFC 5357, DOI 10.17487/RFC5357, October 2008, <https://www.rfc-editor.org/info/rfc5357>.

[RFC5357] Hedayat、K.、Krzanowski、R.、Morton、A.、Yum、K。、およびJ. Babiarz、「A Two-Way Active Measurement Protocol(TWAMP)」、RFC 5357、DOI 10.17487 / RFC5357、10月2008、<https://www.rfc-editor.org/info/rfc5357>。

[RFC5474] Duffield, N., Ed., Chiou, D., Claise, B., Greenberg, A., Grossglauser, M., and J. Rexford, "A Framework for Packet Selection and Reporting", RFC 5474, DOI 10.17487/RFC5474, March 2009, <https://www.rfc-editor.org/info/rfc5474>.

[RFC5474] Duffield、N.、Ed。、Chiou、D.、Claise、B.、Greenberg、A.、Grossglauser、M。、およびJ. Rexford、「A Framework for Packet Selection and Reporting」、RFC 5474、DOI 10.17487 / RFC5474、2009年3月、<https://www.rfc-editor.org/info/rfc5474>。

[RFC6248] Morton, A., "RFC 4148 and the IP Performance Metrics (IPPM) Registry of Metrics Are Obsolete", RFC 6248, DOI 10.17487/RFC6248, April 2011, <https://www.rfc-editor.org/info/rfc6248>.

[RFC6248] Morton、A。、「RFC 4148およびIP Performance Metrics(IPPM)Registry of Metricsは廃止されました」、RFC 6248、DOI 10.17487 / RFC6248、2011年4月、<https://www.rfc-editor.org/ info / rfc6248>。

[RFC6812] Chiba, M., Clemm, A., Medley, S., Salowey, J., Thombare, S., and E. Yedavalli, "Cisco Service-Level Assurance Protocol", RFC 6812, DOI 10.17487/RFC6812, January 2013, <https://www.rfc-editor.org/info/rfc6812>.

[RFC6812]千葉、M。、クレム、A。、メドレー、S。、サロウイ、J。、トンバレ、S。、およびE.イエダバリ、「Cisco Service-Level Assurance Protocol」、RFC 6812、DOI 10.17487 / RFC6812、 2013年1月、<https://www.rfc-editor.org/info/rfc6812>。

[RFC7011] Claise, B., Ed., Trammell, B., Ed., and P. Aitken, "Specification of the IP Flow Information Export (IPFIX) Protocol for the Exchange of Flow Information", STD 77, RFC 7011, DOI 10.17487/RFC7011, September 2013, <https://www.rfc-editor.org/info/rfc7011>.

[RFC7011] Claise、B。、編、Trammell、B。、編、およびP. Aitken、「フロー情報の交換のためのIPフロー情報エクスポート(IPFIX)プロトコルの仕様」、STD 77、RFC 7011、 DOI 10.17487 / RFC7011、2013年9月、<https://www.rfc-editor.org/info/rfc7011>。

[RFC7297] Boucadair, M., Jacquenet, C., and N. Wang, "IP Connectivity Provisioning Profile (CPP)", RFC 7297, DOI 10.17487/RFC7297, July 2014, <https://www.rfc-editor.org/info/rfc7297>.

[RFC7297] Boucadair、M.、Jacquenet、C。、およびN. Wang、「IP接続プロビジョニングプロファイル(CPP)」、RFC 7297、DOI 10.17487 / RFC7297、2014年7月、<https://www.rfc-editor。 org / info / rfc7297>。

[RFC7575] Behringer, M., Pritikin, M., Bjarnason, S., Clemm, A., Carpenter, B., Jiang, S., and L. Ciavaglia, "Autonomic Networking: Definitions and Design Goals", RFC 7575, DOI 10.17487/RFC7575, June 2015, <https://www.rfc-editor.org/info/rfc7575>.

[RFC7575] Behringer、M.、Pritikin、M.、Bjarnason、S.、Clemm、A.、Carpenter、B.、Jiang、S。、およびL. Ciavaglia、「Autonomic Networking:Definitions and Design Goals」、RFC 7575 、DOI 10.17487 / RFC7575、2015年6月、<https://www.rfc-editor.org/info/rfc7575>。

[RFC8250] Elkins, N., Hamilton, R., and M. Ackermann, "IPv6 Performance and Diagnostic Metrics (PDM) Destination Option", RFC 8250, DOI 10.17487/RFC8250, September 2017, <https://www.rfc-editor.org/info/rfc8250>.

[RFC8250] Elkins、N.、Hamilton、R。、およびM. Ackermann、「IPv6 Performance and Diagnostic Metrics(PDM)Destination Option」、RFC 8250、DOI 10.17487 / RFC8250、2017年9月、<https://www.rfc -editor.org/info/rfc8250>。

Acknowledgements

謝辞

We wish to acknowledge the helpful contributions, comments, and suggestions that were received from Mohamed Boucadair, Brian Carpenter, Hanlin Fang, Bruno Klauser, Diego Lopez, Vincent Roca, and Eric Voit. In addition, we thank Diego Lopez, Vincent Roca, and Brian Carpenter for their detailed reviews.

Mohamed Boucadair、Brian Carpenter、Hanlin Fang、Bruno Klauser、Diego Lopez、Vincent Roca、Eric Voitから寄せられた有益な貢献、コメント、提案に感謝いたします。また、詳細なレビューを提供してくれたDiego Lopez、Vincent Roca、Brian Carpenterに感謝します。

Authors' Addresses

著者のアドレス

Jeferson Campos Nobre University of Vale do Rio dos Sinos Porto Alegre Brazil

ジェファーソンカンポスノーブレヴァーレドリオドスシノスポルトアレグレブラジル

   Email: jcnobre@unisinos.br
        

Lisandro Zambenedetti Granvile Federal University of Rio Grande do Sul Porto Alegre Brazil

Lisandro Zambenedetti Granvile連邦大学リオグランデドスルポルトアレグレブラジル

   Email: granville@inf.ufrgs.br
        

Alexander Clemm Huawei USA - Futurewei Technologies Inc. Santa Clara, California United States of America

Alexander Clemm Huawei USA-Futurewei Technologies Inc.カリフォルニア州サンタクララ、アメリカ合衆国

   Email: ludwig@clemm.org, alexander.clemm@huawei.com
        

Alberto Gonzalez Prieto VMware Palo Alto, California United States of America

Alberto Gonzalez Prieto VMwareパロアルト、カリフォルニア州アメリカ合衆国

   Email: agonzalezpri@vmware.com