[要約] RFC 2258は、インターネットノミクラトルプロジェクトに関する要約と目的を提供しています。このプロジェクトの目的は、インターネットの命名規則を統一し、ネットワークリソースの管理を効率化することです。

Network Working Group                                         J. Ordille
Request for Comments: 2258                Bell Labs, Lucent Technologies
Category: Informational                                     January 1998
        

Internet Nomenclator Project

インターネット命名プロジェクト

Status of this Memo

本文書の状態

This memo provides information for the Internet community. It does not specify an Internet standard of any kind. Distribution of this memo is unlimited.

このメモは、インターネットコミュニティに情報を提供します。いかなる種類のインターネット標準も規定していません。このメモの配布は無制限です。

Copyright Notice

著作権表示

Copyright (C) The Internet Society (1998). All Rights Reserved.

Copyright(C)The Internet Society(1998)。全著作権所有。

Abstract

概要

The goal of the Internet Nomenclator Project is to integrate the hundreds of publicly available CCSO servers from around the world. Each CCSO server has a database schema that is tailored to the needs of the organization that owns it. The project is integrating the different database schema into one query service. The Internet Nomenclator Project will provide fast cross-server searches for locating people on the Internet. It augments existing CCSO services by supplying schema integration, more extensive indexing, and two kinds of caching -- all this in a system that scales as the number of CCSO servers grows. One of the best things about the system is that administrators can incorporate their CCSO servers into Nomenclator without changing the servers. All Nomenclator needs is basic information about the server.

Internet Nomenclator Projectの目標は、世界中から公開されている何百ものCCSOサーバーを統合することです。各CCSOサーバーには、それを所有する組織のニーズに合わせて調整されたデータベーススキーマがあります。プロジェクトは、さまざまなデータベーススキーマを1つのクエリサービスに統合しています。 Internet Nomenclator Projectは、インターネット上の人々を見つけるための高速なクロスサーバー検索を提供します。スキーマの統合、より広範なインデックス作成、および2種類のキャッシングを提供することにより、既存のCCSOサービスを強化します。これらはすべて、CCSOサーバーの数が増えるにつれて拡張するシステムで行われます。システムの最も優れた点の1つは、管理者がサーバーを変更せずにCCSOサーバーをNomenclatorに組み込むことができることです。 Nomenclatorのすべてのニーズは、サーバーに関する基本的な情報です。

This document provides an overview of the Nomenclator system, describes how to register a CCSO server in the Internet Nomenclator Project, and how to use the Nomenclator search engine to find people on the Internet.

このドキュメントでは、Nomenclatorシステムの概要を説明し、CCSOサーバーをインターネットNomenclatorプロジェクトに登録する方法、およびNomenclator検索エンジンを使用してインターネット上の人々を検索する方法について説明します。

1. Introduction
1. はじめに

Hundreds of organizations provide directory information through the CCSO name service protocol [3]. Although the organizations provide a wealth of information about people, finding any one person can be difficult because each organization's server is independent. The different servers have different database schemas (attribute names and data formats). The 300+ CCSO servers have more than 900 different attributes to describe information about people. Very few common attributes exist. Only name and email occur in more than 90% of the servers [4]. No special support exists for cross-server searches, so searching can be slow and expensive.

何百もの組織がCCSOネームサービスプロトコルを通じてディレクトリ情報を提供しています[3]。組織は人に関する豊富な情報を提供しますが、各組織のサーバーは独立しているため、一人を見つけるのは難しい場合があります。サーバーごとに異なるデータベーススキーマ(属性名とデータ形式)があります。 300以上のCCSOサーバーには、900人を超えるさまざまな属性があり、人々に関する情報を記述しています。一般的な属性はほとんどありません。サーバーの90%以上で発生するのは名前と電子メールだけです[4]。クロスサーバー検索の特別なサポートは存在しないため、検索は低速で費用がかかる可能性があります。

The goal of the Internet Nomenclator Project is to provide fast, integrated access to the information in the CCSO servers. The project is the first large-scale use of the Nomenclator system. Nomenclator is a more general system than a white pages directory service. It is a scalable, extensible information system for the Internet.

Internet Nomenclator Projectの目標は、CCSOサーバーの情報への統合された高速アクセスを提供することです。このプロジェクトは、命名システムの最初の大規模な使用です。命名法は、ホワイトページディレクトリサービスよりも一般的なシステムです。これは、インターネット用のスケーラブルで拡張可能な情報システムです。

Nomenclator answers descriptive (i.e. relational) queries. Users can locate information about people, organizations, hosts, services, publications, and other objects by describing their attributes. Nomenclator achieves fast descriptive query processing through an active catalog, and extensive meta-data and data caching. The active catalog constrains the search space for a query by returning a list of data repositories where the answer to the query is likely to be found. Meta-data and data caching keep frequently used query processing resources close to the user, thus reducing communication and processing costs.

命名者は、説明的な(つまり、リレーショナル)クエリに答えます。ユーザーは、属性を記述することにより、人、組織、ホスト、サービス、パブリケーション、およびその他のオブジェクトに関する情報を見つけることができます。 Nomenclatorは、アクティブなカタログ、および広範なメタデータとデータキャッシングを通じて、記述的なクエリ処理を高速化します。アクティブなカタログは、クエリに対する回答が見つかる可能性が高いデータリポジトリのリストを返すことにより、クエリの検索スペースを制限します。メタデータとデータのキャッシュにより、頻繁に使用されるクエリ処理リソースがユーザーの近くに保持されるため、通信と処理のコストが削減されます。

Through the Internet Nomenclator Project, users can query any CCSO server, regardless of its attribute names or data formats, by specifying the query to Nomenclator (see Figure 1). Nomenclator provides a world view of the data in the different servers. Users express their queries in this world view. Nomenclator returns the answer immediately if it has been cached by a previous query. If not, Nomenclator uses its active catalog to constrain the query to the subset of relevant CCSO servers. The speed of the query is increased, because only relevant servers are contacted. Nomenclator translates the global query into local queries for each relevant CCSO server. It then translates the responses into the format of the world view.

Internet Nomenclator Projectを介して、ユーザーは属性名やデータ形式に関係なく、任意のCCSOサーバーにクエリを指定できます(図1を参照)。 Nomenclatorは、さまざまなサーバーのデータの世界観を提供します。ユーザーはこの世界観でクエリを表現します。名詞は、前のクエリによってキャッシュされている場合、回答をすぐに返します。そうでない場合、Nomenclatorはアクティブなカタログを使用して、関連するCCSOサーバーのサブセットにクエリを制限します。関連するサーバーのみに接続するため、クエリの速度が向上します。命名法は、グローバルクエリを、関連する各CCSOサーバーのローカルクエリに変換します。次に、応答を世界観の形式に変換します。

   --------------------------------------------------------------------
        
                     +-------------+             +-------------+
                     |             |             |             |
         World View  |             | Local View  |             |
         Query       |             | Query       |  Relevant   |
         ----------->|             |------------>|             |
                     | Nomenclator |             |  CCSO       |
                     |             |             |             |
         <-----------|             |<------------|  Server     |
          World View |             |  Local View |             |
          Response   |             |  Response   |             |
                     +-------------+             +-------------+
        

Figure 1: A Nomenclator Query

図1:命名クエリ

Nomenclator translates queries to and from the language of the relevant CCSO servers.

命名法は、関連するCCSOサーバーの言語との間でクエリを変換します。

   --------------------------------------------------------------------
        

The Internet Nomenclator Project makes it easier for users to find a particular CCSO server, but it does not send all queries to that server. When Nomenclator constrains the search for a query answer, it screens out irrelevant queries from ever reaching the server. When Nomenclator finds an answer in its cache, it screens out redundant queries from reaching the server. The server becomes easier to find and use without experiencing the high loads caused by exhaustive and redundant searches.

Internet Nomenclator Projectにより、ユーザーは特定のCCSOサーバーを見つけやすくなりますが、すべてのクエリがそのサーバーに送信されるわけではありません。 Nomenclatorがクエリの回答の検索を制限すると、無関係なクエリがサーバーに到達しないように選別します。 Nomenclatorはキャッシュで回答を見つけると、サーバーに到達しないように冗長なクエリを選別します。網羅的で冗長な検索による高負荷を経験することなく、サーバーの検索と使用が容易になります。

The Internet Nomenclator Project creates the foundation for a much broader heterogeneous directory service for the Internet. The current version of Nomenclator provides integrated access to CCSO and relational database services. The Nomenclator System Architecture supports fast, integrated searches of any collection of heterogeneous directories. The Internet Nomenclator Project can be enhanced to support additional name services, or provide intergated query services for other application domains. The project is starting with CCSO services, because the CCSO services are widely available and successful.

Internet Nomenclator Projectは、インターネット用のより広範な異種ディレクトリサービスの基盤を作成します。 Nomenclatorの現在のバージョンは、CCSOおよびリレーショナルデータベースサービスへの統合アクセスを提供します。命名システムアーキテクチャは、異種ディレクトリのコレクションの高速統合検索をサポートしています。 Internet Nomenclator Projectを拡張して、追加のネームサービスをサポートしたり、他のアプリケーションドメインに統合クエリサービスを提供したりできます。 CCSOサービスは広く利用可能で成功しているため、プロジェクトはCCSOサービスから始まります。

Section 2 describes the Nomenclator system in more detail. Section 3 explains how to register a CCSO server as part of the project. Section 4 briefly describes how to use Nomenclator. Section 5 provides a summary.

セクション2では、命名システムについて詳しく説明します。セクション3では、CCSOサーバーをプロジェクトの一部として登録する方法について説明します。セクション4では、Nomenclatorの使用方法について簡単に説明します。セクション5に要約を示します。

2. Nomenclator System
2. 命名システム

Nomenclator is a scalable, extensible information system for the Internet. It supports descriptive (i.e. relational) queries. Users locate information about people, organizations, hosts, services, publications, and other objects by describing their attributes. Nomenclator achieves fast descriptive query processing through an active catalog, and extensive meta-data and data caching.

Nomenclatorは、インターネット用のスケーラブルで拡張可能な情報システムです。説明(つまり、リレーショナル)クエリをサポートします。ユーザーは、属性を記述することにより、人、組織、ホスト、サービス、パブリケーション、およびその他のオブジェクトに関する情報を見つけます。 Nomenclatorは、アクティブなカタログ、および広範なメタデータとデータキャッシングを通じて、記述的なクエリ処理を高速化します。

The active catalog constrains the search space for a query by returning a list of data repositories where the answer to the query is likely to be found. Components of the catalog are distributed indices that isolate queries to parts of the network, and smart algorithms for limiting the search space by using semantic, syntactic, or structural constraints. Meta-data caching improves performance by keeping frequently used characterizations of the search space close to the user, thus reducing active catalog communication and processing costs. When searching for query responses, these techniques improve query performance by contacting only the data repositories likely to have actual responses, resulting in acceptable search times.

アクティブなカタログは、クエリに対する回答が見つかる可能性が高いデータリポジトリのリストを返すことにより、クエリの検索スペースを制限します。カタログのコンポーネントは、クエリをネットワークの一部に分離する分散インデックスと、意味論的、構文的、または構造的制約を使用して検索スペースを制限するためのスマートアルゴリズムです。メタデータキャッシュは、頻繁に使用される検索スペースの特性をユーザーの近くに維持することでパフォーマンスを向上させ、アクティブなカタログ通信と処理コストを削減します。クエリの応答を検索する場合、これらの手法は、実際の応答がありそうなデータリポジトリのみに接続することでクエリのパフォーマンスを向上させ、許容できる検索時間をもたらします。

Administrators make their data available in Nomenclator by supplying information about the location, format, contents, and protocols of their data repositories. Experience with Nomenclator shows that gathering a small amount of information from data owners can have a substantial positive impact on the ability of users to retrieve information. For example, each CCSO administrator provides a mapping from the local view of data (i.e. the local schema) at the CCSO server to Nomenclator's world view. The administrator also supplies possible values for any attributes with small domains at the data repository (such as the "city" or "state_or_province" attributes). With this information, Nomenclator can isolate queries to a small percentage of the CCSO data repositories, and provide an integrated view of their data. Nomenclator provides tools that minimize the effort that administrators expend in characterizing their data repositories. Nomenclator does not require administrators to change the format of their data or the access protocol for their database.

管理者は、データリポジトリの場所、形式、内容、およびプロトコルに関する情報を提供することにより、Nomenclatorでデータを利用できるようにします。 Nomenclatorの経験から、データ所有者から少量の情報を収集すると、ユーザーが情報を取得する能力に大きなプラスの影響を与える可能性があることが示されています。たとえば、各CCSO管理者は、CCSOサーバーのデータのローカルビュー(つまり、ローカルスキーマ)からNomenclatorの世界ビューへのマッピングを提供します。管理者は、データリポジトリで小さなドメインを持つ属性( "city"または "state_or_province"属性など)に可能な値も提供します。この情報を使用して、NomenclatorはクエリをCCSOデータリポジトリのごく一部に分離し、それらのデータの統合ビューを提供できます。 Nomenclatorは、管理者がデータリポジトリの特性評価に費やす労力を最小限に抑えるツールを提供します。命名法では、管理者がデータの形式やデータベースのアクセスプロトコルを変更する必要はありません。

2.1 Components of a Nomenclator System
2.1 命名システムのコンポーネント

A Nomenclator system is comprised of a distributed catalog service and a query resolver (see Figure 2). The distributed catalog service gathers meta-data about data repositories and makes it available to the query resolver. Meta-data includes constraints on attribute values at a data repository, known patterns of data distribution across several data repositories, search and navigation techniques, schema and protocol translation techniques, and the differing schema at data repositories.

命名システムは、分散カタログサービスとクエリリゾルバーで構成されます(図2を参照)。分散カタログサービスは、データリポジトリに関するメタデータを収集し、クエリリゾルバーが利用できるようにします。メタデータには、データリポジトリでの属性値の制約、複数のデータリポジトリにわたるデータ分散の既知のパターン、検索とナビゲーションの手法、スキーマとプロトコルの変換手法、およびデータリポジトリでの異なるスキーマが含まれます。

   --------------------------------------------------------------------
        
                     +-------------+             +-------------+
                     |             |             |             |
         World View  |             |  Meta Data  |             |
         Query       |             |  Request    | Distributed |
         ----------->|   Query     | ----------->|             |
                     |   Resolver  |             |  Catalog    |
                     |             |             |             |
         <-----------|   (caches)  | <-----------|  Service    |
          World View |             |  Meta Data  |             |
          Response   |             |  Response   |             |
                     +-------------+             +-------------+
        

Figure 2: Components of a Nomenclator System

図2:命名システムのコンポーネント

   --------------------------------------------------------------------
        

Query resolvers at the user sites retrieve, use, cache, and re-use this meta-data in answering user queries. The catalog is "active" in two ways. First, some meta-data moves from the distributed catalog service to each query resolver during query processing. Second, the query resolver uses the initial meta-data, in particular the search and navigation techniques, to generate additional meta-data that guides query processing. Typically, one resolver process serves a few hundred users in an organization, so users can benefit from larger resolver caches.

ユーザーサイトのクエリリゾルバーは、ユーザーのクエリに応答する際に、このメタデータを取得、使用、キャッシュ、および再利用します。カタログは2つの方法で「アクティブ」です。まず、クエリ処理中に、一部のメタデータが分散カタログサービスから各クエリリゾルバに移動します。次に、クエリリゾルバーは初期メタデータ、特に検索とナビゲーションの手法を使用して、クエリ処理をガイドする追加のメタデータを生成します。通常、1つのリゾルバープロセスが組織内の数百人のユーザーにサービスを提供するため、ユーザーはより大きなリゾルバーキャッシュを利用できます。

Query resolvers cache techniques for constraining the search space and the results of previously constrained searches (meta-data), and past query answers (data) to speed future query processing. Meta-data and data caching tailor the query resolver to the specific needs of the users at the query site. They also increase the scale of a Nomenclator system by reducing the load from repeated searches or queries on the distributed catalog service, data repositories, and communications network.

クエリリゾルバーは、検索スペースと以前に制限された検索の結果(メタデータ)、および過去のクエリの回答(データ)を制限するためのテクニックをキャッシュし、将来のクエリ処理を高速化します。メタデータとデータキャッシングは、クエリリゾルバーをクエリサイトのユーザーの特定のニーズに合わせて調整します。また、分散カタログサービス、データリポジトリ、および通信ネットワーク上で繰り返し検索またはクエリを実行することによる負荷を軽減することにより、命名システムの規模を拡大します。

The distributed catalog service is logically one network service, but it can be divided into pieces that are distributed and/or replicated. Query resolvers access this distributed, replicated service using the same techniques that work for multiple data repositories.

分散カタログサービスは論理的には1つのネットワークサービスですが、分散および/または複製される部分に分割できます。クエリリゾルバーは、複数のデータリポジトリで機能するのと同じ手法を使用して、この分散された複製サービスにアクセスします。

A Nomenclator system naturally includes many query resolvers. Resolvers are independent, but renewable, query agents that can be as powerful as the resources available at the user site. Caching decreases the dependence of the resolver on the distributed catalog service for frequently used meta-data, and on data repositories for frequently used data. Caching thus improves the number of users that can be supported and the local availability of the query service.

命名システムには、当然、多くのクエリリゾルバが含まれています。リゾルバーは独立していますが、ユーザーサイトで利用可能なリソースと同じくらい強力な、再生可能なクエリエージェントです。キャッシングにより、頻繁に使用されるメタデータについては分散カタログサービスへのリゾルバーへの依存度が減り、頻繁に使用されるデータについてはデータリポジトリへの依存度が減ります。したがって、キャッシュにより、サポートできるユーザーの数とクエリサービスのローカルでの可用性が向上します。

2.2 Meta-Data Techniques
2.2 メタデータテクニック

The active catalog structures the information space into a collection of relations about people, hosts, organizations, services and other objects. It collects meta-data for each relation and structures it into "access functions" for locating and retrieving data. Access functions respond to the question: "Where is data to answer this query?" There are two types of responses corresponding to the two types of access functions. The first type of response is: "Look over there." "Catalog functions" return this response; they constrain the query search by limiting the data repositories contacted to those having data relevant to the query. Catalog functions return a referral to data access functions that will answer the query or to additional catalog functions to contact for more detailed information. The second response to "Where?" is: "Here it is!" "Data access functions" return this response; they understand how to obtain query answers from specific data repositories. They return tuples that answer the query. Nomenclator supplies access functions for common name services, such as the CCSO service, and organizations can write and supply access functions for data in their repositories.

アクティブなカタログは、情報スペースを、人、ホスト​​、組織、サービス、およびその他のオブジェクトに関する関係のコレクションに構造化します。各関係のメタデータを収集し、データを検索して取得するための「アクセス関数」に構造化します。アクセス関数は、「このクエリに回答するデータはどこにありますか?」という質問に答えます。 2種類のアクセス機能に対応する2種類の応答があります。最初のタイプの応答は、「そちらを見て」です。 「カタログ関数」はこの応答を返します。クエリに関連するデータを持つリポジトリにアクセスするデータリポジトリを制限することで、クエリ検索を制限します。カタログ関数は、クエリに応答するデータアクセス関数への紹介、またはより詳細な情報を得るために連絡する追加のカタログ関数への参照を返します。 「どこ?」への2番目の応答です:「ここにあります!」 「データアクセス関数」はこの応答を返します。彼らは特定のデータリポジトリからクエリの回答を取得する方法を理解しています。クエリに応答するタプルを返します。命名者は、CCSOサービスなどの一般的なネームサービスのアクセス機能を提供し、組織はリポジトリ内のデータのアクセス機能を作成および提供できます。

Access functions are implemented as remote or local services. Remote access functions are services that are available through a standard remote procedure call interface. Local access functions are functions that are supplied with the query resolver. Local access functions can be applied to a variety of indexing and data retrieval tasks by loading them with meta-data stored in distributed catalog service. Remote access functions are preferred over local ones when the resources of the query resolver are inadequate to support the access function. The owners of data may also choose to supply remote access functions for privacy reasons if their access functions use proprietary information or algorithms. Local functions are preferred whenever possible, because they are highly replicated in resolver caches. They can reduce system and network load by bringing the resources of the active catalog directly to the users.

アクセス機能は、リモートまたはローカルサービスとして実装されます。リモートアクセス機能は、標準のリモートプロシージャコールインターフェイスを介して利用できるサービスです。ローカルアクセス関数は、クエリリゾルバーで提供される関数です。ローカルアクセス機能は、分散カタログサービスに格納されているメタデータをロードすることにより、さまざまなインデックス作成およびデータ取得タスクに適用できます。クエリリゾルバのリソースがアクセス機能をサポートするには不十分な場合、リモートアクセス機能がローカル機能よりも優先されます。データの所有者は、アクセス機能が独自の情報またはアルゴリズムを使用する場合、プライバシー上の理由からリモートアクセス機能を提供することもできます。ローカル関数は、リゾルバーキャッシュに高度に複製されるため、可能な限り優先されます。アクティブカタログのリソースを直接ユーザーに提供することで、システムとネットワークの負荷を軽減できます。

Remote access functions are simple to add to Nomenclator and local access functions are simple to apply to new data repositories, because the active catalog provides "referrals" that describe the conditions for using access functions. For simplicity, this document describes referral techniques for exact matching of query strings. Extensions to these techniques in Nomenclator support matching query strings that contain wildcards or word-based matching of query strings in the style of the CCSO services.

アクティブなカタログはアクセス機能を使用するための条件を説明する「参照」を提供するため、リモートアクセス機能は命名法に簡単に追加でき、ローカルアクセス機能は新しいデータリポジトリに簡単に適用できます。簡単にするために、このドキュメントでは、クエリ文字列を正確に照合するための参照手法について説明します。 Nomenclatorのこれらの手法の拡張機能は、ワイルドカードを含むクエリ文字列のマッチング、またはCCSOサービスのスタイルのクエリ文字列の単語ベースのマッチングをサポートします。

Each referral contains a template and a list of references to access functions. The template is a conjunctive selection predicate that describes the scope of the access functions. Conjunctive queries that are within the scope of the template can be answered with the referral. When a template contains a wildcard value ("*") for an attribute, the attribute must be present in any queries that are processed by the referral. The system follows the following rule:

各紹介には、テンプレートとアクセス機能への参照のリストが含まれています。テンプレートは、アクセス機能のスコープを説明する接続選択述語です。テンプレートのスコープ内にある接続クエリは、紹介で回答できます。テンプレートに属性のワイルドカード値( "*")が含まれている場合、その属性は、参照によって処理されるすべてのクエリに存在する必要があります。システムは次のルールに従います。

Query Coverage Rule:

クエリカバレッジルール:

If the set of tuples satisfying the selection predicate in a query is covered by (is a subset of) the set of tuples satisfying the template, then the query can be answered by the access functions in the reference list of the referral.

クエリの選択述語を満たすタプルのセットが、テンプレートを満たすタプルのセットでカバーされている(のサブセットである)場合、照会は、参照の参照リスト内のアクセス関数によって応答できます。

For example, the query below:

たとえば、次のクエリ:

     select * from People where country = "US" and surname = "Ordille";
        

is covered by the following templates in Lines (1) through (3), but not by the templates in Lines (4) and (5):

行(1)から(3)の次のテンプレートでカバーされますが、行(4)および(5)のテンプレートではカバーされません。

      (1) country = "US" and surname = "*"
        

(2) country = "US" and surname = "Ordille"

(2)国= "US"および姓= "Ordille"

(3) country = "US"

(3)国= "米国"

(4) organization = "*"

(4)組織= "*"

(5) country = "US" and surname = "Elliott"

(5)国= "US"および姓= "Elliott"

Referrals form a generalization/specialization graph for a relation called a "referral graph." Referral graphs are a conceptual tool that guides the integration of different catalog functions into our system and that supplies a basis for catalog function construction and query processing. A "referral graph" is a partial ordering of the referrals for a relation. It is constructed using the subset/superset relationship: "S is a subset of G." A referral S is a subset of referral G if the set of queries covered by the template of S is a subset of the set of queries covered by the template of G. S is considered a more specific referral than G; G is considered a more general referral than S. For example, the subset relationship exists between the pairs of referrals with the templates listed below:

紹介は、「紹介グラフ」と呼ばれる関係の一般化/専門化グラフを形成します。参照グラフは、さまざまなカタログ機能をシステムに統合するための概念的なツールであり、カタログ機能の構築とクエリ処理の基礎を提供します。 「紹介グラフ」は、関係の紹介の部分的な順序付けです。これは、サブセット/スーパーセットの関係を使用して構築されます。「SはGのサブセットです。」 SのテンプレートでカバーされるクエリのセットがGのテンプレートでカバーされるクエリのセットのサブセットである場合、紹介Sは紹介Gのサブセットです。SはGよりも特定の紹介と見なされます。 GはSよりも一般的な紹介と見なされます。たとえば、サブセットの関係は、以下にリストされているテンプレートを持つ紹介のペア間に存在します。

(1) country = "US" and surname = "Ordille" is a subset of country = "US"

(1)国= "US"および姓= "Ordille"は、国= "US"のサブセットです

      (2) country = "US" and surname = "Ordille"
          is a subset of
          country = "US" and surname = "*"
        

(3) country = "US" and surname = "*" is a subset of country ="US"

(3)国= "US"および姓= "*"は、国= "US"のサブセットです

(4) country = "US" is a subset "empty template"

(4)国=「US」はサブセット「空のテンプレート」

but it does not exist between the pairs of referrals with the following templates:

ただし、次のテンプレートを使用した参照のペアの間に存在しません。

(5) country = "US" is not a subset of department = "CS"

(5)国= "US"は部門のサブセットではありません= "CS"

(6) country = "US" and name = "Ordille" is not a subset of country = "US" and name = "Elliott"

(6)国= "US"および名前= "Ordille"は、国= "US"および名前= "Elliott"のサブセットではありません

In Lines (1) and (2), the more general referral covers more queries, because it covers queries that list different values for surname. In Line (3), the more general referral covers more queries, because it covers queries that do not constrain surname to a value. In Line (4), the specific referral covers only those queries that constrain the country to "US" while the empty template covers all queries.

行(1)と(2)では、姓の異なる値をリストするクエリを対象とするため、より一般的な紹介はより多くのクエリを対象としています。行(3)では、姓が値に制約されないクエリを対象としているため、より一般的な紹介はより多くのクエリを対象としています。行(4)では、特定の照会は国を「米国」に制限するクエリのみをカバーし、空のテンプレートはすべてのクエリをカバーしています。

During query processing, wildcards in a template are replaced with the value of the corresponding attribute in the query. For any query covered by two referrals S and G such that S is a subset of G, the set of tuples satisfying the template in S is covered by the set of tuples satisfying the template in G. S is used to process the query, because it provides the more constrained (and faster) search space. The referral S has a more constrained logical search space than G, because the set of tuples in the scope of S is no larger, and often smaller, than the set in the scope of G. Moreover, S has a more constrained physical search space than G, because the data repositories that must contacted for answers to S must also be contacted for answers to G, but additional data repositories may need to be contacted to answer G.

クエリ処理中に、テンプレート内のワイルドカードは、クエリ内の対応する属性の値に置き換えられます。 SがGのサブセットである2つの参照SとGでカバーされるクエリの場合、Sのテンプレートを満たすタプルのセットは、Gのテンプレートを満たすタプルのセットでカバーされます。Sはクエリの処理に使用されます。より制約された(そして高速な)検索スペースを提供します。 Sのスコープ内のタプルのセットはGのスコープ内のタプルのセットよりも大きくなく、多くの場合小さいので、参照SはGよりも制約された論理検索スペースを持っています。さらに、Sはより制約された物理検索スペースを持っていますSへの回答のために連絡する必要があるデータリポジトリにもGへの回答のために連絡する必要があるため、Gより回答するために追加のデータリポジトリへの連絡が必要になる場合があるため。

In constraining a query, a catalog function always produces a referral that is more specific than the referral containing the catalog function. Wildcards ("*") in a template indicate which attribute values are used by the associated catalog function to generate a more specific referral. In other words, catalog functions always follow the rule:

クエリを制約する場合、カタログ関数は常に、カタログ関数を含む参照よりも具体的な参照を生成します。テンプレート内のワイルドカード( "*")は、より具体的な参照を生成するために、関連付けられたカタログ関数によって使用される属性値を示します。つまり、カタログ関数は常に次の規則に従います。

Catalog Function Constrained Search Rule:

カタログ関数の制約付き検索ルール:

Given a referral R with a template t and a catalog function cf, and a query q covered by t, the result of using cf to process q, cf(q), is a referral R' with template t' such that q is covered by t' and R' is more specific than R.

テンプレートtとカタログ関数cfを持つ参照R、およびtでカバーされるクエリqが与えられた場合、cfを使用してqを処理した結果cf(q)は、テンプレートt 'を持つ参照R'であり、qはカバーされます。 t 'とR'はRよりも具体的です。

Catalog functions make it possible to import a portion of the indices for the information space into the query resolver. Since they generate referrals, the resolver can cache the most useful referrals for a relation and call the catalog function as needed to generate new referrals.

カタログ関数を使用すると、情報スペースのインデックスの一部をクエリリゾルバーにインポートできます。リフェラルはリフェラルを生成するため、リゾルバはリレーションに最も役立つリフェラルをキャッシュし、必要に応じてカタログ関数を呼び出して新しいリフェラルを生成できます。

The resolver query processing algorithm obtains an initial set of referrals from the distributed catalog service. It then navigates the referral graph, calling catalog functions as necessary to obtain additional referrals that narrow the search space. Sometimes, two referrals that cover the query have the relationship of general to specific to each other. The resolver eliminates unnecessary access function processing by using only the most specific referral along each path of the referral graph.

リゾルバークエリ処理アルゴリズムは、分散カタログサービスから紹介の初期セットを取得します。次に、参照グラフをナビゲートし、必要に応じてカタログ関数を呼び出して、検索スペースを狭める追加の参照を取得します。場合によっては、クエリをカバーする2つのリフェラルに、一般的な関係と特定の関係があります。リゾルバーは、参照グラフの各パスに沿って最も具体的な参照のみを使用することにより、不要なアクセス関数処理を排除します。

The search space for the query is initially set to all the data repositories in the relation. As the resolver obtains referrals to sets of relevant data repositories (and their associated data access functions) it forms the intersection of the referrals to constrain the search space further. The intersection of the referrals includes only those data repositories listed in all the referrals. Intersection combines independent paths through the referral graph to derive benefit from indices on different attributes.

クエリの検索スペースは、最初はリレーション内のすべてのデータリポジトリに設定されています。リゾルバーは、関連するデータリポジトリのセット(および関連するデータアクセス関数)への紹介を取得すると、紹介の共通部分を形成して、検索スペースをさらに制限します。参照の共通部分には、すべての参照にリストされているデータリポジトリのみが含まれます。交差は、参照グラフを介して独立したパスを組み合わせ、さまざまな属性のインデックスからメリットを引き出します。

2.3 Meta-Data and Data Caching
2.3 メタデータとデータキャッシング

A Nomenclator query resolver caches the meta-data that result from calling catalog functions. It also caches the responses for queries. If the predicate of a new query is covered by the predicate of a previous query, Nomenclator calculates the response for the new query from the cached response of the old query. Nomenclator timestamps its cache entries to provide measures of the currentness of query responses and selective cache refresh. The timestamps are used to calculate a t-bound on query responses [5][1]. A t-bound is the time after which changes may have occurred to the data that are not reflected in the query response. It is the time of the oldest cache entry used to calculate the response. Nomenclator returns a t-bound with each query response. Users can request more current data by asking for responses that are more recent than this t-bound. Making such a request flushes older items from the cache if more recent items are available. Query resolvers calculate a minimum t-bound that is some refresh interval earlier than the current time. Resolvers keep themselves current by replacing items in the cache that are earlier than the minimum t-bound.

Nomenclatorクエリリゾルバーは、カタログ関数を呼び出した結果のメタデータをキャッシュします。また、クエリの応答もキャッシュします。新しいクエリの述語が前のクエリの述語でカバーされている場合、Nomenclatorは古いクエリのキャッシュされた応答から新しいクエリの応答を計算します。命名機能は、キャッシュエントリにタイムスタンプを付けて、クエリ応答の最新性と選択的なキャッシュリフレッシュの測定値を提供します。タイムスタンプは、クエリ応答のtバウンドを計算するために使用されます[5] [1]。 tバウンドは、クエリ応答に反映されないデータに変更が発生した後の時間です。これは、応答の計算に使用された最も古いキャッシュエントリの時間です。命名法は、各クエリ応答でt境界を返します。ユーザーは、このtバインドよりも新しい応答を要求することにより、より最新のデータを要求できます。このようなリクエストを行うと、より新しいアイテムが使用可能な場合、古いアイテムがキャッシュからフラッシュされます。クエリリゾルバーは、現在の時刻より前の更新間隔である最小のt範囲を計算します。リゾルバーは、最小のt境界よりも前のキャッシュ内のアイテムを置き換えることにより、最新の状態に保ちます。

2.4 Scale and Performance
2.4 規模とパフォーマンス

Three performance studies of active catalog and meta-data caching techniques are available [5]. The first study shows that the active catalog and meta-data caching can constrain the search effectively in a real environment, the X.500 name space. The second study examined the performance of an active catalog and meta-data caching for single users on a local area network. The experiments showed that the techniques to eliminate data repositories from the search space can dramatically improve response time. Response times improve, because latency is reduced. The reduction of latency in communications and processing is critical to large-scale descriptive query optimization. The experiments also showed that an active catalog is the most significant contributor to better response time in a system with low load, and that meta-data caching functions to reduce the load on the system. The third study used an analytical model to evaluate the performance and scaling of these techniques for a large Internet environment. It showed that meta-data caching plays an essential role in scaling the distributed catalog service to millions of users. It also showed that constraining the search space with an active catalog contributes significantly to scaling data repositories to millions of users. Replication and data caching also contribute to the scale of the system in a large Internet environment.

アクティブなカタログとメタデータキャッシングテクニックの3つのパフォーマンス調査が利用可能です[5]。最初の調査では、アクティブなカタログとメタデータキャッシングにより、実際の環境であるX.500名前空間で検索を効果的に制限できることが示されています。 2番目の調査では、ローカルエリアネットワーク上のシングルユーザーに対するアクティブカタログとメタデータキャッシングのパフォーマンスを調査しました。実験により、検索スペースからデータリポジトリを削除する手法により、応答時間を大幅に改善できることがわかりました。待ち時間が短縮されるため、応答時間が改善されます。通信と処理のレイテンシを削減することは、大規模で記述的なクエリの最適化に不可欠です。実験はまた、アクティブなカタログが、低負荷のシステムでの応答時間を改善する最も重要な要因であること、およびメタデータキャッシング機能がシステムの負荷を軽減することを示しました。 3番目の研究では、分析モデルを使用して、大規模なインターネット環境でのこれらの手法のパフォーマンスとスケーリングを評価しました。これは、メタデータキャッシングが、分散カタログサービスを数百万のユーザーにスケーリングする上で重要な役割を果たすことを示しています。また、アクティブなカタログを使用して検索スペースを制限すると、数百万人のユーザーに対するデータリポジトリのスケーリングに大きく貢献することもわかりました。レプリケーションとデータキャッシングは、大規模なインターネット環境でのシステムの規模にも貢献します。

3. Registering a CCSO Server
3. CCSOサーバーの登録

The Internet Nomenclator Project supports the following home page:

Internet Nomenclator Projectは、次のホームページをサポートしています。

      http://cm.bell-labs.com/cs/what/nomenclator
        

The home page provides a variety of information and services.

ホームページは、さまざまな情報とサービスを提供します。

Administrators can register their CCSO servers through services on this home page. The registration service collects CCSO server location information, contact information for the administrator of the CCSO server, implicit and explicit constraints on entries in the server's database, and a mapping from the local schema of the CCSO server to the schema of the world view.

管理者は、このホームページのサービスを介してCCSOサーバーを登録できます。登録サービスは、CCSOサーバーの場所情報、CCSOサーバーの管理者の連絡先情報、サーバーのデータベースのエントリに対する暗黙的および明示的な制約、およびCCSOサーバーのローカルスキーマからワールドビューのスキーマへのマッピングを収集します。

The implicit and explicit constraints on the server's database are the fuel for Nomenclator's catalog functions. The registration center currently collects constraints on organization name, department, city, state or province name, country, phone number, postal code, and email address. These constraints are automatically incorporated into Nomenclator's distributed catalog service. They are used by catalog functions in query resolvers to constrain searches to relevant CCSO servers. For example, a database only contains information about the computer science and electrical engineering departments at a French university. The department, organization and country attributes are constrained. Nomenclator uses these constraints to prevent queries about other departments, organizations or countries from being sent to this CCSO server.

サーバーのデータベースに対する暗黙的および明示的制約は、命名者のカタログ機能の原動力です。登録センターは現在、組織名、部門、市、州または県の名前、国、電話番号、郵便番号、および電子メールアドレスに関する制約を収集しています。これらの制約は自動的にNomenclatorの分散カタログサービスに組み込まれます。これらは、関連するCCSOサーバーへの検索を制限するために、クエリリゾルバーのカタログ機能によって使用されます。たとえば、データベースには、フランスの大学のコンピュータサイエンスおよび電気工学部門に関する情報のみが含まれています。部署、組織、国の属性は制限されています。命名者はこれらの制約を使用して、他の部門、組織、または国に関するクエリがこのCCSOサーバーに送信されないようにします。

The mapping from the local schema of the CCSO server to the schema of the world view allows Nomenclator to translate queries and responses for the CCSO server. The registration center currently collects this mapping by requesting an example of how to translate a typical entry in the CCSO server into the world view schema and, optionally, an example of how to translate a canonical entry in the world view schema into the local schema of the CCSO server [4]. These examples are then used to generate a mapping program that is stored in the distributed catalog service. The CCSO data access function in the query resolver interprets these programs to translate queries and responses communicated with that CCSO server. We plan to release the mapping language to CCSO server administrators, so administrators can write and maintain the mapping for their servers. We have experimented with more than 20 mapping programs. They are seldom more than 50 lines, and are often shorter. It typically takes one or two lines to map an attribute.

CCSOサーバーのローカルスキーマからワールドビューのスキーマへのマッピングにより、NomenclatorはCCSOサーバーのクエリと応答を変換できます。登録センターは現在、CCSOサーバーの一般的なエントリをワールドビュースキーマに変換する方法の例と、オプションで、ワールドビュースキーマの正規エントリをローカルスキーマに変換する方法の例を要求することにより、このマッピングを収集しています。 CCSOサーバー[4]。これらの例は、分散カタログサービスに格納されるマッピングプログラムを生成するために使用されます。クエリリゾルバーのCCSOデータアクセス機能は、これらのプログラムを解釈して、そのCCSOサーバーと通信するクエリと応答を変換します。マッピング言語をCCSOサーバー管理者にリリースして、管理者がサーバーのマッピングを記述および保守できるようにする予定です。私たちは20以上のマッピングプログラムを使って実験しました。 50行を超えることはめったになく、短い場合がよくあります。通常、属性のマッピングには1行または2行かかります。

4. Using Nomenclator
4. 命名法の使用

The Internet Nomenclator Project currently provides a centralized query service on the Internet. The project runs a Nomenclator query resolver that is accessible through its Web page (see the URL in Section 3) and the Simple Nomenclator Query Protocol (SNQP) [2].

Internet Nomenclator Projectは現在、インターネット上で一元化されたクエリサービスを提供しています。プロジェクトは、Webページ(セクション3のURLを参照)とSimple Nomenclator Query Protocol(SNQP)[2]からアクセスできるNomenclatorクエリリゾルバーを実行します。

The service answers queries that are a conjunction of string values for attributes. A variety of matching techniques are supported including exact string matching, matching with wildcards, and word-based matching in the style of the CCSO service. Our web interface uses the Simple Nomenclator Query Protocol (SNQP) [2]. Programmers can create their own interfaces by using this protocol to communicate with the Nomenclator query resolver. They will require the host name and port number for the query resolver which they can obtain from the Nomenclator home page. SNQP, and hence the web interface, are defined for US-ASCII. Support for other character sets will require further work.

このサービスは、属性の文字列値を組み合わせたクエリに応答します。正確な文字列照合、ワイルドカードによる照合、CCSOサービスのスタイルでの単語ベースの照合など、さまざまな照合手法がサポートされています。私たちのWebインターフェイスは、Simple Nomenclator Query Protocol(SNQP)[2]を使用しています。プログラマーは、このプロトコルを使用してNomenclator照会リゾルバーと通信することにより、独自のインターフェースを作成できます。彼らは、Nomenclatorのホームページから取得できるクエリリゾルバーのホスト名とポート番号を要求します。 SNQP、つまりWebインターフェイスは、US-ASCIIに対して定義されています。他の文字セットをサポートするには、さらに作業が必要になります。

Subsequent phases of the project will provide enhanced services such as providing advice about the cost of queries and ways to constrain queries further to produce faster response times, and allowing users to request more current data. We also plan to distribute query resolvers, so users can benefit from running query resolvers locally. Local query resolvers reduce latency for the user, and distribute query processing load throughout the network.

プロジェクトの後続のフェーズでは、クエリのコストに関するアドバイスや、クエリをさらに制限して応答時間を短縮する方法、ユーザーがより多くの最新データを要求できるようにするなど、拡張サービスが提供されます。また、クエリリゾルバーを配布することも計画しているため、ユーザーはクエリリゾルバーをローカルで実行することでメリットを得られます。ローカルクエリリゾルバーはユーザーの待ち時間を短縮し、クエリ処理の負荷をネットワーク全体に分散します。

5. Summary
5. 概要

The Internet Nomenclator Project augments existing CCSO services by supplying schema integration and fast cross-server searches. The key to speed in descriptive query processing is an active catalog, and extensive meta-data and data caching. The Nomenclator system is the result of research in distributed systems [5][6][7][4]. It can be extended to incorporate other name servers, besides the CCSO servers, and to address distributed search and retrieval challenges in other application domains. In addition to providing a white pages service, the Internet Nomenclator Project will evaluate how an active catalog, meta-data caching and data caching perform in very large global information system. The ultimate goal of the project is to refine these techniques to provide the best possible global information systems.

Internet Nomenclator Projectは、スキーマ統合と高速なクロスサーバー検索を提供することにより、既存のCCSOサービスを強化します。説明的なクエリ処理を高速化する鍵は、アクティブなカタログと、広範なメタデータおよびデータキャッシングです。命名システムは、分散システムの研究の成果です[5] [6] [7] [4]。これを拡張して、CCSOサーバー以外の他のネームサーバーを組み込み、他のアプリケーションドメインでの分散検索と取得の課題に対処することができます。ホワイトページサービスの提供に加えて、インターネット命名プロジェクトは、アクティブなカタログ、メタデータキャッシング、およびデータキャッシングが非常に大規模なグローバル情報システムでどのように機能するかを評価します。プロジェクトの最終的な目標は、これらの技術を改良して、可能な限り最高のグローバル情報システムを提供することです。

6. Security Considerations
6. セキュリティに関する考慮事項

In the Internet Nomenclator Project, the participants' data are openly available and read-only. Since the risk of tampering with queries and responses is considered low, this version of Nomenclator does not define procedures for protecting the information in its queries and responses.

Internet Nomenclator Projectでは、参加者のデータは公開されており、読み取り専用です。クエリと応答を改ざんするリスクは低いと考えられるため、このバージョンのNomenclatorは、クエリと応答の情報を保護するための手順を定義していません。

7. References
7. 参考文献

[1] H. Garcia-Molina, G. Wiederhold. "Read-Only Transactions in a Distributed Database," ACM Transactions on Database Systems 7(2), pp. 209-234. June 1982.

[1] H.ガルシアモリーナ、G。ヴィーダーホールド。 「分散データベースでの読み取り専用トランザクション」、データベースシステム7(2)のACMトランザクション、ページ209-234。 1982年6月。

[2] Elliott, J., and J. Ordille, "The Simple Nomenclator Query Protocol (SNQP)," RFC 2259, January 1998.

[2] Elliott、J.、およびJ. Ordille、「The Simple Nomenclator Query Protocol(SNQP)」、RFC 2259、1998年1月。

   [3]   S. Dorner, P. Pomes. "The CCSO Nameserver: A Description,"
         Computer and Communications Services Office Technical Report,
         University of Illinois, Urbana, USA. 1992. Avaialble in the
         current "qi" distribution from
         <URL:ftp://uiarchive.cso.uiuc.edu/local/packages/ph>
        
   [4]   A. Levy, J. Ordille. "An Experiment in Integrating Internet
         Information Sources," AAAI Fall Symposium on AI Applications in
         Knowledge Navigation and Retrieval, November 1995.
         <URL:http://cm.bell-labs.com/cm/cs/doc/95/11-01.ps.gz>
        
   [5]   J. Ordille. "Descriptive Name Services for Large Internets,"
         Ph. D. Dissertation. University of Wisconsin. 1993.
         <URL:http://cm.bell-labs.com/cm/cs/doc/93/12-01.ps.gz>
        
   [6]   J. Ordille, B. Miller. "Distributed Active Catalogs and
         Meta-Data Caching in Descriptive Name Services," Thirteenth
         International IEEE Conference on Distributed Computing Systems,
         pp. 120-129.  May 1993.
         <URL:http://cm.bell-labs.com/cm/cs/doc/93/5-01.ps.gz>
        
   [7]   J. Ordille, B. Miller. "Nomenclator Descriptive Query
         Optimization in Large X.500 Environments," ACM SIGCOMM
         Symposium on Communications Architectures and Protocols, pp.
         185-196, September 1991.
         <URL:http://cm.bell-labs.com/cm/cs/doc/91/9-01.ps.gz>
        
8. Author's Address
8. 著者のアドレス

Joann J. Ordille Bell Labs, Lucent Technologies Computing Sciences Research Center 700 Mountain Avenue, Rm 2C-301 Murray Hill, NJ 07974 USA

Joann J. Ordille Bell Labs、Lucent Technologies Computing Sciences Research Center 700 Mountain Avenue、Rm 2C-301 Murray Hill、NJ 07974 USA

   EMail: joann@bell-labs.com
        
9. 完全な著作権表示

Copyright (C) The Internet Society (1998). All Rights Reserved.

Copyright(C)The Internet Society(1998)。全著作権所有。

This document and translations of it may be copied and furnished to others, and derivative works that comment on or otherwise explain it or assist in its implementation may be prepared, copied, published and distributed, in whole or in part, without restriction of any kind, provided that the above copyright notice and this paragraph are included on all such copies and derivative works. However, this document itself may not be modified in any way, such as by removing the copyright notice or references to the Internet Society or other Internet organizations, except as needed for the purpose of developing Internet standards in which case the procedures for copyrights defined in the Internet Standards process must be followed, or as required to translate it into languages other than English.

このドキュメントとその翻訳はコピーして他のユーザーに提供することができ、コメントまたはその他の方法で説明したり、その実装を支援する二次的著作物は、いかなる種類の制限なしに、全体または一部を準備、コピー、公開、および配布することができますただし、上記の著作権表示とこの段落は、そのようなすべてのコピーと派生物に含まれています。ただし、このドキュメント自体は、著作権に関する通知を削除したり、インターネットソサエティや他のインターネット組織への参照を削除したりするなど、いかなる方法でも変更できません。ただし、インターネット標準を開発する目的で必要な場合は除きます。インターネット標準のプロセスに従うか、または必要に応じて、それを英語以外の言語に翻訳する必要があります。

The limited permissions granted above are perpetual and will not be revoked by the Internet Society or its successors or assigns.

上記で付与された制限付きのアクセス許可は永続的であり、インターネットソサエティまたはその後継者または譲受人によって取り消されることはありません。

This document and the information contained herein is provided on an "AS IS" basis and THE INTERNET SOCIETY AND THE INTERNET ENGINEERING TASK FORCE DISCLAIMS ALL WARRANTIES, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO ANY WARRANTY THAT THE USE OF THE INFORMATION HEREIN WILL NOT INFRINGE ANY RIGHTS OR ANY IMPLIED WARRANTIES OF MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE.

このドキュメントとここに含まれる情報は「現状有姿」で提供され、インターネット社会およびインターネット技術タスクフォースは、明示または黙示を問わず、ここに記載されている情報の使用が保証するものに限定されない一切の保証を含みません。商品性または特定の目的への適合性に関する権利または黙示の保証を侵害すること。