[go: up one dir, main page]

JP2002509311A - Scalable single-system image operating software for multi-processing computer systems - Google Patents

Scalable single-system image operating software for multi-processing computer systems

Info

Publication number
JP2002509311A
JP2002509311A JP2000540495A JP2000540495A JP2002509311A JP 2002509311 A JP2002509311 A JP 2002509311A JP 2000540495 A JP2000540495 A JP 2000540495A JP 2000540495 A JP2000540495 A JP 2000540495A JP 2002509311 A JP2002509311 A JP 2002509311A
Authority
JP
Japan
Prior art keywords
computer system
processors
processor
service
operating software
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000540495A
Other languages
Japanese (ja)
Inventor
レスカー,ポール・エイ
ベルトーニ,ジョナサン・エル
Original Assignee
エス・アール・シィ・コンピューターズ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エス・アール・シィ・コンピューターズ・インコーポレイテッド filed Critical エス・アール・シィ・コンピューターズ・インコーポレイテッド
Publication of JP2002509311A publication Critical patent/JP2002509311A/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5066Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 別個のサービス(16)および計算(18)プロセッサを有するマルチプロセッシングコンピュータシステムのためのスケーラブル単一システム画像(「S31」)オペレーティングシステムアーキテクチャであって、これらのプロセッサには独特の差異が存在するが、両方ともがコンピュータシステムメモリのすべてに対する共有の、共通アクセスを有する。計算プロセッサはそれらに直接マッピングされる入力/出力(「I/O」)装置を有さないが一方、サービスプロセッサは完全なI/O能力を有する。単一オペレーティングシステムソフトウェア画像は、プロセッサのすべてにわたってアプリケーションプログラムへの単一システムアプリケーションプログラミングインターフェイスを与え、計算プロセッサとサービスプロセッサとの間の通信メカニズムは、サービスプロセッサへの複数個の要求と、各要求に対する高速で非同期の割込応答とを可能にする。計算スケジューラは、各計算プロセッサ上で実行しオペレーティングソフトウェアが実行するサービスプロセッサへのインターフェイスを与える。 Abstract: A scalable single system image ("S31") operating system architecture for a multi-processing computer system having separate service (16) and computation (18) processors, which is unique to these processors. However, both have shared, common access to all of the computer system memory. Compute processors do not have input / output ("I / O") devices mapped directly to them, while service processors have full I / O capability. The single operating system software image provides a single system application programming interface to application programs across all of the processors, and the communication mechanism between the compute processor and the service processor uses multiple requests to the service processor and each request. And a fast and asynchronous interrupt response. The compute scheduler provides an interface to a service processor running on each compute processor and running operating software.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の背景】BACKGROUND OF THE INVENTION

この発明は、一般的には、マルチプロセッシングコンピュータシステムの分野
に関する。より特定的には、この発明は、マルチプロセッシングコンピュータシ
ステムのためのスケーラブル単一システム画像(「S31」)オペレーティング
ソフトウェアに関する。
The present invention relates generally to the field of multi-processing computer systems. More specifically, the present invention relates to scalable single system image ("S31") operating software for a multi-processing computer system.

【0002】 単一のモノリシック中央メモリへの2つ以上の同種のプロセッサの接続は、マ
ルチプロセッシングと呼ばれる。最近まで、ハードウェアおよびソフトウェアの
限界によって、単一メモリに効率よくアクセス可能である物理的プロセッサの総
数は最小限のものであった。コンピュータシステム内のプロセッサの数が増える
のに伴って、これらの限界は計算効率性を維持する能力を低下させ、システムの
全体的なスケーラビリティを低下させてきた。より高速でこれまでよりも安価な
マイクロプロセッサの到来とともに、大きいプロセッサカウントシステムがハー
ドウェアの現実となってきている。
[0002] The connection of two or more homogeneous processors to a single monolithic central memory is called multiprocessing. Until recently, due to hardware and software limitations, the total number of physical processors that could efficiently access a single memory was minimal. As the number of processors in a computer system increases, these limitations have reduced the ability to maintain computational efficiency and have reduced the overall scalability of the system. With the advent of faster and cheaper microprocessors, large processor count systems are becoming a reality for hardware.

【0003】 ハードウェアの進歩は、効率の低下を最小限度としながらも、相互接続された
ネットワークが単一のメモリに対して何百個のプロセッサを多重化することを可
能にした。大きい構成内のソフトウェアロッキング基本命令(primitive)に関 する性能の問題のために、多数のプロセッサを効率よく収容するのに必要とされ
るオペレーティングソフトウェアスケーラビリティを、システムの設計者らは未
だ得ていない。
[0003] Advances in hardware have allowed interconnected networks to multiplex hundreds of processors to a single memory, with minimal loss of efficiency. Due to performance issues with software locking primitives in large configurations, system software designers still do not have the operating software scalability needed to efficiently accommodate large numbers of processors .

【0004】[0004]

【発明の概要】SUMMARY OF THE INVENTION

これらのコンピュータシステムアーキテクチャ効率性の問題に対応して、コロ
ラド州、コロラド・スプリングス、エス・アール・シィ・コンピューターズ・イ
ンコーポレイテッド(SRC Computers, Inc.)は、システムに大きい共有メモリ を与え高速の商業用プロセッサを利用して高帯域入力/出力(「I/O」)機能
性を得ることによって、従来の高性能スーパーコンピュータに取って代わる手頃
で高性能のコンピュータを開発した。これは、プロセッサ速度とメモリサイズと
I/O帯域幅との間のバランスを取って、システムのハードウェアとソフトウェ
アとの間の高度の効率性を達成することによって果たされ、このため並列性の度
合いはより大きくなった。
In response to these computer system architecture efficiency issues, SRC Computers, Inc., of Colorado Springs, Colorado, has provided systems with large shared memory, Utilizing commercial processors to obtain high-bandwidth input / output ("I / O") functionality has developed an affordable, high-performance computer that replaces traditional high-performance supercomputers. This is achieved by balancing processor speed, memory size, and I / O bandwidth to achieve a high degree of efficiency between the system hardware and software, thus achieving parallelism. The degree of the bigger.

【0005】 ここに開示されるのは、スケーラブル単一システム画像(「S31」)オペレ
ーティングソフトウェアアーキテクチャを利用するコンピュータシステムである
。このアーキテクチャは、単一システム画像を効率よく与えるマルチプロセッサ
環境において、数個のプロセッサから何百個のプロセッサまでの、オペレーティ
ングソフトウェアの効率的スケーラビリティを可能にする。この発明のS31ア
ーキテクチャは、超並列(「MPP」)アーキテクチャの必要性を実質的になく
す。これは単に、分散メモリおよびメッセージパッシング同期基本命令がもはや
必要でないからである。簡単でプログラムするのが簡単なフラットメモリモデル
がメッセージパッシングに取って代わる。共通のアプリケーションプログラミン
グインターフェイス/アプリケーションバイナリインターフェイス(「API/
ABI」)がすべてのアプリケーションに与えられる。メッセージパッシングパ
ラダイムを排除するために、計算的にも入力/出力(「I/O」)の観点からも
性能は大きく向上する。
[0005] Disclosed herein is a computer system that utilizes a scalable single system image ("S31") operating software architecture. This architecture enables efficient scalability of operating software from a few processors to hundreds of processors in a multiprocessor environment that efficiently provides a single system image. The S31 architecture of the present invention substantially eliminates the need for massively parallel ("MPP") architectures. This is simply because the distributed memory and message passing synchronization primitives are no longer needed. The flat memory model, which is simple and easy to program, replaces message passing. Common application programming interface / application binary interface ("API /
ABI ") is given to all applications. Eliminating the message passing paradigm greatly improves performance both computationally and in terms of input / output ("I / O").

【0006】 ここに開示されるのは、別個のサービスプロセッサおよび計算プロセッサを有
するマルチプロセッシングコンピュータシステムのためのスケーラブル単一シス
テム画像(「S31」)オペレーティングシステムアーキテクチャであって、こ
れらのプロセッサの間には独特の差異が存在するが、その両方がすべてのコンピ
ュータシステムメモリへの共有の共通アクセスを有する。計算プロセッサは、そ
れらの上に直接マッピングされる入力/出力(「I/O」)装置を有しないが、
サービスプロセッサは付加される装置を制御することができる。単一オペレーテ
ィングシステムソフトウェア画像は、すべてのプロセッサにわたってアプリケー
ションプログラムへの単一システムアプリケーションプログラミングインターフ
ェイスを与え、計算プロセッサとサービスプロセッサとの間の通信メカニズムは
、サービスプロセッサに対する複数個の要求と、各要求に対する高速の非同期割
込応答とを可能にする。計算スケジューラは、各計算プロセッサ上で実行し、オ
ペレーティングシステムソフトウェアが実行するサービスプロセッサへのインタ
ーフェイスを与える。
[0006] Disclosed herein is a scalable single system image ("S31") operating system architecture for a multi-processing computer system having a separate service processor and a compute processor, with a processor between the processors. Have unique differences, but both have shared common access to all computer system memory. Compute processors have no input / output ("I / O") devices mapped directly on them,
The service processor can control the added device. The single operating system software image provides a single system application programming interface to the application program across all processors, and the communication mechanism between the compute processor and the service processor uses multiple requests for the service processor and for each request Enables fast asynchronous interrupt response. The compute scheduler runs on each compute processor and provides an interface to the service processor where the operating system software runs.

【0007】 S31アーキテクチャはまた、キャッシュコンフリクトを低減することによっ
てキャッシュ性能を向上させる。このコンフリクトが低減されるのは、オペレー
ティングソフトウェアが、アプリケーション要求をサービスするプロセスの間、
キャッシュからのアプリケーションデータをもはや強制しないからである。最新
世代のマルチプロセッサが示すように、メモリ待ち時間に関するプロセッサ速度
が向上するにつれ、この性能向上はより重要となる。
[0007] The S31 architecture also improves cache performance by reducing cache conflicts. This conflict is reduced because the operating software must be able to process application requests during the process.
Because it no longer forces application data from the cache. As the processor speed in terms of memory latency increases, as the latest generation of multiprocessors shows, this performance improvement becomes more important.

【0008】 ここに特に開示されるのは、オペレーティングソフトウェアを含むマルチプロ
セッサコンピュータシステムである。このコンピュータシステムは、オペレーテ
ィングソフトウェアと連係して機能する第1の複数個のサービスプロセッサを含
み、このサービスプロセッサは、コンピュータシステムでのすべての入力/出力
機能を処理する。第2の複数個の計算プロセッサは、計算スケジューラと連係し
て機能する。オペレーティングソフトウェアおよび計算スケジューラは、サービ
スプロセッサと計算プロセッサとの間に通信媒体を与える。
[0008] Specifically disclosed herein is a multiprocessor computer system that includes operating software. The computer system includes a first plurality of service processors functioning in conjunction with operating software, the service processor handling all input / output functions in the computer system. The second plurality of computation processors function in conjunction with the computation scheduler. The operating software and the computation scheduler provide a communication medium between the service processor and the computation processor.

【0009】 ここにさらに開示されるのは、オペレーティングソフトウェアを含むマルチプ
ロセッサコンピュータシステムである。このコンピュータシステムは、第1の複
数個のサービスプロセッサと第2の複数個の計算プロセッサとを含む。このサー
ビスの各々は、オペレーティングソフトウェアと連係して機能し、コンピュータ
システムでの全ての入力/出力機能を処理する。この計算の各々は、計算スケジ
ューラと連係して機能し、オペレーティングソフトウェアおよび計算スケジュー
ラは、サービスプロセッサと計算プロセッサとの間に通信媒体を与える。
[0009] Further disclosed herein is a multiprocessor computer system that includes operating software. The computer system includes a first plurality of service processors and a second plurality of computing processors. Each of these services works in conjunction with operating software to handle all input / output functions in the computer system. Each of these calculations works in conjunction with a calculation scheduler, and the operating software and calculation scheduler provide a communication medium between the service processor and the calculation processor.

【0010】 添付図面と関連付けて好ましい実施例の以下の説明を参照することによって、
この発明の前記および他の特徴および目的ならびにそれらを達成するための方法
はより明らかとなり、この発明自体が最もよく理解される。
By referring to the following description of the preferred embodiment in connection with the accompanying drawings,
The above and other features and objects of the present invention and the manner of achieving them will become more apparent and the invention itself is best understood.

【0011】[0011]

【好ましい実施例の説明】DESCRIPTION OF THE PREFERRED EMBODIMENTS

図1Aおよび図1Bを参照すると、この発明に従うマルチプロセッシングコン
ピュータシステム10が示される。例示のコンピュータシステム10は、直接関
係のある部分で、任意の数の相互接続されたセグメント120から1215を含む が、この発明の原理は、如何なるスケーラブルシステムの多数のプロセッサにも
同様に適用可能である。以下に詳しく記載するとおり、さまざまなセグメント1
0から1215は、多数のトランクライン140から1415を介して結合される。
Referring to FIGS. 1A and 1B, a multi-processing computer system 10 according to the present invention is shown. Exemplary computer system 10, in pertinent part, including interconnected segments 12 0-12 15 any number of principles of the invention, equally applicable to multiple processors of any scalable system It is possible. Various segments 1 as described in detail below
2 0-12 15 is coupled via a number of trunk lines 14 0 to 14 15.

【0012】 セグメント12の各々は、サービスプロセッサ160から163(サービスプロ
セッサ160はマスタブート装置としてさらに機能する)および計算プロセッサ 180から1815の形を取る多数の機能的に異なる処理要素を含む。サービスプ ロセッサ16は、多数の周辺コンポーネント相互接続(「PCI」)インターフ
ェイスモジュール20に結合され、図示の実施例では、各サービスプロセッサは
、2つのそのようなモジュール20に結合され、サービスプロセッサ16がセグ
メント12のすべてのI/O機能を実行することを可能にする。
[0012] Each of the segments 12, 16 3 from the service processor 16 0 (service processor 16 0 further functioning as the master boot device) and a number of functionally distinct processing elements in the form of a calculation processor 18 0 18 15 including. The service processor 16 is coupled to a number of peripheral component interconnect ("PCI") interface modules 20, and in the illustrated embodiment, each service processor is coupled to two such modules 20 and the service processor 16 Allows all I / O functions of segment 12 to be performed.

【0013】 コンピュータシステム10は、システムコンソール24をコンピュータシステ
ム10の少なくとも1つのセグメント12に結合するシリアル−PCIインター
フェイス22をさらに含む。システムコンソール24は、コンピュータシステム
10のユーザがブート情報をコンピュータシステム10にダウンロードし、装置
を構成し、ステータスを監視し、診断機能を実行することを可能にするよう動作
する。いくつセグメント12がコンピュータシステム10内に構成されていよう
とも、必要とされるシステムコンソール24は1つのみである。
Computer system 10 further includes a serial-PCI interface 22 that couples system console 24 to at least one segment 12 of computer system 10. The system console 24 operates to allow a user of the computer system 10 to download boot information to the computer system 10, configure devices, monitor status, and perform diagnostic functions. No matter how many segments 12 are configured in computer system 10, only one system console 24 is required.

【0014】 ブート装置26(たとえば、ユタ州、ロイのイオメガ社(Iomega Corporation
, Roy UT)から入手可能な、JAZ(登録商標)取外し可能ディスクコンピュー
タ大容量記憶装置)もまた、PCIモジュール20の1つを介してマスタブート
サービスプロセッサ160に結合される。サービスプロセッサ161から163に 結合されるPCIモジュール20は、たとえば、ディスクアレイ280から285 などのすべての他の周辺装置にセグメント12を結合するために利用され、この
うち任意の1つ以上が、たとえば、イーサネット接続と置き換えられてもよい。
A boot device 26 (eg, Iomega Corporation, Roy, Utah)
, Roy UT), available from, JAZ (R) removable disk computer mass storage device) is also coupled to the master boot service processor 16 0 through one of the PCI module 20. PCI module is coupled from the service processor 16 1 to 16 3 20, for example, be utilized to couple the segment 12 to any other peripheral devices such as 5 from 0 disk array 28 28, one of any these The above may be replaced with, for example, an Ethernet connection.

【0015】 コンピュータシステム10は、洗練されたハードウェアおよびビルディングブ
ロックを含み、これは商業ベースであって、高性能計算(「HPC」)の特異性
に適合するようにいくぶん改良されている。ハードウェア側では、コンピュータ
システム10の基本ユニットはセグメント12である。各セグメント12は、計
算およびサービスプロセッサ18、16要素、メモリ、電源ならびにクロスバー
スイッチアセンブリを含む。コンピュータシステム10は、エンドユーザが1か
ら16の相互接続されたセグメント12からなるシステムを構成することができ
るという点で、「スケーラブル」である。各セグメント12は、全部で20個の
プロセッサ、すなわち、16個の計算プロセッサ18と4個のサービスプロセッ
サ16とを含む。好ましい実施例では、計算プロセッサ18は、4個のプロセッ
サ(たとえば、カリフォルニア州、サンタクララのインテル社(Intel Corporat
ion, Santa Clara, CA)から入手可能のDeschutesTMマイクロプロセッサ)と8 個のインターフェイスチップ(すなわち計算プロセッサ18 1個あたり2個)
とを含む個々のアセンブリ上にあってもよい。各計算プロセッサ18は、300
MHzより高い内部プロセッサクロックレートと、100MHzより高いシステ
ムクロック速度とを有し、インターフェイスチップは、以下に詳細に記載し示す
とおり、計算プロセッサ18とメモリに接続するメモリスイッチとの間に接続を
与える。
Computer system 10 includes sophisticated hardware and building blocks, which are commercially available and are somewhat improved to accommodate the specifics of high performance computing (“HPC”). On the hardware side, the basic unit of computer system 10 is segment 12. Each segment 12 includes a compute and service processor 18, 16 elements, memory, power supplies and a crossbar switch assembly. Computer system 10 is "scalable" in that end users can configure a system consisting of one to sixteen interconnected segments 12. Each segment 12 includes a total of 20 processors, namely, 16 computation processors 18 and 4 service processors 16. In the preferred embodiment, compute processor 18 has four processors (eg, Intel Corporat, Santa Clara, Calif.).
ion, Santa Clara, CA), available from Deschutes TM microprocessor) and eight interface chips (i.e. two calculation processor 18 per)
And may be on individual assemblies including Each calculation processor 18 has 300
Having an internal processor clock rate of greater than 100 MHz and a system clock rate of greater than 100 MHz, the interface chip provides a connection between the computing processor 18 and a memory switch that connects to the memory, as described and described in detail below. .

【0016】 サービスプロセッサ16は、サブプロセッサアセンブリ上に含まれてもよく、
これはコンピュータシステム10でのすべての入力および出力を担う。サービス
プロセッサアセンブリの各々は、プロセッサ(計算プロセッサ18と同じ種類)
、2つのインターフェイスチップ、2つの1MバイトI/Oバッファおよび2つ
の双方向PCIバスを含む。各PCIバスは単一のコネクタを有する。すべての
I/Oポートは、プロセッサに対する優先順位が等しいDMA能力を有する。P
CIモジュール20は、どのサービスプロセッサ16によってこれらが使用され
るかによって、2つの目的を果たす。マスタブートサービスプロセッサ160上 のPCIコネクタは、ブート装置26およびシステムコンソール24に接続する
ために使用される。レギュラーサービスプロセッサ161から163上のPCIモ
ジュール20は、すべての他の周辺装置に対して使用される。サポートされるP
CIベース相互接続のいくつかは、スモールコンピュータシステムインターフェ
イス(「SCSI」)、ファイバ分散データインターフェイス(「FDDI」)
、高性能並列インターフェイス(「HIPPI」)およびその他を含む。各PC
Iバスは、対応する商業ベースのホストアダプタを有する。
The service processor 16 may be included on a sub-processor assembly,
It is responsible for all inputs and outputs at computer system 10. Each of the service processor assemblies is a processor (same type as the computation processor 18)
Includes two interface chips, two 1 Mbyte I / O buffers and two bidirectional PCI buses. Each PCI bus has a single connector. All I / O ports have equal priority DMA capabilities to the processor. P
The CI module 20 serves two purposes, depending on which service processor 16 uses them. PCI connector master boot service processor 16 on 0 is used to connect to the boot device 26 and the system console 24. PCI module 20 from the regular service processor 16 1 16 on 3 is used for all other peripheral devices. Supported P
Some of the CI-based interconnects include Small Computer System Interface ("SCSI"), Fiber Distributed Data Interface ("FDDI")
, High Performance Parallel Interface ("HIPPI") and others. Each PC
The I-bus has a corresponding commercial host adapter.

【0017】 サービス機能を計算機能から分離することによって、数値的処理とオペレーテ
ィングシステムデューティおよび外部周辺装置のサービスとの同時実行が可能と
なる。
Separating the service functions from the computation functions allows simultaneous execution of numerical processing and operating system duty and services of external peripherals.

【0018】 さらに図2を参照すると、図1Aおよび図1Bのコンピュータシステム10の
相互接続ストラテジーが、16個のトランクライン140から1415によって相 互接続される16個のセグメント120から1215を採用する実現化例において 、より詳細に示される。図示のとおり、多数のメモリバンク500から5015は 、各々が計算プロセッサ180から1815のそれぞれ1つに割当てられ(セグメ ント12 1つあたり16個のメモリバンク50があるので、16個のセグメン
ト12があるコンピュータシステム10では合計256個のメモリバンク50が
あることになる)、コンピュータシステム10の一部を形成し、トランクライン
140から1415に、同数のメモリスイッチ520から5215を介してそれぞれ結
合される。メモリバンク500から5015に利用されるメモリは、シンクロナス スタティックランダムアクセスメモリ(「SSRAM」)または他の好適な高速
メモリ装置であってもよい。また図示のとおり、セグメント120から1215の 各々は、たとえば、トランクライン140から1415に、同数のプロセッサスイ ッチ540から5415の対応する1つを介して結合される、20個のプロセッサ (4個のサービスプロセッサ160から163および16個の計算プロセッサ18 0 から1815)を含む。
Referring still to FIG. 2, the computer system 10 of FIGS. 1A and 1B
The interconnect strategy has 16 trunk lines 140From 14Fifteen16 segments 12 interconnected by0From 12FifteenThis is shown in more detail in an implementation that employs As shown, a number of memory banks 500From 50FifteenAre the calculation processors 180From 18Fifteen(Since there are 16 memory banks 50 per segment 12, there are 16 segment banks.
In the computer system 10 with the memory 12, a total of 256 memory banks 50 are provided.
Will form part of the computer system 10
140From 14FifteenAnd the same number of memory switches 520From 52FifteenThrough each
Are combined. Memory bank 500From 50FifteenThe memory utilized for synchronous random access memory ("SSRAM") or other suitable high speed
It may be a memory device. As shown, segment 120From 12FifteenEach, for example, the trunk line 140From 14FifteenAnd the same number of processor switches 540From 54Fifteen20 processors (4 service processors 16) coupled via a corresponding one of0From 16ThreeAnd 16 calculation processors 18 0 From 18Fifteen)including.

【0019】 各セグメント12は、クロスバースイッチを介してすべての他のセグメント1
2と相互接続する。コンピュータシステム10クロスバースイッチ技術は、セグ
メント12がセグメントの境界を越えて、さらに個々のセグメント12内でも、
均一なメモリアクセス時間を有することを可能にする。それはまた、コンピュー
タシステム10がシステム内のすべてのメモリに対する単一のメモリアクセスプ
ロトコルを採用することも可能にする。クロスバースイッチは、高速フィールド
プログラマブルゲートアレイ(「FPGA」)を利用し、プロセッサおよびメモ
リが物理的にどこに位置しているかにかかわらず、メモリとプロセッサとの間の
相互接続経路を与えることができる。このクロスバースイッチは、あらゆるセグ
メント12を相互接続し、異なったセグメント12に位置するプロセッサおよび
メモリが均一の待ち時間で通信することを可能にする。好ましい実施例では、各
クロスバースイッチは、1層あたり1クロックの待ち時間を有し、これは再構成
時間を含む。320個のプロセッサ16、18を利用する16個のセグメント1
2を備えるコンピュータシステム10では、必要とされるクロスバー層は2つの
みである。
Each segment 12 is connected to all other segments 1 via a crossbar switch.
Interconnect with 2. Computer system 10 crossbar switch technology allows segments 12 to cross segment boundaries and even within individual segments 12.
It allows to have a uniform memory access time. It also allows computer system 10 to employ a single memory access protocol for all memories in the system. Crossbar switches can utilize high speed field programmable gate arrays ("FPGAs") to provide an interconnect path between memory and processor, regardless of where the processor and memory are physically located. . This crossbar switch interconnects every segment 12 and allows processors and memories located in different segments 12 to communicate with uniform latency. In the preferred embodiment, each crossbar switch has a latency of one clock per layer, which includes the reconfiguration time. 16 segments 1 utilizing 320 processors 16, 18
In a computer system 10 with two, only two crossbar layers are required.

【0020】 前述したとおり、コンピュータシステム10は、好ましくは、メモリバンク5
0にSSRAMを利用してもよい。というのも、これは6ナノ秒のコンポーネン
トサイクル時間を提供するからである。各メモリバンク50は、64から256
Mバイトのメモリをサポートする。各計算プロセッサ18は、1つのメモリバン
ク50をサポートし、各メモリバンク50は256ビット幅であって、32パリ
ティビットを加えて合計288ビットの幅である。加えて、メモリバンク50の
大きさをキャッシュラインの大きさに一致するよう設計すると、全キャッシュラ
インに対するバンクアクセスを一回とすることが可能である。アドレスパケット
およびデータパケットに対してパリティチェックを完了することによって、読出
および書込メモリエラー修正が与えらてもよい。
As mentioned above, the computer system 10 preferably includes the memory bank 5
0 may use SSRAM. This provides a component cycle time of 6 nanoseconds. Each memory bank 50 has 64 to 256
Supports M bytes of memory. Each compute processor 18 supports one memory bank 50, each memory bank 50 being 256 bits wide, plus 32 parity bits, for a total of 288 bits. In addition, if the size of the memory bank 50 is designed to match the size of the cache line, it is possible to make one bank access to all the cache lines. Completing the parity check on the address and data packets may provide read and write memory error correction.

【0021】 アドレスパケットに対するパリティチェックは、読出機能でも書込機能でも同
じであり得る。新しいパリティビットと古いパリティビットとが比較されてメモ
リ読出または書込を続行するべきかアボートするべきかを決定する。メモリ「書
込」が生じる場合、パリティチェックはメモリに到着するデータパケットの各々
に対してなされてもよい。これらのデータパケットの各々は、それに付加される
8ビットのパリティコードを有する。データパケットがメモリに到着すると、新
しい8ビットのパリティコードがデータパケットに対して生成され、古いパリテ
ィコードと新しいパリティコードとが比較される。この比較によって、2種類の
コード、すなわち、シングルビットエラー(「SBE」)またはダブルビットも
しくは複数ビットエラー(「DBE」)のうちの1つが得られる。シングルビッ
トのエラーは、データパケット上で、それがメモリに入れられる前に、訂正され
てもよい。ダブルビットまたは複数ビットのエラーの場合、データパケットはメ
モリに書込まれず、プロセッサにレポートされ、これがデータパケット参照を再
試行する。メモリ「読出」が生じる場合、メモリから読出されるデータパケット
の各々は、8ビットのパリティコードを生成する。このパリティコードは、デー
タとともにプロセッサへ送られる。プロセッサは、シングルエラー訂正およびダ
ブルエラー検出(「SECDED」)を各データパケットに対して実行する。
The parity check for an address packet can be the same for both read and write functions. The new and old parity bits are compared to determine whether the memory read or write should continue or abort. If a memory "write" occurs, a parity check may be made for each data packet arriving at the memory. Each of these data packets has an 8-bit parity code appended to it. When a data packet arrives in memory, a new 8-bit parity code is generated for the data packet and the old and new parity codes are compared. This comparison yields one of two types of codes: a single bit error ("SBE") or a double or multiple bit error ("DBE"). Single bit errors may be corrected on the data packet before it is put into memory. For double or multiple bit errors, the data packet is not written to memory and is reported to the processor, which retries the data packet reference. When a memory "read" occurs, each of the data packets read from the memory generates an 8-bit parity code. This parity code is sent to the processor together with the data. The processor performs single error correction and double error detection ("SECEDED") on each data packet.

【0022】 さらに図3を参照すると、64個のサービスプロセッサ16と256個の計算
プロセッサ18との合計320個のプロセッサを含む、16個のセグメント12
を備えるコンピュータシステム10の簡素化された図が示される。サービスプロ
セッサ16および計算プロセッサ18は、以下に詳細に記載するとおり、スケー
ラブル単一システム画像(「S31」)層60によって、コンピュータプログラ
ムアプリケーションソフトウェアにインターフェイスする。サービスプロセッサ
16は、前述したとおりすべてのI/O動作を処理し、さらにコンピュータシス
テム10オペレーティングシステムの実行を処理する。
Still referring to FIG. 3, 16 segments 12 containing 64 service processors 16 and 256 compute processors 18, for a total of 320 processors
A simplified diagram of a computer system 10 comprising a is shown. Service processor 16 and compute processor 18 interface to computer program application software through a scalable single system image ("S31") layer 60, as described in more detail below. The service processor 16 handles all I / O operations as described above, and also handles the execution of the computer system 10 operating system.

【0023】 さらに図4を参照すると、S31層60がより詳細に示され、これはコンピュ
ータプログラムコードアプリケーション62ソフトウェアとサービスおよび計算
プロセッサ16、18とに関連付けられている。S31層60は、アプリケーシ
ョン62の上部上にあって、共通のAPI/ABI層64とさらに計算スケジュ
ーラ66層およびオペレーティングソフトウェア68層とを含む。計算スケジュ
ーラ66は計算プロセッサ180から1815にインターフェイスし、一方、オペ レーティングソフトウェア68はサービスプロセッサ160から163にインター
フェイスする。オペレーティングソフトウェア68は、図示のとおり、計算スケ
ジューラに割込応答信号70を与えて計算プロセッサ18の動作を制御する。多
数のメモリ通信バッファ72は、さまざまな計算プロセッサ180から1815か らデータを受取って、サービスプロセッサ160から163にデータを与える。
Still referring to FIG. 4, the S31 layer 60 is shown in more detail, which is associated with the computer program code application 62 software and service and computing processors 16,18. The S31 layer 60 is on top of the application 62 and includes a common API / ABI layer 64 and further a calculation scheduler 66 layer and an operating software 68 layer. Calculating the scheduler 66 is the interface to the calculation processor 18 0 to 18 15, while the operating software 68 interface from the service processor 16 0 to 16 3. The operating software 68 provides an interrupt response signal 70 to the calculation scheduler to control the operation of the calculation processor 18 as shown. A plurality of memory communication buffer 72 receives the 18 15 or data from the various computing processors 18 0 provides data from the service processor 16 0 to 16 3.

【0024】 さきに記載し示したとおり、この発明のスケーラブル単一システム相互接続ア
ーキテクチャの好ましい実現化例は、複数個のメモリバンク500から50Nを含
む共通の共有メモリにわたって均一のメモリアクセスを備えるマルチプロセッサ
コンピュータシステム10上にある。前述したとおり、プロセッササブシステム
は、2つのグループ、つまり、I/O接続を有するもの、すなわちサービスプロ
セッサ160から16Nと、I/O接続を有さないもの、すなわち計算プロセッサ
180から18Nとに隔てられてもよい。
[0024] As shown described above, a preferred realization flounder scalable single system interconnect architecture of the present invention, a uniform memory access from a plurality of memory banks 50 0 over common shared memory containing 50 N Provided on a multiprocessor computer system 10. As described above, the processor subsystem, two groups, i.e., those having an I / O connection, and the service processor 16 0 16 N, having no I / O connections, i.e. from the calculation processor 18 0 18 N.

【0025】 S31は、サービスおよび計算プロセッサ16、18からなるソフトウェア環
境を利用する。オペレーティングシステムソフトウェア68の単一のコピーは、
サービスパーティション内のすべてのプロセッサ16にわたって存在する。別個
の計算スケジューラ66が、各計算プロセッサ18内に存在する。このソフトウ
ェアモデルは、強力な「単一システム画像」と連係して、パラダイムを共有する
グローバル資源を保証する。このアーキテクチャを効率よく利用するためには、
実行の高度にスケーラブルなスレッドが、高度のソフトウェア「マルチスレッド
」と連係して、オペレーティングシステムソフトウェア68とユーザアプリケー
ション62ソフトウェアデザインモデルとの両方に存在していなければならない
S 31 utilizes a software environment consisting of the service and computing processors 16, 18. A single copy of operating system software 68
It exists across all processors 16 in the service partition. A separate computation scheduler 66 resides within each computation processor 18. This software model works with powerful "single system images" to ensure a global resource sharing paradigm. To use this architecture efficiently,
A highly scalable thread of execution must be present in both the operating system software 68 and the user application 62 software design model in conjunction with the advanced software "multithreading."

【0026】 コンピュータシステム10の強力な共有メモリハードウェアアーキテクチャの
ために、オペレーティングソフトウェア68機能のこの選択により、プロセッサ
同士またはハードウェア境界の間の通信のためのメッセージパッシングパラダイ
ムの必要性がなくなる。しかしながら、ある程度の簡単な通信は、計算プロセッ
サ18とサービスプロセッサ16との間に必要とされる。如何なる物理的ハード
ウェア境界もアプリケーション62プログラムにとっては明らかではない。物理
的プロセッサ16、18はすべて、エンドユーザに同じアプリケーションプログ
ラミングインターフェイス(API)を与える。
Due to the powerful shared memory hardware architecture of computer system 10, this choice of operating software 68 features eliminates the need for a message passing paradigm for communication between processors or between hardware boundaries. However, some simple communication is required between the compute processor 18 and the service processor 16. No physical hardware boundaries are apparent to the application 62 program. The physical processors 16, 18 all provide the same application programming interface (API) to the end user.

【0027】 スケーラビリティモデルを完了するために、ユーザアプリケーション62は、
アプリケーションユーザ空間内の実行の複数のスレッドを開始しかつ終了するこ
とができ、このためオペレーティングシステムソフトウェア68のオーバーヘッ
ドのさらなる排除と、物理的プロセッサの数が増える場合のスケーラビリティの
増大とが可能となる。
To complete the scalability model, the user application 62
Multiple threads of execution in application user space can be started and terminated, further eliminating the overhead of operating system software 68 and increasing scalability as the number of physical processors increases. .

【0028】 S31アーキテクチャの下では、ユーザアプリケーション62は、通常のシス
テムソフトウェアメカニズム内でシステムに要求をする。アプリケーション62
は、アプリケーション62がサービスプロセッサ16上で実行しているのかまた
は計算プロセッサ18上で実行しているのかを認識していない。要求がサービス
プロセッサ16で実行される場合、要求は通常のオペレーティングシステムバス
を通ってオペレーティングシステムソフトウェア68内に直接入り処理される。
Under the S31 architecture, a user application 62 makes a request to the system within a normal system software mechanism. Application 62
Does not know if the application 62 is running on the service processor 16 or on the computation processor 18. When the request is executed by the service processor 16, the request is entered directly into the operating system software 68 via the normal operating system bus for processing.

【0029】 要求が計算プロセッサ18上で実行される場合、要求は計算スケジューラ66
によって処理される。要求しているスレッドはサービスプロセッサ16の実行待
ちキュー上に置かれ、計算プロセッサ18はサービスプロセッサ16へキューを
調べるよう要求を発行する。サービスプロセッサ16内で実行するオペレーティ
ングソフトウェア68は、要求キューを調べ、あたかもそれがサービスプロセッ
サ上で生じたかのように要求を処理する。
If the request is to be executed on compute processor 18, the request
Processed by The requesting thread is placed on the pending queue of the service processor 16 and the compute processor 18 issues a request to the service processor 16 to check the queue. Operating software 68 running in service processor 16 examines the request queue and processes the request as if it had occurred on the service processor.

【0030】 要求している計算プロセッサ18は、割込み応答まで一時停止されるか、また
は、オペレーティングソフトウェア68によって維持される一般的なスケジュー
リングテーブルに置かれてさらなる作業をディスパッチする。サービスプロセッ
サ16は、アプリケーションスレッドをキューイングしこれは計算プロセッサ1
8上で実行され、元のアプリケーションコンテキストを復活してこれがアプリケ
ーション62を実行に戻すことによって、元の要求に応答する。
The requesting processor 18 is suspended until an interrupt response or is placed in a general scheduling table maintained by operating software 68 to dispatch further work. The service processor 16 queues the application thread, which is
8 and responds to the original request by restoring the original application context, which returns the application 62 to execution.

【0031】 基準オペレーティングソフトウェア68への非常に小さい計算スケジューラ6
6と小さいさらなるコンポーネントとの追加の他は、オペレーティングソフトウ
ェア68の大きな変更は必要とされないことが注目される。サービスパーティシ
ョン内の如何なる物理的プロセッサ16も、オペレーティングシステム68内で
同時に実行可能である。重要なデータ領域は、下にあるハードウェア内に現在見
出される標準のロッキング基本命令を利用してロック可能である。
Very small computation scheduler 6 to reference operating software 68
It is noted that no major changes in operating software 68 are required, other than the addition of 6 and smaller additional components. Any physical processors 16 in the service partition can execute simultaneously in operating system 68. Critical data areas can be locked using standard locking primitives currently found in the underlying hardware.

【0032】 ソフトウェア環境の基本コンポーネントは、オペレーティングシステムソフト
ウェア68である。好ましい実施例では、コンピュータシステム10は、カリフ
ォルニア州、パロアルトのサン・マイクロシステムズ社(Sun Microsystems, In
c. Palo Alto, CA)から入手可能であるサンソフト(登録商標)ソラリス(登録
商標)2.6オペレーティングシステム(Sun Soft, Solaris 2.6 Operating Sy
stem)の強化バージョンであって、オペレーティングシステムをサービスプロセ
ッサ16内でのみ実行するように制限することによって複数の計算およびサービ
スプロセッサ18、16にわたってよりよい性能を達成するように変形されたも
のを使用してもよい。前述したとおり、この技術はさらに、計算スケジューラ6
6を利用してサービスプロセッサ16と計算プロセッサ18との間でオペレーテ
ィングシステム要求およびスケジューリング情報を通信することによって、達成
される。
The basic component of the software environment is operating system software 68. In a preferred embodiment, the computer system 10 is a Sun Microsystems, Inc., Palo Alto, California.
c. Palo Alto, CA) available from SunSoft, Solaris 2.6 Operating Sy.
stem), modified to achieve better performance across multiple compute and service processors 18, 16 by restricting the operating system to run only in service processor 16. May be. As described above, this technique further includes a calculation scheduler 6
This is accomplished by utilizing OS 6 to communicate operating system requests and scheduling information between service processor 16 and compute processor 18.

【0033】 換言すれば、オペレーティングシステムソフトウェア68の単一のコピーは、
すべてのサービスプロセッサ16内で実行し、一方、別個の計算スケジューラ6
6は各計算プロセッサ18内にある。このソフトウェアモデルは、強力なスケー
ラブル単一システム画像と連係してグローバル資源共有に供する。この発明のコ
ンピュータシステム10は、高度のソフトウェア「マルチスレッド」と連係して
、オペレーティングシステムソフトウェア68とユーザアプリケーションソフト
ウェア62との両方において実行の高度にスケーラブルなスレッドに供する。
In other words, a single copy of operating system software 68
Running in all service processors 16, while a separate computation scheduler 6
6 is in each calculation processor 18. This software model, coupled with powerful scalable single system images, provides for global resource sharing. The computer system 10 of the present invention, in conjunction with advanced software "multithreading", provides a highly scalable thread of execution in both the operating system software 68 and the user application software 62.

【0034】 特定のコンピュータアーキテクチャと関連付けてこの発明の原理が上述された
が、如何なる数のサービスおよび/または計算プロセッサが利用されてもよく、
前記記載は例としてのみなされこの発明の範囲を制限するものではないことが明
らかである。特に前記開示の教示は、当業者には他の変形を示唆することが認め
られる。そのような変形は、それ自体周知であって、ここに記載された特徴に代
えてまたはそれに加えて用いられ得る他の特徴を含むであろう。クレームが、特
徴の特定の組合せに対してこの出願において明確に表現されているが、ここに開
示される範囲はまた、当業者には明らかであろう如何なる新規な特徴、または、
明示的にまたは非明示的に開示される特徴の如何なる新規な組合せ、または如何
なるその一般化または変形をも含み、これはそういったものがここでいずれかの
クレームにクレームされたのと同じ発明に関連するかどうかにかかわらず、また
それがこの発明が対処するのと同じ技術的課題のすべてのまたはいずれかを軽減
するかどうかにかかわらない。出願人は、この発明のまたはそこから由来するさ
らなる出願の手続遂行の間に、そのような特徴または/およびそのような特徴の
組合せに対する新しいクレームを明確に表現する権利をここに留保する。
Although the principles of the present invention have been described above in connection with a particular computer architecture, any number of services and / or computing processors may be utilized,
It is clear that the above description is to be regarded as illustrative and not restrictive of the scope of the invention. In particular, it is recognized that the teachings of the above disclosure will suggest other modifications to those skilled in the art. Such variations would include other features that are known per se and may be used instead of or in addition to the features described herein. Although the claims are expressly stated in this application for a particular combination of features, the scope disclosed herein also includes any novel features or modifications that would be apparent to those skilled in the art.
Includes any novel combination of features, either explicitly or implicitly disclosed, or any generalization or variation thereof, which relates to the same invention as claimed herein in any claim. Whether or not to do so, whether or not it alleviates all or any of the same technical problems addressed by the present invention. Applicant reserves the right to expressly claim new claims for such features or / and combinations of such features during the prosecution of this application or of any further application derived therefrom.

【図面の簡単な説明】[Brief description of the drawings]

【図1A】 1個から16個の、同数のトランクラインによって互いに結合
されるセグメントを含み、各セグメントは多数の計算プロセッサおよびサービス
プロセッサとさらにメモリおよびクロスバースイッチアセンブリとを含む、この
発明の実施例に従うコンピュータシステムを例示する機能ブロックシステム概観
図である。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1A is an implementation of the invention that includes one to sixteen segments connected to each other by an equal number of trunk lines, each segment including a number of compute and service processors and also a memory and crossbar switch assembly. 1 is a functional block system overview diagram illustrating a computer system according to an example.

【図1B】 1個から16個の、同数のトランクラインによって互いに結合
されるセグメントを含み、各セグメントは多数の計算プロセッサおよびサービス
プロセッサとさらにメモリおよびクロスバースイッチアセンブリとを含む、この
発明の実施例に従うコンピュータシステムを例示する機能ブロックシステム概観
図である。
FIG. 1B is an implementation of the present invention that includes one to sixteen segments connected to each other by an equal number of trunk lines, each segment including a number of compute and service processors and also a memory and crossbar switch assembly. 1 is a functional block system overview diagram illustrating a computer system according to an example.

【図2】 図1Aおよび図1Bのコンピュータシステムのための相互接続ス
トラテジーの簡素化された機能ブロック図である。
FIG. 2 is a simplified functional block diagram of an interconnect strategy for the computer system of FIGS. 1A and 1B.

【図3】 この発明に従うスケーラブル単一システム画像(「S31」)を
介してコンピュータプログラムアプリケーションソフトウェアにインターフェイ
スする256個の計算プロセッサおよび64個のサービスプロセッサを含む16
セグメントシステムを例示する、図1A、図1Bおよび図2のコンピュータシス
テムの簡素化された機能ブロック図である。
FIG. 3 includes a 256 computation processor and 64 service processors that interface to a computer program application software via a scalable single system image (“S31”) in accordance with the present invention.
FIG. 3 is a simplified functional block diagram of the computer system of FIGS. 1A, 1B and 2 illustrating a segment system.

【図4】 計算スケジューラを介する計算プロセッサと、計算スケジューラ
に割込応答を与えるオペレーティングソフトウェアを介するサービスプロセッサ
とへの共通API/ABIを介するコンピュータプログラムアプリケーションソ
フトウェアへのインターフェイスを例示する、図3のシステムの一部に対応する
単一セグメントコンピュータシステムのより詳細なブロック図である。
FIG. 4 illustrates the system of FIG. 3 illustrating an interface to computer program application software via a common API / ABI to a compute processor via a compute scheduler and a service processor via operating software to provide an interrupt response to the compute scheduler. FIG. 4 is a more detailed block diagram of a single-segment computer system corresponding to part of FIG.

【手続補正書】[Procedure amendment]

【提出日】平成12年7月24日(2000.7.24)[Submission date] July 24, 2000 (2000.7.24)

【手続補正1】[Procedure amendment 1]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】特許請求の範囲[Correction target item name] Claims

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【特許請求の範囲】[Claims]

───────────────────────────────────────────────────── フロントページの続き (72)発明者 ベルトーニ,ジョナサン・エル アメリカ合衆国、80918 コロラド州、コ ロラド・スプリングス、パラゴン・ドライ ブ、2630、アパートメント・イー Fターム(参考) 5B045 AA01 BB12 BB28 BB29 DD12 EE02 GG07 GG08 GG12 5B098 AA10 GA01 GA02 GC16 【要約の続き】 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Bertoni, Jonathan El, United States, 80918 Colorado, Colorado Springs, Paragon Drive, 2630, Apartment E F-term (reference) 5B045 AA01 BB12 BB28 BB29 DD12 EE02 GG07 GG08 GG12 5B098 AA10 GA01 GA02 GC16 [Continuation of summary]

Claims (19)

【特許請求の範囲】[Claims] 【請求項1】 オペレーティングソフトウェアを含むマルチプロセッサコン
ピュータシステムであって、 前記オペレーティングソフトウェアと連係して機能する第1の複数個のサービ
スプロセッサを含み、前記サービスプロセッサは前記コンピュータシステムでの
すべての入力/出力機能を処理し、さらに、 第2の複数個の計算プロセッサを含み、前記計算プロセッサは計算スケジュー
ラと連係して機能し、前記オペレーティングソフトウェアおよび計算スケジュー
ラは前記サービスプロセッサと前記計算プロセッサとの間に通信媒体を与える、
マルチプロセッサコンピュータシステム。
1. A multi-processor computer system including operating software, the system including a first plurality of service processors operative in conjunction with the operating software, wherein the service processor is configured to provide all input / outputs in the computer system. Processing an output function, further comprising a second plurality of computation processors, wherein the computation processors function in conjunction with a computation scheduler, wherein the operating software and the computation scheduler are located between the service processor and the computation processors. Give communication medium,
Multiprocessor computer system.
【請求項2】 前記通信媒体は、前記サービスプロセッサへの複数個の入力
/出力要求を可能にするよう動作する、請求項1に記載のマルチプロセッサコン
ピュータシステム。
2. The multiprocessor computer system according to claim 1, wherein said communication medium operates to enable a plurality of input / output requests to said service processor.
【請求項3】 前記通信媒体は、前記入力/出力要求への非同期応答を可能
にするよう動作する、請求項2に記載のマルチプロセッサコンピュータシステム
3. The multiprocessor computer system according to claim 2, wherein said communication medium is operative to enable an asynchronous response to said input / output request.
【請求項4】 前記サービスプロセッサおよび前記計算プロセッサは、複数
個の関連付けられたメモリバンクへの共有アクセスを有する、請求項1に記載の
マルチプロセッサコンピュータシステム。
4. The multiprocessor computer system of claim 1, wherein said service processor and said computing processor have shared access to a plurality of associated memory banks.
【請求項5】 前記計算スケジューラおよび前記オペレーティングソフトウ
ェアに動作的に結合される共通アプリケーションプログラミングインターフェイ
スをさらに含み、前記共通アプリケーションプログラミングインターフェイス、
前記計算スケジューラおよび前記オペレーティングソフトウェアは単一システム
画像アプリケーションプログラミングインターフェイスを含む、請求項1に記載
のマルチプロセッサコンピュータシステム。
5. The system of claim 1, further comprising: a common application programming interface operatively coupled to the computation scheduler and the operating software;
The multiprocessor computer system of claim 1, wherein the computation scheduler and the operating software include a single system image application programming interface.
【請求項6】 前記単一システム画像アプリケーションプログラミングイン
ターフェイスは、前記第1の複数個のサービスプロセッサと前記第2の複数個の
計算プロセッサとにわたってスケーラブルである、請求項5に記載のマルチプロ
セッサコンピュータシステム。
6. The multiprocessor computer system of claim 5, wherein said single system image application programming interface is scalable across said first plurality of service processors and said second plurality of computing processors. .
【請求項7】 前記第1の複数個のサービスプロセッサの少なくとも1つに
結合され前記コンピュータシステムのユーザがこれと対話することを可能にする
システムコンソールをさらに含む、請求項1に記載のマルチプロセッサコンピュ
ータシステム。
7. The multiprocessor of claim 1, further comprising a system console coupled to at least one of said first plurality of service processors to enable a user of said computer system to interact therewith. Computer system.
【請求項8】 前記第1の複数個のサービスプロセッサの前記少なくとも1
つに結合され前記コンピュータシステムをブートするブート装置をさらに含む、
請求項7に記載のマルチプロセッサコンピュータシステム。
8. The at least one of the first plurality of service processors.
A boot device coupled to the computer and booting the computer system.
A multiprocessor computer system according to claim 7.
【請求項9】 前記第1の複数個のサービスプロセッサの少なくとも1つに
結合される少なくとも1つのコンピュータ大容量記憶装置をさらに含む、請求項
1に記載のマルチプロセッサコンピュータシステム。
9. The multiprocessor computer system according to claim 1, further comprising at least one computer mass storage device coupled to at least one of said first plurality of service processors.
【請求項10】 前記第1の複数個のサービスプロセッサおよび前記第2の
複数個の計算プロセッサは第1のコンピュータシステムセグメントを含み、前記
コンピュータシステムは、 前記オペレーティングソフトウェアと連係して機能する第3の複数個のサービ
スプロセッサと 前記計算スケジューラと連係して機能する第4の複数個の計算プロセッサとを
含む少なくとも1つのさらなるコンピュータシステムセグメントをさらに含む、
請求項1に記載のマルチプロセッサコンピュータシステム。
10. The first plurality of service processors and the second plurality of computation processors include a first computer system segment, wherein the computer system functions in conjunction with the operating software. Further comprising at least one additional computer system segment comprising: a plurality of service processors; and a fourth plurality of compute processors operative in conjunction with the compute scheduler.
The multiprocessor computer system according to claim 1.
【請求項11】 オペレーティングソフトウェアを含むマルチプロセッサコ
ンピュータシステムであって、 第1の複数個のサービスプロセッサと第2の複数個の計算プロセッサとを含み
、前記サービスプロセッサの各々は前記オペレーティングソフトウェアと連係し
て機能し前記コンピュータシステムでのすべての入力/出力機能を処理し、前記
計算プロセッサの各々は計算スケジューラと連係して機能し、前記オペレーティ
ングソフトウェアおよび計算スケジューラは前記サービスプロセッサと前記計算
プロセッサとの間に通信媒体を与える、マルチプロセッサコンピュータシステム
11. A multiprocessor computer system including operating software, the system including a first plurality of service processors and a second plurality of computing processors, each of the service processors associated with the operating software. Functioning to handle all input / output functions in the computer system, each of the computing processors functioning in conjunction with a computing scheduler, wherein the operating software and the computing scheduler operate between the service processor and the computing processor. Multiprocessor computer system that provides a communication medium to
【請求項12】 前記通信媒体は、前記サービスプロセッサへの複数個の入
力/出力要求を可能にするよう動作する、請求項11に記載のマルチプロセッサ
コンピュータシステム。
12. The multiprocessor computer system according to claim 11, wherein said communication medium operates to enable a plurality of input / output requests to said service processor.
【請求項13】 前記通信媒体は、前記入力/出力要求への非同期応答を可
能にするよう動作する、請求項12に記載のマルチプロセッサコンピュータシス
テム。
13. The multiprocessor computer system according to claim 12, wherein said communication medium operates to enable asynchronous response to said input / output request.
【請求項14】 前記サービスおよび計算は複数個の関連付けられたメモリ
バンクへの共有アクセスを有する、請求項11に記載のマルチプロセッサコンピ
ュータシステム。
14. The multiprocessor computer system according to claim 11, wherein said services and computations have shared access to a plurality of associated memory banks.
【請求項15】 前記計算スケジューラおよび前記オペレーティングソフト
ウェアに動作的に結合される共通アプリケーションプログラミングインターフェ
イスをさらに含み、前記アプリケーションプログラミングインターフェイス、前
記計算スケジューラおよび前記オペレーティングソフトウェアは、単一システム
画像アプリケーションプログラミングインターフェイスを含む、請求項11に記
載のマルチプロセッサコンピュータシステム。
15. The system further comprising a common application programming interface operatively coupled to the computation scheduler and the operating software, wherein the application programming interface, the computation scheduler and the operating software include a single system image application programming interface. The multiprocessor computer system of claim 11, wherein:
【請求項16】 前記単一システム画像アプリケーションプログラミングイ
ンターフェイスは前記N個の計算セグメントにわたってスケーラブルである、請
求項15に記載のマルチプロセッサコンピュータシステム。
16. The multiprocessor computer system of claim 15, wherein said single system image application programming interface is scalable over said N computational segments.
【請求項17】 前記N個の計算セグメントの1つの前記第1の複数個のサ
ービスプロセッサの少なくとも1つに結合されて前記コンピュータシステムのユ
ーザがこれと対話することを可能にするシステムコンソールをさらに含む、請求
項11に記載のマルチプロセッサコンピュータシステム。
17. A system console coupled to at least one of said first plurality of service processors of one of said N computational segments to allow a user of said computer system to interact therewith. The multiprocessor computer system of claim 11, comprising:
【請求項18】 前記N個の計算セグメントの1つの前記第1の複数個のサ
ービスプロセッサの前記少なくとも1つに結合され前記コンピュータシステムを
ブートするブート装置をさらに含む、請求項17に記載のマルチプロセッサコン
ピュータシステム。
18. The multi-processor of claim 17, further comprising a boot device coupled to the at least one of the first plurality of service processors in one of the N computational segments to boot the computer system. Processor computer system.
【請求項19】 前記N個の計算セグメントの1つの前記第1の複数個のサ
ービスプロセッサの少なくとも1つに結合される少なくとも1つのコンピュータ
大容量記憶装置をさらに含む、請求項11に記載のマルチプロセッサコンピュー
タシステム。
19. The multi-processor of claim 11, further comprising at least one computer mass storage device coupled to at least one of the first plurality of service processors in one of the N computational segments. Processor computer system.
JP2000540495A 1998-01-20 1998-12-03 Scalable single-system image operating software for multi-processing computer systems Withdrawn JP2002509311A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US887198A 1998-01-20 1998-01-20
US09/008,871 1998-01-20
PCT/US1998/025586 WO1999036851A1 (en) 1998-01-20 1998-12-03 Scalable single system image operating software architecture for a multi-processing computer system

Publications (1)

Publication Number Publication Date
JP2002509311A true JP2002509311A (en) 2002-03-26

Family

ID=21734176

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000540495A Withdrawn JP2002509311A (en) 1998-01-20 1998-12-03 Scalable single-system image operating software for multi-processing computer systems

Country Status (4)

Country Link
EP (1) EP1064597A1 (en)
JP (1) JP2002509311A (en)
CA (1) CA2317132A1 (en)
WO (1) WO1999036851A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008527487A (en) * 2004-12-30 2008-07-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Data processing device

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109512A (en) * 1990-05-31 1992-04-28 International Business Machines Corporation Process for dispatching tasks among multiple information processors
US5325526A (en) * 1992-05-12 1994-06-28 Intel Corporation Task scheduling in a multicomputer system
EP0622731A3 (en) * 1993-04-26 1995-02-15 Ibm Boot architecture for microkernel based systems.

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008527487A (en) * 2004-12-30 2008-07-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Data processing device

Also Published As

Publication number Publication date
EP1064597A1 (en) 2001-01-03
WO1999036851A1 (en) 1999-07-22
CA2317132A1 (en) 1999-07-22

Similar Documents

Publication Publication Date Title
Kronenberg et al. VAXcluster: A closely-coupled distributed system
US7743191B1 (en) On-chip shared memory based device architecture
Baker Cluster computing white paper
US6249830B1 (en) Method and apparatus for distributing interrupts in a scalable symmetric multiprocessor system without changing the bus width or bus protocol
US6536000B1 (en) Communication error reporting mechanism in a multiprocessing computer system
US6081883A (en) Processing system with dynamically allocatable buffer memory
US6253271B1 (en) Bridge for direct data storage device access
EP0777179B1 (en) Direct bulk data transfers
Dubnicki et al. Software support for virtual memory-mapped communication
US7788334B2 (en) Multiple node remote messaging
US6044207A (en) Enhanced dual port I/O bus bridge
US20100017655A1 (en) Error Recovery During Execution Of An Application On A Parallel Computer
US5944809A (en) Method and apparatus for distributing interrupts in a symmetric multiprocessor system
JP2002519785A (en) Split directory-based cache coherency technique for multiprocessor computer systems
US6996645B1 (en) Method and apparatus for spawning multiple requests from a single entry of a queue
Mattson et al. A TeraFLOP supercomputer in 1996: the ASCI TFLOP system
US20060026214A1 (en) Switching from synchronous to asynchronous processing
US6742072B1 (en) Method and apparatus for supporting concurrent system area network inter-process communication and I/O
US20030229721A1 (en) Address virtualization of a multi-partitionable machine
WO1999054833A2 (en) Dynamically configurable data storage and processing system optimized for performing database operations
Tuazon et al. Mark IIIfp hypercube concurrent processor architecture
US7979660B2 (en) Paging memory contents between a plurality of compute nodes in a parallel computer
JP2002509311A (en) Scalable single-system image operating software for multi-processing computer systems
US7797472B2 (en) Method and apparatus for providing overlapping defer phase responses
Briggs et al. Intel 870: A building block for cost-effective, scalable servers

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060207