Beowulf集群系统简介
Linux环境下的集群系统中比较有影响的是Beowulf集群。Beowulf集群的研究是由美 国国家航空航天局(NASA)于1994年启动的。 1994年, Thomas Sterling和Don Becker等人 构建了一台由以太网连接的拥有16个DX4处理器的集群。他们把这个集群计算机叫作 Beowulf,主要用来进行地球、空间科学的研究。Beowulf的主要目的是使用普通的、相对廉价 的计算机构建能够处理繁重计算的集群。此后,Beowulf的思想迅速被世界上许多研究机构 认同和接受。在Beowulf集群上运行的软件是Linux操作系统、并行虚处理机(Parallel Virtu- al Machine,PVM)和消息传递接口MPI(Message Passing Interface) 。一般由服务节点来控制 整个集群。服务节点是集群的控制台和对外的网关。在规模比较大的Beowulf集群中可以 有多个服务节点,例如专门用集群中的一个节点作为控制台或统计整个集群的运行状态。 通常,除服务节点外,Beowulf集群中的其他节点都是哑成员,即它们不与外界交互。这些成 员节点由服务节点来管理,执行服务节点分配的任务。交通部公路科学研究所现有就是此 类机群系统。
Beowulf集群中的成员节点以及内部连接是集群专用的。从这一点来看,Beowulf更像 是一台完整的机器,而不是一个由许多计算机组成的松散的群体。集群下的大多数节点没 有键盘、显示器等,只是通过远程登录来访问控制它们。就像CPU和内存可以方便地安装到主板上一样,Beowulf的节点作为内置的模块插入Beowulf集群中。
Beowulf集群中的节点之间的连接(通常是高速网络,比如FastEthenet 、ATM 、Myrinet 等)也是仅供节点间使用,它与集群与外界连接的普通网络相隔离。这些特点使得Beowulf 集群中各节点的负载均衡且节点之间的信赖关系变得更容易处理,因为它们不受外界的影 响。同时,节点之间的通信也会更高效。Beowulf并不是一个软件包、 一种新的网络拓扑结 构或者内核技术,而是一种基于Linux操作系统的机器来构建并行虚拟机的思想。尽管有很 多软件(例如:内核的修改,PVM和MPI并行运算库或者管理工具)可以使Beowulf体系结构 更快、更容易管理和使用,但仍然可以只使用Linux来建造一个自身的Beowulf集群。 一个 最简单的Beowulf集群可以由两台互相连接并且拥有一些信任关系(比如NFS和rsh权限)的Linux计算机组成。
Beowulf集群中的成员节点以及内部连接是集群专用的。从这一点来看,Beowulf更像 是一台完整的机器,而不是一个由许多计算机组成的松散的群体。集群下的大多数节点没 有键盘、显示器等,只是通过远程登录来访问控制它们。就像CPU和内存可以方便地安装到主板上一样,Beowulf的节点作为内置的模块插入Beowulf集群中。
Beowulf集群中的节点之间的连接(通常是高速网络,比如FastEthenet 、ATM 、Myrinet 等)也是仅供节点间使用,它与集群与外界连接的普通网络相隔离。这些特点使得Beowulf 集群中各节点的负载均衡且节点之间的信赖关系变得更容易处理,因为它们不受外界的影 响。同时,节点之间的通信也会更高效。Beowulf并不是一个软件包、 一种新的网络拓扑结 构或者内核技术,而是一种基于Linux操作系统的机器来构建并行虚拟机的思想。尽管有很 多软件(例如:内核的修改,PVM和MPI并行运算库或者管理工具)可以使Beowulf体系结构 更快、更容易管理和使用,但仍然可以只使用Linux来建造一个自身的Beowulf集群。 一个 最简单的Beowulf集群可以由两台互相连接并且拥有一些信任关系(比如NFS和rsh权限)的Linux计算机组成。