分时与实时操作系统

转自网上的一些资讯。

裸机

没有运行操作系统的计算机称之为“裸机”,操作系统是在裸机上建立的一个最基础的工作环境,为其上运行的各种支撑软件和应用软件提供最基础的系统服务。

设有一个计算任务可分解为输入、处理、打印等三个子任务,为了使它们能并行工作,可引入缓冲技术,即输入子任务从输入设备读一批数据到输入缓冲区,处理子任务把输入缓冲区中的数据处理后放入输出缓冲区,打印子任务打印输出缓冲区中的内容,这样,输入子任务可以与打印子任务并行工作。因为处理器处理数据的速度很快,可以忽略其计算时间,这样就使完成一批数据加工的总时间近似等于较慢的设备输入或输出的时间。

批处理系统

Batch Processing

回想一下计算机历史,当操作系统开始出现的时候,当时的需求是解决人机矛盾及CPU和I/O设备之间速度不匹配的矛盾,此时出现了批处理系统。

在批处理系统中,用户将作业交给系统操作员,系统操作员将许多用户的作业组成一批作业,输入到计算机中,在系统中形成一个自动转接的连续的作业流,然后启动操作系统,系统自动、依次执行每个作业。最后由操作员将作业结果交给用户。

批处理操作系统的主要特点是:脱机、多道和成批处理

脱机是指用户提交作业之后直到获得结果之前几乎不再和计算机打交道。

多道是指按多道程序设计的调度原则,从一批后备作业中选取多道作业调入内存并组织它们运行。

成批处理是指操作员把用户提交的作业组织成一批,由操作系统负责每批作业间的自动调度。

批处理系统自动化程度比较高,系统吞吐量大,资源利用率高,系统开销小,但各作业周转时间长,不提供用户与系统的交互手段,适合大的成熟的作业。

可以看到批处理系统对机器来说资源利用率高,吞吐量大,但对人效率低的系统。问题的根源在于用户无法与系统交互获得反馈。根据操作系统所管理的资源以及所提供服务方式的不同,在此之后的操作系统可以分为两大类型:

  • 分时操作系统 Time Sharing Operating System
  • 实时操作系统 Real Time Operating System,RTOS

实时操作系统

例如:uCOS/VxWorks/RTLinux。

实时操作系统往往是专用的,在特定的应用中作为一种控制系统来使用。实时操作系统的一个主要特点在于有严格的时间限制,即每一个信息接收、分析处理和发送的过程必须在规定的时间内完成。这就要求系统的一切活动都必须在一个严格的计时程序的控制下运行。

  1. 高精度计时系统:计时精度是影响实时性的一个重要因素。在实时应用系统中,经常需要精确确定实时地操作某个设备或执行某个任务,或精确的计算一个时间函数。这些不仅依赖于一些硬件提供的时钟精度,也依赖于实时操作系统实现的高精度计时功能。
  2. 多级中断机制:一个实时应用系统通常需要处理多种外部信息或事件,但处理的紧迫程度有轻重缓急之分。有的必须立即作出反应,有的则可以延后处理。因此,需要建立多级中断嵌套处理机制,以确保对紧迫程度较高的实时事件进行及时响应和处理。
  3. 实时调度机制:实时操作系统不仅要及时响应实时事件中断,同时也要及时调度运行实时任务。但是,处理机调度并不能随心所欲的进行,因为涉及到两个进程之间的切换,只能在确保“安全切换”的时间点上进行,实时调度机制包括两个方面,一是在调度策略和算法上保证优先调度实时任务;二是建立更多“安全切换”时间点,保证及时调度实时任务。

实时操作系统是保证在一定时间限制内完成特定功能的操作系统。实时操作系统有硬实时和软实时之分,

  • 硬实时要求在规定的时间内必须完成操作,这是在操作系统设计时保证的;
  • 软实时则只要按照任务的优先级,尽可能快地完成操作即可。
  • 我们通常使用的操作系统在经过一定改变之后就可以变成实时操作系统。

例如,可以为确保生产线上的机器人能获取某个物体而设计一个操作系统。在“硬”实时操作系统中,如果不能在允许时间内完成使物体可达的计算,操作系统将因错误结束。在“软”实时操作系统中,生产线仍然能继续工作,但产品的输出会因产品不能在允许时间内到达而减慢,这使机器人有短暂的不生产现象。

分时操作系统

例如:Linux/Windows/OSX,基于时间片轮转的操作系统。

分时操作系统允许多个用户同时运行自己的程序。操作系统接收每个用户的服务命令,采用时间片轮转的方式处理用户的服务请求。对每个用户而言,都仿佛自己“占有”了整个计算机。

分时系统具有多路性、独立性、及时性和交互性,与批处理相比,系统开销大,资源利用率与系统接纳的作业有关,适合小的不成熟的作业。批处理和分时是以作业为单位进行处理的系统,是一个通用系统。

多路性是指一台计算机与若干台终端相连接,终端上的这些用户可以同时或基本同时使用计算机;

交互性是指用户的操作方式是联机方式,即用户通过终端采用人-机会话的方式直接控制程序运行,同程序进行交互;

独占性是指由于系统采用时间片轮转的办法使一台计算机同时为许多终端用户服务,因此客观效果是这些用户彼此间都感觉不到别人也在使用这台计算机,好像只有自己独占计算机一样;

及时性是指用户请求能在很短时间内获得响应。

分时系统和实时系统的比较

img

实时操作系统,它是可抢占性的内核。高优先级任务就绪而低优先级任务正在执行没有sleep的时候,高优先级任务会打断低优先级任务而立即得到执行。如图,当优先级更高的任务2就绪的时候,即便任务1正在运行中,也必须立刻交出CPU的使用权,就跟中断一样,先执行任务2,等任务2执行完或者主动挂起(sleep)让出CPU的时候,任务1才能接着运行。

img

在分时操作系统中,CPU是不可抢占的,即便高优先级的任务就绪了,也不能马上中断低优先级任务而得到执行,必须要等到低优先级任务主动挂起(sleep)或者时间片结束才能得到执行。

分布式计算、平行计算

并行计算(Parallel Computing)

  并行计算是相对于串行计算来说的。并行计算(Parallel Computing)是指同时使用多种计算资源解决计算问题的过程。为执行并行计算,计算资源应包括一台配有多处理机(并行处理)的计算机、一个与网络相连的计算机专有编号,或者两者结合使用。并行计算的主要目的是快速解决大型且复杂的计算问题。

  并行计算可以划分成时间并行和空间并行。时间并行即流水线技术,空间并行使用多个处理器执行并发计算,当前研究的主要是空间的并行问题。以程序和算法设计人员的角度看,并行计算又可分为数据并行和任务并行。数据并行把大的任务化解成若干个相同的子任务,处理起来比任务并行简单。

  空间上的并行导致两类并行机的产生,按照Michael Flynn(费林分类法)的说法分为单指令流多数据流(SIMD)和多指令流多数据流(MIMD),而常用的串行机也称为单指令流单数据流(SISD)。MIMD类的机器又可分为常见的五类:并行向量处理机(PVP)、对称多处理机(SMP)、大规模并行处理机(MPP)、工作站机群(COW)、分布式共享存储处理机(DSM)。

分布式计算(Distributed Computing)

  分布式计算这个研究领域,主要研究分散系统(Distributed system)如何进行计算。分散系统是一组计算机,通过计算机网络相互链接与通信后形成的系统。把需要进行大量计算的工程数据分区成小块,由多台计算机分别计算,在上传运算结果后,将结果统一合并得出数据结论的科学。

  目前常见的分布式计算项目通常使用世界各地上千万志愿者计算机的闲置计算能力,通过互联网进行数据传输。如分析计算蛋白质的内部结构和相关药物的Folding@home项目,该项目结构庞大,需要惊人的计算量,由一台电脑计算是不可能完成的。即使现在有了计算能力超强的超级电脑,但是一些科研机构的经费却又十分有限。

分布式计算比起其它算法具有以下几个优点:

  1. 稀有资源可以共享。
  2. 通过分布式计算可以在多台计算机上平衡计算负载。
  3. 可以把程序放在最适合运行它的计算机上。其中,共享稀有资源和平衡负载是计算机分布式计算的核心思想之一。

并行计算与分布式计算的区别

并行计算与分布式计算都是运用并行来获得更高性能,化大任务为小任务。简单说来,如果处理单元共享内存,就称为并行计算,反之就是分布式计算。也有人认为分布式计算是并行计算的一种特例。

分布式的任务包互相之间有独立性,上一个任务包的结果未返回或者是结果处理错误,对下一个任务包的处理几乎没有什么影响。因此,分布式的实时性要求不高,而且允许存在计算错误(因为每个计算任务给好几个参与者计算,上传结果到服务器后要比较结果,然后对结果差异大的进行验证。

分布式要处理的问题一般是基于寻找模式的。所谓的寻找,就相当于穷举法!为了尝试到每一个可能存在的结果,一般从0~N( 某一数值)被一个一个的测试,直到我们找到所要求的结果。事实上,为了易于一次性探测到正确的结果,我们假设结果是以某个特殊形式开始的。在这种类型的搜索里,我们也许幸运的一开始就找到答案;也许不够走运以至于到最后才找到答案,这都很公平。

并行程序并行处理的任务包之间有很大的联系,而且并行计算的每一个任务块都是必要的,没有浪费的分割的,就是每个任务包都要处理,而且计算结果相互影响,就要求每个的计算结果要绝对正确,而且在时间上要尽量做到同步。

分布式的编写一般用的是C++(也有用JAVA的,但是都不是主流),基本不用MPI接口。并行计算用MPI或者OpenMP。

集群计算、超算

集群计算(Cluster Computing)

计算机集群将一组松散集成的计算机软件或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有其它的可能连接方式。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个计算机,比如工作站或超级计算机性价比要高得多。

根据组成集群系统的计算机之间体系结构是否相同,集群可分为两种。

  • 同构
  • 异构

集群计算机按功能和结构可以分为:

  • 高可用性集群(High-availability (HA) clusters)、
  • 负载均衡集群(Loadbalancing clusters)、
  • 高性能计算集群(High-performance (HPC)clusters)、
  • 网格计算(Grid computing)。

高可用性集群,一般是指当集群中有某个节点失效的情况下,其上的任务会自动转移到其他正常的节点上。还指可以将集群中的某节点进行离线维护再上线,该过程并不影响整个集群的运行。

负载均衡集群,负载均衡集群运行时,一般通过一个或者多个前端负载均衡器,将工作负载分发到后端的一组服务器上,从而达到整个系统的高性能和高可用性。这样的计算机集群有时也被称为服务器群(Server Farm)。一般高可用性集群和负载均衡集群会使用类似的技术,或同时具有高可用性与负载均衡的特点。Linux虚拟服务器(LVS)项目在Linux操作系统上提供了最常用的负载均衡软件。

高性能计算集群,高性能计算集群采用将计算任务分配到集群的不同计算节点儿提高计算能力,因而主要应用在科学计算领域。比较流行的HPC采用Linux操作系统和其它一些免费软件来完成并行运算。这一集群配置通常被称为Beowulf集群。这类集群通常运行特定的程序以发挥HPC cluster的并行能力。这类程序一般应用特定的运行库, 比如专为科学计算设计的MPI库。HPC集群特别适合于在计算中各计算节点之间发生大量数据通讯的计算作业,比如一个节点的中间结果或影响到其它节点计算结果的情况。

网格计算,通过利用大量异构计算机的未用资源(CPU周 期和磁盘存储),将其作为嵌入在分布式电信基础设施中的一个虚拟的计算机集群,为解决大规模的计算问题提供一个模型。网格计算的焦点放在支持跨管理域计算 的能力,这使它与传统的计算机集群或传统的分布式计算相区别。网格计算的目标是解决对于任何单一的超级计算机来说仍然大得难以解决的问题,并同时保持解决 多个较小的问题的灵活性。这样,网格计算就提供了一个多用户环境。

参考资料


如何在星巴克点一杯好喝的饮料? - 知乎 阶级跨越