《分布式计算技术.docx》由会员分享,可在线阅读,更多相关《分布式计算技术.docx(3页珍藏版)》请在优知文库上搜索。
1、分布式计算是一门计算机科学,它争论如何把一个需要特别巨大的计算力量才能解决的问题分成很多小的部分,然后把这些部分安排给很多计算机进行处理,最终把这些计算结果综合起来得到最终的结果。据中国互联网信息中心(CNNlC)的统计信息,中文网民人数占世界的比重已经增长到了12%左右,并且还在快速增长着。这里所说的中文网民是包括大陆、香港、澳门、台湾和海外华人的。您或许会问互联网在中国快速进展的缘由。我想,主要有以下几个方面。价格廉价:在上海一根512K的ADSL包月才120元人民币左右。教育体制:最近政府花了巨资关心高校、初高中修建了多媒体信息教室,这使得很多同学对信息技术布满着爱好和渴望。相比于互联网
2、在中国的快速进展,中国的分布式计算却进展缓慢。就我看来,网民数量的统计并不能特别客观地反映一个我国信息化程度的凹凸,而参与分布式计算网民的数量或比例却可以明显地看出这个我国科学普及化的水平。在这方面,毋庸置疑,欧美我国是特别领先的。在北欧我国,几乎一半的电脑参与了分布式计算项目,这是一个惊人的数字。再让我们来看看我们中国和印度,尽管我们拥有了不少最新科技,且看上去在网络普及化进程中有不错表现,但是在分布式计算方面却很薄弱。让我们来看些例子:SETIhome是世界上最大的分布式计算项目。从中国的参与人数来看,它在中国也是最闻名的项目。它通过使用联网的计算机下载程序分析射电望远镜所收到的讯号,来搜
3、寻地球外的生命迹象。尽管中国在近一年来有所进步,中国的国际排名从29提升到了24,但是我们中国用户却仍旧只完成了日本用户完成的工作数的特别之一,而日本,这个高度发达的我国网民人数却少于中国。看来,提高网民素养、提高科学普及化程度也是特别重要的。印度和一些中东我国也有相像的问题,而中欧我国明显在这方面作得比较好,不少独联体我国所完成的数据量已经超过了俄罗斯联邦的总合。Foldinghome是一个争论蛋白质折叠,误会,聚合及由此引起的相关疾病的分布式计算工程。它使用联网式的计算方式和大量的分布式计算力量来模拟蛋白质折叠的过程,并指引我们近期对由折叠引起的疾病的一系列争论。中国参与这个项目的人数在不
4、断增多,截至2022年3月底,中国3213团队的用户数达到3025人,近期活跃用户有190人左右。参与该项目CIimatePrediCtion工程是把最新的气候猜测模型通过家庭、学校、办公室的计算机来进行计算。这些计算完成的结果将会组成世界最大的气象猜测模型。气候转变了,而我们对此的行动已经是全球重要的话题。这将影响到人类的农业生产、水资源量、生态系统、能源需求、保险花费和很多其他与人类息息相关的方面。确凿的科学依据表明,地球在在接下来的几个实际可能会变得暖和话,但是我们无法估量究竟变化会有多大。假如您参与,这将能有助与21世纪的气候科学猜测。中国目前已经有了很多计算机,其中不乏性能极其先进的
5、。而他们中的大多数仅仅是打字、播放幻灯而已。这不能不说是一种资源的铺张。从此外一个角度看,我们不难发觉发达我国和进展中我国的差距。我们把这种现象称为数字鸿沟。另一个现象同样令人痛心疾首,全部的分布式计算项目都是由发达我国,如:美国、德国、英国、日本等发起的,这一方面也深入了科学鸿沟。斯坦福高校化学系的戈尔哈姆理查德切尔曼教授说,分布式计算将加快整个人类的科学进程。科学家们现在可以完成以前从来想不到要去完成的,或者要花几十年几百年才能完成的计算任务。这是的确是千真万确的,但是这种计算从肯定程度上助长了发达我国的科学垄断。目前,中国有关部门也开头意识到分布式计算的重要性,一些高校教授和科学家也开头
6、钻研分布式计算科学,比如:中科院CASHoME和清华高校的“清水方案”。分布式计算是采用互联网上的计算机的中心处理器的闲置处理力量来解决大型计算问题的一种计算科学。随着计算机的普及,个人电脑开头进入千家万户。与之伴随产生的是电脑的采用问题。越来越多的电脑处于闲置状态,即使在开机状态下中心处理器的潜力也远远不能被完全采用。我们可以想象,一台家用的计算机将大多数的时间花费在“等待”上面。即便是使用者实际使用他们的计算机时,处理器依旧是安静的消费,依旧是不计其数的等待(等待输入,但实际上并没有做什么)。互联网的消失,使得连接调用全部这些拥有限制计算资源的计算机系统成为了现实。那么,一些本身特别简单的
7、但是却很适合于划分为大量的更小的计算片断的问题被提出来,然后由某个争论机构通过大量艰辛的工作开发出计算用服务端和客户端。服务端负责将计算问题分成很多小的计算部分,然后把这些部分安排给很多联网参与计算的计算机进行并行处理,最终将这些计算结果综合起来得到最终的结果。当然,这看起来也好像很原始、很困难,但是随着参与者和参与计算的计算机的数量的不断增加,计算方案变得特别快速,而且被实践证明是的确可行的。目前一些较大的分布式计算项目的处理力量已经可以达到甚而超过目前世界上速度最快的巨型计算机。您也可以选择参与某些项目以捐赠Cpu的内核处理时间,您将发觉您所供应的中心处理器内核处理时间将消失在项目的贡献统
8、计中。您可以和其他的参与者竞争贡献时间的排名,您也可以加入一个已经存在的计算团体或者自己组建一个计算小组。这种方法很利于调动参与者的热忱。随着民间的组队渐渐增多,很多大型组织(例如公司、学校和各种各样的网站)也开头了组建自己的战队。同时,也形成了大量的以分布式计算技术和项目争论为主题的社区,这些社区多数是翻译制作分布式计算项目的使用教程及发布相关技术性文章,并供应必要的技术支持。那么谁可能加入到这些项目中来呢?当然是任何人都可以!假如您已经加入了某个项目,而且曾经考虑加入计算小组,您将在中国分布式计算总站及论坛里找到您的家。任何人都能加入任何由我站的组建的分布式计算小组。盼望您在中国分布式总站
9、及论坛里发觉乐趣。参与分布式计算种能充分发挥您的个人电脑的采用价值的最有意义的选择一只需要下载有关程序,然后这个程序会以最低的优先度在计算机上运行,这对平常正常使用计算机几乎没有影响。假如你想采用计算机的空余时间做点有益的事情,还迟疑什么?立刻行动起来吧,你的微不足道的付出或许就能使你在人类科学的进展史上留下不小的一笔呢!由于现代人类各个课题学科繁多,涉及面广,而分类又细。而当今的每个学科好像都需要进行大量的计算。天文学争论组织需要计算机来分析太空脉冲(pulse),星位移动;生物学家需要计算机来模拟蛋白质的折叠(proteinfolding)过程;药物学家想要研制克服艾滋病(AIDS)或非典
10、(SARS)的药物;数学家想计算最大的质数和圆周率的更精确值;经济学家要用计算机分析计算在几万种因素考虑下某个企业/城市/我国的进展方向从而宏观调控。由此可见,人类将来的科学,时时刻刻离不开计算。而分布式计算(DistributedComputing),以其独特的优点一一廉价、高效而越来越受到社会的关注。就目前来看,全球的各种分布式计算已有约百种,这些计算大多互无联系、独立管理、独立使用自己的一套软件。目前的这种分布式计算相互割据的格局很不利于进展的需要。比如,某个生物学争论机构需要采用世界各地志愿者的计算机来模拟蛋白质折叠的过程,那个生物学争论机构没有分布式计算方面的专业人才,而但是社会上也
11、并没有任何公司可以供应这样的服务,他们就不得不自己花费大量精力用于开发分布式计算的服务器、客户端。这样一来,原来可以用于争论生物的时间用在了别的地方。刚才提到的生物学争论机构就是美国斯坦福高校的PANDE小组。为了转变这种杂乱无章的割据,美国加州高校伯克利分校(UCBerkeley)首先提出了建立BOINC的想法。BOINC的中文全称是伯克利开放式网络计算平台(BerkeIeyOpenInfrastructureforNetworkComputing),他能够把很多不同的分布式计算项目联系起来统一管理。并对计算机资源进行统一安排(比方您对争论艾滋病药物和探究地外文明同时感爱好,您就可以同时选择
12、两个运行,并设置优先级)。对统计评分系统进行统一管理(无论你在为哪个项目工作,只要你奉献CPU时间长,就积分高)。有了这样的统一管理,的确给PANDE小组这样的科学争论机构供应了便利!BOINC目前已经成熟,多个项目已经胜利运行于BOlNC平台之上,如SETIhome,LHChome等。分布式计算是近年提出的一种新的计算方式。所谓分布式计算就是在两个或多个软件相互共享信息,这些软件既可以在同一台计算机上运行,也可以在通过网络连接起来的多台计算机上运行。分布式计算比起其它算法具有以下几个优点:1、稀有资源可以共享。2、通过分布式计算可以在多台计算机上平衡计算负载。3、可以把程序放在最适合运行它的计算机上。其中,共享稀有资源和平衡负载是计算机分布式计算的核心思想之一。