走向大众的高性能计算(一)
来源:英特尔公司业务拓展经理 王克 作者: 时间:2004-06-22 23:01
(华强电子世界网讯) 超级计算一词通常会使人联想到体积庞大、造价高昂、采用复杂的科学和工程“数字处理”技术的计算机系统。本文在帮助我们大家了解高性能计算(HPC)的用途及其意义方面迈出了第一步。
高性能计算(HPC)是突破现有性能限制的计算。在满足我们对于新量级精确度和复杂系统建模日益增长的需求的同时,HPC使我们能够在目前处理较小问题花费的相等(或更短)时间内处理完更大的问题。从气象预报、汽车碰撞模拟到绘制人类基因组图谱和基因排序,HPC提供了进行更大、更尖端、更有趣的科学研究的能力。
与超级计算不同,HPC是采用众多广泛的系统而非“单一巨型”计算机来实现上述能力的。HPC以并行计算为基础,其主要目标是缩短周转时间(即在更短时间内完成更多计算),以及适应更大规模的工作(即可扩充以应对更复杂的情景)。
并性计算(又称并行机制)将程序指令分配给多个处理器上执行,以便在更短时间内运行程序。此处的一个重要原理是同时性,也就是在同一时间段内执行多个任务。利用吞吐量计算或周转计算均可实现这一能力。
在吞吐量计算中,一个单一HPC基础设施处理来自多方的多个单独作业,以获得预期结果。周转计算则是逐一处理各个作业。
在硬件方面,并行计算可以三种形式实现:
•在芯片上:例如在基于安腾处理器的平台上和显式并行指令计算(EPIC)
•多处理器:相称的多处理器(SMP)设备
•多计算机:集群
随着我们尝试了解并控制复杂的进程,企业IT和技术计算环境中对于高性能计算(HPC)的需求仍在不断增加。针对高效并行机制而设计,EPIC模型通过改善并行执行吞吐量而增强了处理器的扩充性能水平。利用EPIC,处理器从必须确定并行处理机会的繁重工作中解脱出来,腾出硬件和软件来做它们擅长的工作。在过去几年中,随着SMP共享内存设备(多个处理器共享一个通用操作系统和内存)得到广泛采用,并行计算已经跨入主流行列。
新千年中开始兴起的一个最重要的计算趋势就是从上个世纪70年代的大型服务器和单片超级计算机移植到现代的集群解决方案。集群作为单一高度可用的系统,使HPC更加经济。更高性能、标准化和显著的成本优势只是带动HPC需求增长,使HPC走出科研领域而进入主流商业应用(如金融经济建模和大型金融风险管理及业务智能)的部分因素。
随着英特尔等公司逐步重视提供商业化的即购即用(COTS)技术解决方案,以及实施多种计划来与软件开发商和服务提供商合作部署和支持这些要求苛刻的解决方案,这一趋势的发展越来越快。今天,已经有多家领先制造商和专业解决方案提供商提供采用英特尔产品的交钥匙的即购即用(COTS)集群系统,同时伴随公开发行的商业化软件和全面的产品支持。企业正在争先恐后部署它们,希望获得这些近乎不可抗拒的出色特性和惠益。除了在政府、教育和国家实验室等公共部门中得到广泛应用之外,HPC在制造业、金融、能源、生命科学和数字媒体等行业中也倍受欢迎。COTS系统继续推动集群计算的发展,可以非常低廉的价位扩充海量计算能力。专有系统也开始向基于开放标准、定制化的方向发展。
通过完美结合台式机、集群和大型SMP系统的强大能力,HPC正在进入网格计算时代。网格扩展了基于标准的中间件的概念,可以支持任何互连的计算平台之间进行协作 – 甚至将其扩展到全球任何一个角落。网格囊括了台式机、部门级服务器、大型SMP系统和大型数据中心服务器,能够以空前的规模以及规模效益提供更为经济的资源。目前的大部分网格项目都瞄准了在整个分布式网络上创造和共享HPTC(高性能技术计算,以满足巨大的计算能力需求。
超级计算机500强排行榜*是衡量HPC发展速度的很好的指标。HPC通常涉及具有至少1TFlops(万亿次浮点运算/秒 )计算能力的集群。新的数据点现在反映了超级计算机的多样化,以及低端和高端型号之间的性能差异。在过去几年中,英特尔架构系统在500强排行榜中的数量已经从3个飞涨到189个。其中,亚太地区就拥有至少15个英特尔架构集群。
突飞猛进的性能、急剧下降的成本以及势如潮涌的需求等众多因素,促使HPC迅速走出科研实验室,步入主流商业领域。现在,使用创新的计算、模拟或优化技术(需要强大的计算机),许多业务问题可以迎刃而解。作为全球设备制造商、软件开发商、系统集成商和服务提供商阵营中的重中之重,HPC部署已经带来了卓越的性能、可扩充性、灵活性和升级能力,而其成本仅是专有RISC架构HPC集群、微型计算机和超级计算机的成本的零头。
垂直市场的HPC应用以及软件的作用
Top 500排名表每年更新两次,用以列出全球500个最强大的商用计算机系统,以及部署这些系统的机构(http://www、top500、org/)。
HPC的目标
•最大限度地降低完成特殊计算问题的运算时间
•最大限度地提高可在指定时间内完成的问题规模
•处理以前无法实现的大量复杂问题
•提高性价比(每美元最高Flops数量)
•降低成本,以及产品过时的影响
•扩展解决中等规模的问题(和预算)
HPC的首字母缩写词
FLOPS:每秒浮点运算次数,一种用于衡量设备或集群处理科学计算能力的量度。
并行计算:同时计算程序的多个部分,以缩短解决问题所需的总体时间。
MPP:大规模并行处理。在一台设备中通过专用互连方案将众多处理器连接起来(可达到9,000枚处理器)。
SMP:对称多处理。一种计算机处理器配置,允许所有处理器同时访问诸如内能或I/O等系统资源。在SMP系统中,每一处理器都能够管理通过系统的工作流。
集群:一种相互连接的计算机的组合,可利用所有设备资源来解决问题。
SIMD:单指令多数据。这一并行计算体系结构能够在多个数据集上完成一个预算。在本例中,一枚处理器作为控制逻辑,其它处理器作为辅助设备。
MIMD:多指令多数据。在这种情况下,每一处理器独立控制,并同时处理其各自的指令集。
高可用性:一种集群形式,用于在部分硬件发生故障时确保计算不会中断。
负载平衡:一种集群形式,用于将进入的工作负载分配到一系列计算机上。通常指输入到一个网站的TCP/IP流量。
关于高性能计算的背景知识:
•http://developer、intel、com/design/servers/ipmi/
•http://www、intel、com/go/hpc/
•http://www、beowulf、org
•http://www、microsoft、com/windows2000/hpc/
•http://clusters、top500、org/
•http://www、tc、cornell、edu/AC3/ (高级集群计算协会Advanced Cluster Computing Consortium)
![]() |