突破内存瓶颈,英特尔携华为打通智能计算任督二脉

2020-07-09 11:01:52来源:威易网作者:

作为全球唯一一家拥有CPU、GPU、FPGA、ASIC全场景芯片的公司,近年英特尔加速推进智能化平台的布局,不仅实现了异构算力整合,还实现了从云到端、从训练到推理的全业务AI场景覆盖。

经常有人问,为什么京东物流比菜鸟物流快?上午订货,下午送达?怎么做到的?

很简单,因为京东是自建物流,全国各大城市都建有京东的大型物流仓库,通过区域需求分析提前备货,接到订单就近发货,同城送达。菜鸟物流通过与各大快递公司建立合作关系,货物寄送依赖卖家和快递公司处理,大多是跨地区、点对点寄送,由买家到当地物流站领取,物流较慢。

这就好比内存和硬盘的区别,内存读写速度快,离CPU较近,能以最快的速度处理指令。而硬盘读写速度较慢,数据需先调入内存,再由CPU读取。倘若要保持计算过程的高速运转,就必须保证内存容量足够大,但实际情况是,服务器往往受限于插槽数量以及单根内存容量,内存空间扩展往往受到极大限制。

随着企业数据呈现出爆炸式增长态势,如何化解不断增加的数据处理需求与捉襟见肘的内存性能需求之间的矛盾,已成为企业推进数字化和智能化转型面临的主要挑战之一。值得庆幸的是,随着英特尔傲腾持久内存的推出,问题正在迎刃而解。

何谓傲腾持久内存?

傲腾持久内存全称为Optane Persistent Memory,基于3D XPoint持久化内存,是英特尔智能计算平台构建的重要组成部分。自2019年发布以来,已更新到第二代,傲腾持久内存的推出并非取代传统DRAM、NAND,而是与之共存,填补二者之间在容量、性能上的空档,构成一个完整的存储体系。

相比DRAM,傲腾持久内存容量和价格均占优;相比NAND SSD,傲腾持久内存性能占优。最大的不同在于傲腾持久内存提供两种运行模式,即App Direct模式与内存模式。

\

App Direct模式是一个持久应用模式,只有在操作系统和应用已经被开发出来时,才可以充当新一层的内存,并加以使用。通过APP Direct模式,傲腾持久内存与DRAM可以进一步优化应用,确定数据存放的最佳位置,以提升整体性能。

内存模式是易失性存储,可理解为系统额外扩展内存,可以与系统原有DRAM一起,在无需重写软件情况下,解决用户内存容量不足问题。由于是与内存捆绑在一起,傲腾持久内存能够帮助用户建立更多的VEM、容器及应用密度。对于内存扩容能力有限的服务器,可通过傲腾持久内存来提升服务器整体性能,而不用更换任何部件。

企业智能化转型,傲腾持久内存价值如何体现?

2020年,新冠肺炎疫情的暴发以及新基建的推出,深刻的影响着企业对数字化转型的态度。一方面,物联网、5G、大数据以及人工智能等新兴技术在抗击新冠肺炎疫情以及推动企业复工复产中的成熟表现,让企业坚定推进数字化转型的决心和信心。另一方面,“新基建”的推出进一步强化了数字转型、智能升级、融合创新等基础设施服务体系建设,不断释放推动企业数字化转型的新动能。

双重因素叠加虽然为企业转型提供了良好发展条件和时代环境,但转型过程依然任重道远。

首先,基于安全性和可靠性等多重因素考虑,企业都不敢冒然将研发、生产等核心业务托管到云端。对于这类业务,企业大多选择在本地数据中心部署,而随着数字化应用和工业智能化场景日趋增多,企业每天需要处理的数据也在急剧飙升,不断对平台性能提出了更高的要求,对数据的存储管理能力也提出了更大的挑战。

其次,随着物联网、边缘计算以及人工智能等技术融入到工业场景,企业的工业智能化水平也在逐步提升,工业智能化不仅会产生海量过程工业数据,而且大多是低延时、高实时性的边缘计算应用场景,对服务器性能、可靠性和稳定性都有极高要求。

近年,针对企业关键业务数据的急剧增长,以及工业智能化场景应用的大量落地,为支撑海量数据存储以及智能计算需求,英特尔通过智能计算能力革新,为华为新一代FusionServer Pro智能服务器搭配AI加速的至强可扩展处理器以及傲腾持久内存,不仅突破传统服务器广泛存在的存储性能瓶颈,更让服务器具备AI加速能力。在面对海量密集型智能计算时,能极大提升数据处理分析效率。

在制造业,目前华为FusionServer Pro智能服务器在诸多场景得到了应用。

\

在产品研发应用领域,随着企业开启数字化工厂建设工作,为缩短建设周期并降低建厂成本,越来越多的企业依赖工业仿真软件对从产品设计、工艺、装配、生产线及工厂布局进行全三维虚拟化仿真,以验证设计过程。由于仿真过程涉及大量复杂的静动态结构性分析,不仅对平台的整体性能有这极高要求,过程中更会产生海量的数据。

为支撑复杂的虚拟仿真计算过程,企业主要采用服务器、工作站等高性能平台,这需要配置更快的CPU、GPU以及更大的内存。然而受限于服务器和工作站有限的内存扩展能力,往往会出现内存已用尽,而CPU利用率却很低的情况,使得整体性能无法充分发挥,英特尔傲腾持久内存恰好可以解决这一问题。

\

在最新的存储性能测试中,傲腾持久内存的延迟低至350纳秒,接近普通DRAM性能,单根容量最高可达512G,TB级的内容容量扩展能极大地满足虚拟仿真过程海量数据计算对内存容量及性能的需求。

华为为德国几大领先车企提供 FusionServer Pro X系列高密服务器,搭配的就是英特尔至强可扩展处理器和傲腾持久内存。以碰撞测试为例,这些德国大型车厂每年要做几万次碰撞模拟,只有几百次是用真实的原型车碰撞模拟,其他都是通过软件实现的,每年所产生的仿真数据高达几十EB,虽然经过数据过滤选出关键数据,但是数据量还是高达几百TB。而利用傲腾持久内存的TB级内存级扩充能力,不仅帮助车企提高汽车设计效率、缩短设计周期,还帮助节省了能耗和物理空间,简化了使用和维护,并大幅降低了总体成本。

在业务运营领域,以ERP、MES为核心的业务资源运营对内存及缓存的容量和性能延时极为敏感。内存越大意味着可支撑的用户并发数越多,内存延时越低则代表I/O性能更好,单位时间内数据处理效率越高。

ERP处理特点是每到月底做报表统计时,各部门业务数据都要汇总进来处理,数据计算量特别高,基本好多天都处于峰值,这时候内存容量就捉襟见肘。

在生产过程中每分钟都有大量的工厂基础数据被收集到MES系统中,长期运行MES系统,必然需要超大容量的存储才可以保证数据完整性,所以在MES系统硬件采购中,要保证系统具有良好的扩展能力。而傲腾持久内存单根512GB的超大容量以及接近DRAM的读写性能,让其在应对ERP、MES这类高并发业务应用是拥有得天独厚的优势。

在生产制造领域,随着物联网、5G、边缘计算以及人工智能等技术融入到工业,越来越多的企业智能化场景得以落地,如VR/AR培训、产品预测维护、机器视觉检测等,由于这些智能化场景依赖于AI推理运算,需要高性能的边缘服务器做支撑,不但内存容量需求大,对计算性能要求也很高。

美的与英特尔合作打造的工业视觉检测云平台,就是以Analytics Zoo数据分析 + AI平台,利用 Spark的各种流水线、内置模型、特征操作等,构建基于大数据的深度学习端到端应用。整个视觉检测过程一个重要的性能瓶颈节点是,从磁盘中读取输入数据并进行预处理,构建模型并进行训练和推理分析,这个过程对边缘计算服务器的AI计算能力以及内存性能有着很高的要求。

目前,第二代英特尔至强可扩展处理器以及傲腾持久内存已经发布,针对工业边缘计算场景,两大产品组合能从智能计算和内存扩展两个方面进一步优化服务器性能,无需更换现有硬件。

针对日趋复杂的异构算力融合以及跨平台架构的AI开发需求,英特尔还于2019年发布了oneAPI统一编程平台以及端到端大数据处理+分析平台,实现了跨CPU、GPU、FPGA、ASIC的异构算力整合,并提供跨架构、跨平台的AI应用开发支持,解决了开发者在不同架构开发需要使用不同的语言、库和软件工具进行编程的局限,真正意义上放大了AI开发的价值。

随着企业上云以及工业智能化成为企业转型的主要方向,其对IT性能也有更高的要求:

第一,企业需要性能更强的处理器以及容量更大、性能更好的内存。第二,面对日渐增多的训练推理场景,企业需要服务器的计算过程更加智能;第三,对于多元化应用发展,企业对跨架构的异构算力整合有着急迫需求。

作为全球唯一一家拥有CPU、GPU、FPGA、ASIC全场景芯片的公司,近年英特尔加速推进智能化平台的布局,不仅实现了异构算力整合,还实现了从云到端、从训练到推理的全业务AI场景覆盖。为加速智能应用落地步伐,为中国工业智能化转型赋能,英特尔正在不断深化与华为在服务器领域的合作,通过FusionServer Pro智能服务器为企业数字化和工业智能化赋能,让智能计算在云、边缘到端的自由流动。



 

关键词:英特尔华为