元宇宙非小号金色财经交流群社区官网

中国高校云上科研平台提升算力效率

浏览:121|时间:2023-07-25 05:27:21
6月27日,国内高校最大的云上科研智算平台CFFF(Computing for the Future at Fudan)在复旦大学正式上线。这台科研“超级计算机”是由复旦大学与阿里云等共同打造的,旨在发现和解决复杂科学问题。它采用先进的公共云模式提供超千卡并行智能计算,并支持具有千亿参数的大模型训练。这在国内高校中尚属首例,并领先于国际知名高校斯坦福大学等。

CFFF平台由两部分组成:面向多学科融合创新的AIforScience智能计算集群“切问”一号和面向高精尖研究的专用高性能计算集群“近思”一号。它们基于百G高速数据传输网和阿里云的先进技术,在复旦校内和阿里云乌兰察布数据中心相连,实现了异构算力的统一管理和计算任务的统一调度。这样,复旦四校区的实验设备都能高速接入,并满足不同应用场景下的科学智能研究与应用需求。

阿里云乌兰察布数据中心是位于“东数西算”节点上的,通过飞天智算平台的公共云模式为外部提供智能计算服务。2012年,阿里云发布了飞天智算平台,并建立了乌兰察布数据中心等两座超大规模智算中心,为科研、公共服务和企业机构提供强大的智能计算服务。这些中心将计算资源利用率提高了3倍以上,AI训练效率提升了11倍,推理效率提升了6倍。

智算中心并不简单地将配置先进制程芯片的服务器连接起来就能实现高性能算力。一个关键的指标是损耗,而智能计算的损耗更加困难。与通用型计算相比,智能计算需要海量数据进行训练,数据迁移和分布式训练等环节的损耗尤为严重。传统智算中心达到一定规模后,增加算力资源反而会降低算力输出能力,千卡以上规模的算力输出往往仅有40%左右。但是阿里云通过自研的核心技术,特别是飞天智算平台,大幅降低了智能算力的损耗。

得益于公共云模式,CFFF平台上的项目可以享受到超千卡并行的智能算力。千卡并行的有效算力达到了行业领先的92%,还可以扩展到万卡,并行有效算力也能达到90%。此外,公共云也更加低碳和绿色。乌兰察布数据中心的绿色数据中心技术结合了当地的天然气候优势,CFFF平台的年平均PUE小于1.2,每年可节省总电力超过2000千瓦,节省电费500万元,年均节碳量达15吨。

目前,CFFF平台上已经诞生了第一个科研成果。复旦大学人工智能创新与产业研究院李昊团队发布了45亿参数量的中短期天气预报大模型,预测效果达到了业界公认的ECMWF(欧洲中期天气预报中心)集合平均水平,并且将预测速度从几小时缩短到了3秒内。李昊表示,基于CFFF平台的千卡并行智能计算,这样一个规模的大模型只用一天就完成了训练,而传统的计算平台是很难做到这一点的。

未来,CFFF平台将持续扩大其算力规模,并向复旦校外的科研机构、高校、医院、高科技企业等开放。与此同时,首届世界科学智能大赛也正式启动,大赛设置了生命科学、量子化学等五大赛道,CFFF平台将为参赛队伍提供免费训练算力,并长期支持部分科研项目。

作者:环球Tech

中国 平台 算力

本站分享的区块链、Web3.0元宇宙、NFT、数字藏品最新消息等相关数藏知识快讯NFR资讯新闻,与金色财经非小号巴比特星球前线Btc中国官网无关,本站资讯观点不作为投资依据,市场有风险,投资需谨慎!不提供社区论坛BBS微博微信交流群等相关币圈信息发布!
本站内容来源于互联网,如存在侵权及违规内容投诉邮箱( [email protected] )
皮卡丘 2021-2024© YangKaTie.Com All