比 ChatGPT 大 5 倍!英特尔官宣 1 万亿参数 AI 大模型,计划 2024 年完成
比 ChatGPT 大 5 倍!英特尔官宣 1 万亿参数 AI 大模型,计划 2024 年完成
整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)
眼看着 ChatGPT 持续爆火了几个月,期间微软、谷歌、Meta 等科技巨头接连入局,如今英特尔也终于官宣 " 参赛 "。
上周末,在德国汉堡举行的国际超级计算大会 (ISC) 高性能会议 (HPC)上,英特尔不仅展示了其在 HPC 和 AI 工作负载方面的领先性能,还宣布了一项出人意料的计划:与阿贡国家实验室携手,用 Aurora 超级计算机开发生成式 AI 模型 Aurora genAI,参数量将多达 1 万亿!
要知道,ChatGPT 的参数规模仅为 1750 亿,即 Aurora genAI 模型将比它至少大 5 倍。
(图片来自英特尔官网)
AI 模型将由 Aurora 超算提供算力
据了解,英特尔 Aurora genAI 模型将以两个框架为基础:NVIDIA 的 Megatron 和微软的 DeepSpeed。
Megatron:用于分布式训练大规模语言模型的架构,专门针对 Transformer 进行了优化,不仅支持传统分布式训练的数据并行,也支持模型并行。
DeepSpeed:专注于优化大型深度学习模型的训练,通过提高规模、速度、成本和可用性,释放了训练 1000 亿参数模型的能力,极大促进大型模型的训练。
除了这两个框架,Aurora genAI 模型还将由 Aurora 超级计算机来提供算力——这台英特尔为阿贡国家实验室设计的超级计算机,在经历了各种推迟后,如今终于成型了。
根据目前公开的资料显示,Aurora 超级计算机由英特尔 Xeon CPU Max 和 Xeon GPU Max 系列芯片提供支持,总共有 10624 个节点,拥有 63744 个 Ponte Vecchio GPU、21248 个 Sapphire Rapids 至强 CPU、1024 个分布式异步对象存储 (DAOS) 存储节点以及 10.9 PB 的 DDR5 傲腾持久内存。
此外,英特尔方面还透露了 Aurora 超级计算机的早期性能结果:"Aurora 超算在科学和工程工作负载上具有领先性能,比 AMD MI250 GPU 的性能高 2 倍,在 QMCPACK 量子力学应用上比 H100 提高了 20%,并接近线性扩展,可达到数百个节点。"
值得一提的是,与最初的 1 Exaflop 目标相比,预计 Aurora 超级计算机在今年推出时,将提供超过 2 Exaflops 的双精度浮点计算性能——比目前多次蝉联全球超算 Top500 榜首的 Frontier 超级计算机(1.194 Exaflop/s)还要高。
以科学为重点的生成式 AI 模型
有了算力强悍的 Aurora 超算打底,注定 Aurora genAI 模型的规模不会小。据英特尔官方介绍,阿贡国家实验室正在为 Aurora genAI 模型牵头开展国际合作。
阿贡副实验室主任 Rick Stevens 表示:" 该项目旨在利用 Aurora 超级计算机的全部潜力,以产生一种资源,可用于能源部实验室的下游科学,并与其他机构合作。"
总体而言,Aurora genAI 是一个以科学为重点的生成式 AI 模型,因此将在通用文本、代码、科学文本以及生物学、化学、材料科学、物理学、医学等科学数据上进行训练。
由此产生的 AI 模型,将具有多达 1 万亿个参数,包括从分子和材料的设计到数百万个来源的综合知识,可用于各种科学应用:系统生物学、癌症研究、气候科学、宇宙学研究、高分子化学与材料等。除了科学之外,Aurora genAI 模型还可能用于其他领域,如金融建模、自然语言处理、机器翻译、图像识别和语音识别等。
计划 2024 年完成
除此之外,有关 Aurora genAI 模型的更多信息英特尔尚未剧透,不过据外媒报道,英特尔计划在 2024 年开发和完成 Aurora genAI 模型——如果进展顺利,或许我们等待的时间并不会太久。
这一消息的发布,引来了不少人的关注,而英特尔入局 AI 大模型即宣布 1 万亿参数起步,更是令人期待未来 GPT-4 等竞品的发展:
" 万亿参数应该是一个特殊的极限,但你也可以持怀疑态度,说这只是一个需要关注的巨大整数。毫无疑问,如果此模型类似于 GPT-4,这将增加一个数据点。但随着各大公司宣布这个又宣布那个,我想知道我们是否会在 6 月达到顶峰。"
" 人们正在使用 H100 构建新系统,并且已经有明显更好的 AI GPU 了,如果这种情况继续下去,NVIDIA 可能需要尽快宣布新卡以保持领先地位。"
" 我猜 GPT-4 很快就不会在许多基准测试中继续保持 SOTA(state of the art,指在特定任务中目前表现最好的方法或模型)了,或许未来它也将在世界上最快的超级计算机上进行训练。作为参考,OpenAI 超级计算机拥有大约 10000 个 GPU,而 Aurora 有 63744 个 GPU。"
参考链接:
https://www.intel.com/content/www/us/en/newsroom/news/intel-delivers-ai-accelerated-hpc-performance.html#gs.yhhdis
https://www.business2community.com/tech-news/intel-announces-1-trillion-parameter-chatgpt-competitor-aurora-genai-02695750#
https://www.reddit.com/r/singularity/comments/13ozabi/intel_announces_aurora_genai_generative_ai_model/
-
- 克里米亚鞑靼人长相特征图片(鞑靼人是现在什么民族 蒙古还是满族)
-
2023-05-28 13:19:55
-
- 小米刷机详细步骤(小米手机怎样刷机教程)
-
2023-05-28 13:17:40
-
- 北京阶梯电费收费标准2022(电价一档二档三档二各是多少)
-
2023-05-28 13:15:24
-
- 南阳市属于哪个省的城市(河南省地级市南阳人口多少)
-
2023-05-28 13:13:09
-
- 杨振宁和翁帆产下一子(翁帆嫁杨振宁:恩爱17年为何没生儿女?)
-
2023-05-28 13:10:53
-
- 晚上狗突然狂叫预示着什么(农村半夜狗叫个不停怎么回事)
-
2023-05-27 19:37:30
-
- 湖州有什么好玩的地方(湖州周边好玩的旅游景点推荐)
-
2023-05-27 19:35:14
-
- 普洱茶十大名牌排名榜(全国知名的普洱茶品牌)
-
2023-05-27 19:32:59
-
- 黑人为什么喜欢中国女生(那么中国女人喜欢老外吗)
-
2023-05-27 19:30:42
-
- 西藏有什么好玩的景点攻略(西藏旅游必去十大美景推荐)
-
2023-05-27 19:28:27
-
- 门前种竹子风水好不好(家门前种竹子影响风水的讲究禁忌)
-
2023-05-27 19:26:12
-
- 鱼尾辫法式辫的基础编发教程图解(鱼尾麻花辫的编法)
-
2023-05-27 19:23:55
-
- 摇摇鞋真的能瘦腿吗(摇摇鞋的好处和坏处)
-
2023-05-27 19:21:39
-
- 人生三大喜事是哪三件(男人人生三大喜事)
-
2023-05-27 19:19:23
-
- 沂源一中杜鹏怎么判的(沂源一中杜鹏最新消息)
-
2023-05-27 19:17:07
-
- 索契人口面积介绍(俄罗斯国内唯一的亚热带城市)
-
2023-05-27 01:22:34
-
- 变脸的秘诀是什么(川剧变脸的原理和方法揭秘)
-
2023-05-27 01:20:18
-
- 床上叫爸爸是什么梗 网络语(为什么男生总喜欢让女生叫爸爸)
-
2023-05-27 01:18:03
-
- 80年代的非主流时尚(非主流时尚图片大全)
-
2023-05-27 01:15:47
-
- 折纸超级简单的爱心贺卡图解教程(教师节贺卡简单漂亮)
-
2023-05-27 01:13:31