鼎盛证券-线上股票配资网_线上股指配资_线上配资排名

  • 牛不停 Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源

线上股票配资网

你的位置:鼎盛证券-线上股票配资网_线上股指配资_线上配资排名 > 线上股票配资网 >

牛不停 Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源

发布日期:2024-08-20 19:45    点击次数:184

文|罗曾

日前,全球科技公司Yandex推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。

据介绍,YaFSDP是目前在大型语言模型训练中增强图形处理器(GPU)通信并减少内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量,其速度最多可提高26%。通过使用YaFSDP缩短大型语言模型的训练时间,可以节省高达20%的图形处理器资源。

Yandex公司高级开发人员、YaFSDP开发团队成员米哈伊尔·赫鲁晓夫(Mikhail Khruschev)表示:“目前牛不停,我们正在积极试验各种模型架构和参数大小,以扩展YaFSDP的多功能性。我们很高兴能与全球机器学习社区分享我们在大型语言模型方面的成果,为提高全球研究人员和开发人员的可访问性和效率做出贡献。”

事实上,大型语言模型训练是一个耗时且资源密集的过程。在大型语言模型训练期间,开发人员必须有效管理三种主要资源:计算能力、处理器内存和处理器通信。自行开发大型语言模型的机器学习工程师和企业会投入大量时间和图形处理器资源来训练这些模型。模型越大,与其训练相关的时间和费用就越多。

需要说明的是,大型语言模型训练依赖于组织成集群的众多图形处理器,这些集群是互连的图形处理器阵列,可以执行训练具有数十亿参数的模型所需的大量计算。在集群内的处理器之间分配计算需要持续的通信,这往往会成为“瓶颈”,减缓训练过程并导致计算能力的低效利用。

为了克服这一瓶颈,Yandex开发人员创建YaFSDP,优化了学习速度和性能,通过消除图形处理器通信效率低下的问题,确保了训练时仅需要关注必要的处理器内存,并使图形处理器交互不受干扰。这也使全球人工智能开发人员在训练模型时能够使用更少的计算能力和图形处理器资源。例如,在涉及一个具有700亿参数的模型的预训练场景中,使用YaFSDP可以节省大约150个图形处理器的资源,这相当于每月节省大约360万至1080万元人民币(取决于虚拟图形处理器提供商或平台)。

而YaFSDP是FSDP的增强版本,在大型语言模型训练中通信最密集的阶段,如预培训、对齐和微调,均优于FSDP方法。YaFSDP在Llama 2 和 Llama 3 上显示的最终加速结果表明,其训练速度有了显著提高,在 Llama 2 70B和Llama3 70B上分别达到21%和26%。当与Yandex的其他性能增强解决方案结合使用时,该方法可将某些模型的训练过程加速高达45%。

“YaFSDP在13至700亿个参数的模型上显示了令人印象深刻的结果,在30至700亿个参数范围内的表现尤为强劲,”米哈伊尔·赫鲁晓夫表示,“目前,YaFSDP最适合基于LLaMA架构的广泛使用的开源模型。”



相关资讯Related Articles

  • 配资门户网站 滚动更新丨美股三大指数集体高开,房多多涨8%

    2025-01-10

    22:54 现货黄金短线下挫近9美元,现报2602.11美元/盎司。 22:53 WTI原油向下触及67美元/桶,日内跌1.23%。 22:42 特斯拉美股涨约4.4%。 22:30 美股开盘丨三大指数集体高开 房多多涨8% 美股开盘,道指涨0.21%,纳指涨0.09%,标普500指数涨0.08%。房地产中概股上涨,房多多涨8%,贝壳涨3%。 22:30 欧洲主要股指多数下跌 截至发稿,英国富时1...

  • 实盘配资平台排名 全球海拔最高、装机容量最大高原型独立构网型储能

    2025-01-06

    全球海拔最高、装机容量最大的高原型独立构网型储能项目西藏开投色尼区达嘎普独立构网型储能电站10日在西藏自治区那曲市并网送电实盘配资平台排名。 r r 西藏开投集团有限公司董事长祁腾武介绍,该项目是西藏自治区2024年重点保供项目,地处那曲市色尼区,海拔4600余米,总投资4.52亿元(人民币,下同),总装机容量100MW/400MWh,项目20年生命周期内预计可为电网输送清洁电能46.72亿kWh...

  • 真正实盘配资 Q3净利润同比下降69% 爱彼迎跌超9%

    2025-01-01

    专题:聚焦美股2024年第三季度财报真正实盘配资 周五,爱彼迎(ABNB.US)股价走低,截至发稿,该股跌超9%,报133.44美元。公司第三季度营收超出华尔街分析师预期,但每股收益则未能达到预期。报告显示,爱彼迎第三季度营收为37.32亿美元,与上年同期的33.97亿美元相比增长10%,不计入汇率变动的影响同样为同比增长10%;净利润为13.68亿美元,而去年同期的净利润为43.74亿美元,其中...

  • 证券股票配资 LET GROUP:杜建存及卢卫东辞任独立非执行董

    2024-12-25

    LET GROUP(01383)发布公告,由于杜建存先生及卢卫东先生认为彼等未能就协助公司于香港联合交易所有限公司主板恢复其股份买卖作出有意义的贡献,故彼等已辞任独立非执行董事证券股票配资,自2024年11月5日起生效。...