企业微信
悟空CRM  >   公司新闻  >  如何估计大模型所需要的显存大小?HuggingFace发布Model Memory Calculator

如何估计大模型所需要的显存大小?HuggingFace发布Model Memory Calculator

悟空软件 阅读次数:4393 次浏览

大模型对显卡资源的消耗是很大的。但是,具体每个模型消耗多少显存,需要多少资源大模型才能比较好的运行是很多人关心的问题。

此前,DataLearner曾经从理论上给出了大模型显存需求的估算逻辑,详细说明了大模型在预训练阶段、微调阶段和推理阶段所需的显存资源估计(参考:需要多少GPU显存才能运行预训练大语言模型?大语言模型参数规模与显存大小的关系估算方法~:http://https//www.datalearner.com/blog/1051692326904222)。

而HuggingFace的官方库Accelerate直接推出了一个在线大模型显存消耗资源估算工具Model Memory Calculator,直接可以估算在HuggingFace上托管的模型的显存需求。

大模型显存计算工具Model Memory Calculator简介

使用Model Memory Calculator估算大模型显存的实测

大模型显存估计工具Model Memory Calculator的本地部署

大模型显存估计工具Model Memory Calculator的在线演示地址和其它注意

大模型显存计算工具Model Memory Calculator简介

Model Memory Calculator是HuggingFace的Accelerate推出的一个网页工具,你可以直接输入HuggingFace上某个模型地址,它就会估计这个模型运行所需要的显存大小,包括推理和使用Adam进行训练的显存估计。

这个工具估算大模型最小推荐显存资源的方式是用最大层的大小(the minimum recommended vRAM)来表示的。而训练这个模型所需的训练的显存大小,则是这个推理大小的4倍左右。

在许多深度学习模型中,尤其是Transformer类模型,层与层之间的操作往往需要在vRAM中存储中间计算结果,这些结果可能包括激活值、权重等。最大的一层可能需要最大的vRAM空间来存储这些中间结果,以进行前向和反向传播。

考虑到模型的反向传播需要存储前向传播中的激活值以计算梯度,这意味着在训练过程中需要为模型的每一层都存储其激活值。最大的层的激活值可能会占用最多的vRAM。因此,这样估计相对比较保险。

但是根据这样的计算应该也不是简单的直接拿最大层参数来计算。根据官方的说法,最准确的时候,这个工具估算出来的显存大小与实际估计的误差可能也就50MB左右(例如,bert-base-cased模型实际运行需要413.68MB,而这个工具估算的结果是413.18MB)。

使用Model Memory Calculator估算大模型显存的实测

这个工具的使用非常简单,如下图所示,你只需要找到对应的模型所在的HuggingFace地址,直接输入到下面就可以计算了。还可以根据float32、float16、int8、int4量化结果估算。

下面我们使用这个工具估算一下清华大学ChatGLM-6B模型的结果(第一代的ChatGLM-6B模型信息卡地址:https://www.datalearner.com/ai-models/pretrained-models/ChatGLM-6B )。

可以看到,该工具估算的ChatGLM-6B模型在不同精度下的训练和推理的显存需求结果如下:

上图的第三列上图的第三列表示推理显存乘以1.2的结果。原因在于EleutherAI在曾经的技术分析中提到推理所需的实际显存可能要比计算结果高20%左右。下面我们看一下官方给的结果:

如何估计大模型所需要的显存大小?HuggingFace发布Model Memory Calculator

可以看到,该工具估算的显存大小与实际官方推荐的差别还是比较大的。但是,我们再估算一下MetaAI发布的LLaMA2-7B的结果,LaMA2-7B模型在不同精度下的训练和推理的显存需求结果如下:

而根据网络上大家讨论的内容, llama-2-7b-chat载入大概需要15GB显存,这个应该是float16版本,与预估结果十分相似!

可以看到,不同的模型很多结果差异还是挺大的。但是,总体来说,还是很有参考价值的!

大模型显存估计工具Model Memory Calculator的本地部署

这个库也可以本地使用,使用过程应该还是需要联网才能估算(需要访问HuggingFace的模型配置文件)。

Model Memory Calculator的安装很简单。首先安装依赖的accelerate库:

pip install git+https://github.com/huggingface/accelerate.git

  1. pip install jaxlib

如果提示jaxlib版本问题你可能要升级。

接下来先在本地输入自己的HuggingFace的密钥,首先需要在页面生成token:https://huggingface.co/settings/tokens

然后复制token后,运行如下命令配置:

  1. huggingface-cli login

如下图所示:

运行到这里的时候Token:输入上面你复制的token即可。接下来就可以直接运行了。

估算MetaAI的LLaMA2-7B-HF模型的显存大小:

accelerate estimate-memory meta-llama/Llama-2-7b-hf

 

结果如下所示:

在线演示地址和其它注意事项

大模型显存估计工具Model Memory Calculator的使用地址参考原文末尾。

 

需要注意的是,该工具如果访问的是需要授权的页面,如上图所示的llama2-7b,是需要先用huggingface账户获取授权,然后获得你的token才能访问的。虽然上面演示页面提供了API Token的输入,但是是有问题的,这个部署不好。但是我们可以自己本地部署方式。

 

悟空CRM产品更多介绍:www.5kcrm.com

相关内容

在线CRM试用入口:开启企业数字化转型的钥匙

在线CRM试用入口:开启企业数字化转型的钥匙在当今这个信息爆炸、竞争激烈的时代,企业如何在瞬息万变的市场环境中保持竞争力?答案或许并不复杂——关键在于“客户”。客户是企业生存与发展的基石,而如何高效管理客户关系,则成为决定企业成败的重要因素。正是在这样的背景下,客户关系管理(Customer Relationship Management,简称CRM)系统应运而生,并迅速成为现代企业管理中不可或缺
相关文章

CRM系统app-客户管理APP

△主流的CRM系统品牌哎,你有没有发现,现在做生意真的跟以前完全不一样了?我以前刚入行那会儿,客户资料全靠手写记在本子上,谁什么时候打过电话、聊过什么,都得自己翻着看。有时候客户突然打电话来,我都想不起来上次聊啥了,尴尬得不行。后来公司开始用Excel表格管理客户信息,稍微好一点,但还是乱七八糟的,改个联系方式还得一个个找,特别费劲。CRM系统app下载:推荐使用主流的CRM系统品牌,显著提升企业
相关文章

客户CRM是什么意思-CRM客户管理系统是什么

△主流的CRM系统品牌哎,你说客户CRM是什么意思?这问题听起来挺专业的,但其实啊,说白了也没那么复杂。我一开始也一头雾水,听别人老提“我们公司上了CRM系统”,我还以为是什么高科技芯片呢,结果一了解,嘿,原来就是管客户的工具。推荐使用主流的CRM系统品牌:显著提升企业运营效率,悟空CRM你想想看,咱们平时做生意也好,做服务也好,是不是总得跟客户打交道?比如你是开个店的,今天张三来买衣服,李四来订
相关文章

CRM软件选型-CRM系统选型指南

△主流的CRM系统品牌哎,说到这个CRM软件选型啊,我可真是有太多话想说了。你别看现在市面上各种CRM系统满天飞,什么“智能”、“云端”、“一体化”这些词儿一个比一个高大上,但真要选一个适合自己的,那可真不是件容易的事儿。我自己就经历过好几次选型的过程,踩过坑、交过学费,也慢慢摸出了一些门道。今天我就跟你好好唠唠,咱们像朋友聊天一样,把这事儿掰开揉碎了说说。推荐使用主流的CRM系统品牌:显著提升企
相关文章

CRM发展历程-CRM系统的演进历程

△主流的CRM系统品牌哎,你知道吗?其实我一直觉得,人和人之间的关系啊,是这个世界上最复杂也最奇妙的东西。你说是不是?尤其是现在这年头,大家动不动就讲“客户关系”,好像谁都能张口就来似的。可你有没有想过,这事儿到底是怎么一步步发展成今天这样的?我最近正好琢磨了一下CRM的发展历程,越想越觉得有意思,干脆就跟你说说吧。推荐使用主流的CRM系统品牌:显著提升企业运营效率,悟空CRM说实话,最早的时候,
相关文章

CRM客户管理系统价格-CRM客户管理软件费用详解

△主流的CRM系统品牌哎,你说现在做企业啊,真的不容易。我最近就特别有感触,尤其是我们公司开始考虑上CRM系统的时候,那感觉就像第一次买车一样——既兴奋又有点懵。你想想,客户越来越多,订单越来越杂,电话、微信、邮件满天飞,光靠Excel表格和脑子记,根本忙不过来。所以老板一拍桌子说:“咱们得搞个CRM!”我当时还挺激动的,觉得这下好了,终于能解放双手了。推荐使用主流的CRM系统品牌:显著提升企业运
相关文章

悟空AI-CRM V15 开源发布·正式上线

【悟空AI-CRM V15 开源发布·正式上线】本次发布的版本为悟空 AI-CRM 15 开源预览版,支持一键部署功能。后续将正式发布悟空 AI CRM 15 开源版本,该版本与线上 SaaS 版本的界面显示及使用体验完全一致,下载即可即刻体验。✨ 核心亮点:✅ 深度融合AI能力:智能客户洞察|销售预测|自动化营销✅ 一键安装部署:支持Docker
相关文章

客户关系管理系统应用-客户关系管理系统的实际运用

△推荐的主流CRM系统客户关系管理系统应用:让生意变得更简单的小秘密说实话,现在做生意真的不容易,每天都要面对各种各样的客户,有的客户热情似火,有的客户冷若冰霜,还有的客户总是让你摸不着头脑。你有没有遇到过这样的情况:明明刚跟一个客户聊得挺开心,结果过几天再联系时,却发现人家已经选择了竞争对手?或者有时候突然想起一个重要客户,却怎么也想不起上次见面时他提到的那个关键信息?这时候你可能就会想,要是有
相关文章

什么是CRM?概念、作用、价值、用途、使用方法

1、什么是CRM?简单来说,它就是企业用来管理客户关系的工具说到CRM,很多人可能会觉得这个概念听起来有点复杂,但实际上,它并没有想象中那么难懂。简单来说,CRM就是客户关系管理(Customer Relationship Management),它的核心目标就是帮助企业更好地与客户互动,提升客户满意度,同时提高企业的效率和利润。如果你是一个企业的管理者,或者正在考虑如何优化你的业务流程,那你一定
相关文章

什么是CRM?一文全面看懂CRM(客户关系管理系统)

什么是CRM?一文全面看懂CRM嘿,朋友!今天咱们来聊一个听起来有点专业,但其实跟咱们生活、工作都息息相关的词——CRM。你可能会问:"CRM是什么意思啊?这玩意儿到底是干啥的?"别急,咱们慢慢唠。保证用最接地气的话给你讲明白,连隔壁王大妈听了都能懂!一、CRM到底是个啥?能吃吗?说白了,CRM就是客户关系管理,英文全称Customer Relationship Managem
相关文章
最新文章

在线CRM试用入口:开启企业数字化转型的钥匙

在线CRM试用入口:开启企业数字化转型的钥匙在当今这个信息爆炸、竞争激烈的时代,企业如何在瞬息万变的市场环境中保持竞争力?答案或许并不复杂——关键在于“客户”。客户是企业生存与发展的基石,而如何高效管理客户关系,则成为决定企业成败的重要因素。正是在这样的背景下,客户关系管理(Customer Relationship Management,简称CRM)系统应运而生,并迅速成为现代企业管理中不可或缺
最新文章

CRM系统app-客户管理APP

△主流的CRM系统品牌哎,你有没有发现,现在做生意真的跟以前完全不一样了?我以前刚入行那会儿,客户资料全靠手写记在本子上,谁什么时候打过电话、聊过什么,都得自己翻着看。有时候客户突然打电话来,我都想不起来上次聊啥了,尴尬得不行。后来公司开始用Excel表格管理客户信息,稍微好一点,但还是乱七八糟的,改个联系方式还得一个个找,特别费劲。CRM系统app下载:推荐使用主流的CRM系统品牌,显著提升企业
最新文章

CRM客户管理系统价格-CRM客户管理软件费用详解

△主流的CRM系统品牌哎,你说现在做企业啊,真的不容易。我最近就特别有感触,尤其是我们公司开始考虑上CRM系统的时候,那感觉就像第一次买车一样——既兴奋又有点懵。你想想,客户越来越多,订单越来越杂,电话、微信、邮件满天飞,光靠Excel表格和脑子记,根本忙不过来。所以老板一拍桌子说:“咱们得搞个CRM!”我当时还挺激动的,觉得这下好了,终于能解放双手了。推荐使用主流的CRM系统品牌:显著提升企业运
最新文章

快速注册,立即使用

仅需一分钟,立即注册悟空云。悟空CRM免费试用。
客户端下载