标签: LLM | 如轼稻文栈

互动

最近评论

好帅，正在想怎么把学校的网页做成RSS，感觉有人做过，一搜就查到作者了，请问你是参考这个做的吗https://docs.rsshub.app/zh/joinus/new-rss/start-code，暂时有点看不太懂哈哈哈哈。

标签

寻找感兴趣的领域

文章

MCP 0 MCP 0 性能优化 0 FastAPI 0 Fast 0 git subtree 1 HTTP 0 Cursor 0 VPN 0 SDD 1 AI4Code 2 Agent 2 数学 1 评估 0 LLM 1 心经 1 健康 0 PaperSharing 1 Paper 0 Benchmark 1 计算机网络 1 OAuth 0 前端 0 爬虫 1 k8s 1 k82 0 云原生 1 陷阱 1 并发编程 1 RSS 1 持续集成 1 设计模式 1 旅游 0 项目文档 1 总结 1 技术文档 1 Ascend 1 数智化教育 0 联通主义 0 学与思 1 思悟 1 领导力 0 曾国藩 0 分享 1 Python 1 学习周报 0 微机原理与接口技术 3 实战 1 Java 1 git 3 算法竞赛 1 C 1 容器 1 Docker 2 数据结构与算法 2 实验 1 CS61B 1 高人对话 2 学习方法论 1 全栈 1 MybatisPlus 2 IO 1 单元测试 1 sa-token 1 权限系统 1 开发实践 4 国际化 1 发布订阅 1 线程池 1 日志 1 AOP 1 限流 0 Redis 1 系统设计 2 frp 1 内网穿透 1 操作系统 7 JVM 2 存在主义 1 通义 1 AI 1 SpringCloud 1 踩坑 3 Socket 2 Qt 1 C++ 2 项目 2 读书札记 5 心理学 2 Golang 16 分库分表 2 动手学微服务 3 社会实践 3 支教 3 凉山 3 Halo 0

大模型显存占用分析：训练与推理

Research 未读

大模型显存占用分析：训练与推理

作为大模型时代的研究者，尽管我们做的是一些下游任务，我认为也有必要了解一些更加底层的基础知识。基于此出发点，本文将简单讨论如下主题： LLM训练时的显存占用分析。 KV Cache LLM推理时的显存占用分析。 LLM训练时的显存占用分析在分析显存占用前，需要明确数据的存储精度：float32占

LLM 2025-03-09