Ajax Zhan's Blog
Welcome!This is Ajaxzhan.
坚信:品味优先于执行,价值驱动下创造、系统工程保安全
持续跟进AI前沿研究,持续思考技术、产品与思维。
坚信:品味优先于执行,价值驱动下创造、系统工程保安全
持续跟进AI前沿研究,持续思考技术、产品与思维。
本文介绍了“Vibe Coding”这一以AI为核心编码主力、人类聚焦于需求定义、项目管理等高价值环节的协同工作模式。文章分享了其最佳实践:强调编码前先规划并沉淀文档以建立AI的长期记忆;主张用脚本和配置固化确定性流程,提升系统可靠性;倡导小步迭代以便评审与学习;并分享了手动管理AI上下文的技巧。作者最后指出,AI时代的工程师需掌握结构化表达、系统思维等元技能,其角色正从“写代码”转向“设计系统、拆解任务、验收成果”。
本文聚焦大模型底层显存占用与推理优化,核心涵盖训练与推理两阶段分析。训练时显存主要由模型参数、优化器、激活值、梯度值构成,其中优化器(如AdamW的梯度指数平滑值、梯度平方指数平滑值、参数值)占用最大,混合精度下llama13b训练显存可达222.5GB,LoRA通过冻结主体参数、仅优化低秩矩阵显著节约显存。推理阶段引入KV Cache缓存历史token的k、v向量,避免重复计算,使flops基本恒定;显存开销源于模型参数与KV Cache,时间分预填充(TTFT)与解码(TPOT)阶段,受GPU算力与HBM速率影响,如llama-7B解码阶段TPOT约9.3ms。
定期备份数据库很重要,我之前一直没有这个习惯,因为自己做的都是小项目,而且开发者一般都是自己。 近期与其它同事合作,发现还真会有同事把远程数据库全删了这种情况......所以借这个机会学习和记录一下怎么备份MySQL 为MySQL数据库设置定时备份功能可以通过编写备份脚本并结合操作系统的定时任务工具
DeepSeek-R1最近刷屏全网,与之相随的是有关大模型强化学习的学习热潮。在大模型的强化学习中,有一个概念经常被提及——KL散度。正好最近复习了一下香农熵、交叉熵、KL散度的概念,将他们串在一起将更有利于理解KL散度。 信息量:小概率事件的信息量更大。用-log可以表示这层关系。 熵(香农熵):
本文分享了《金刚经》中的“六度”修行法门,将其视为一种引导人从烦恼此岸到达智慧彼岸的生活方法论。六度包括:布施,即从“要”到“给”的心态转变;持戒,即有所不为,规范自身;忍辱,即面对逆境的智慧与勇气;精进,即纯粹不懈的努力;禅定,即专注调心以求澄澈;般若,即看透事物本质的根本智慧。作者强调,这并非抽象教义,而是实在的生活态度,旨在通过自我雕琢,关注内心成长,从而实现内心的平静。
本文聚焦代码相关基准数据集构建,香港科技大学Jialun CAO博士通过分析10年内274个基准,发现普遍存在样本重复、错误参考代码、未处理敏感信息等问题。为此提出55条标准清单,并系统阐述基准开发的五阶段生命周期:设计阶段需明确动机、范围与能力;构建阶段需规范数据收集、预处理与验证;验证阶段需确保模型选择、参数配置与环境一致性;分析阶段需评估难度、可区分度与稳定性;发布阶段需保障材料可访问性与开源规范。该研究为研究人员提供了构建高质量、高可靠、可复现基准的实用指南,助力规避常见问题,提升研究严谨性。
书途漫记栏目介绍:主要记录笔者近期在读书中的见闻与反思,篇幅往往较短。 今日阅读的书目是克里希那穆提的《生命之书:365天的静心冥想》,第八篇《实相·事实·观与被观·眼前的真相》,颇有感悟,因此记录到书途漫记栏目。 莫把追求“活在当下”变成另一种“我执” “活在当下”或许是大部分有意识的现代人所追求
今天聊聊计算机网络中网络层那些事儿:在TCP/IP分层模型中,网络层起着承上启下的作用,它包含着诸多协议,内容十分繁杂,学习起来属实不易。因此,本文将采用图文的形式拆解网络层中的重要知识点,帮助读者一起过一遍网络层的核心知识。 我选取的教材是经典黑皮书“自顶向下”,同时本文的讲解顺序与原书有所区别。
基于Go语言实现跳表 占个坑,写个博客记录一下Go语言实现跳表的经过,并对跳表数据结构做更深入的理解。 目前代码已编写完毕,本文代码详见GitHub仓库。
本文记录一次js动态生成cookie的反爬虫的解决过程。这个反爬卡住了我整整2天,在多次尝试之后终于成功爬取,遂将过程中踩的坑和经验记录一下。 ⚠️声明:本次爬虫仅仅是爬取网站上【公开】的【新闻公告】数据,其目的仅仅是为了制作一个自动订阅工具,无盈利目的和其他目的。同时,rss订阅器的请求频率非常低