Ajax Zhan's Blog

Welcome!This is Ajaxzhan.
坚信:品味优先于执行,价值驱动下创造、系统工程保安全
持续跟进AI前沿研究,持续思考技术、产品与思维。

这是AI时代,也是一个酒神时代——新技术、新产品、新SOTA层出不穷,从传统大厂到创业公司到OPC到每个个体——每个人都在拼了命想赶上这波浪潮。

神奇的是,在感性和理性的拉扯中,我的理性在这一个月里面变得淡了许多,几乎没有占据过主导地位,感性倒是久不散去,给我带来了许多欢乐和痛苦。

只需要将VPN改成虚拟网卡模式,再打开Cursor的HTTP2.0模式就不会有模型被拦截的问题了,很神奇。解决了HTTP1.1网络环境太差的问题。

最近开始意识到一种很重要的能力——幽默,当然这种幽默不仅仅是对别人,更多是对自己的一种幽默。如果一个人都无法进行自嘲和对生活中的事情进行解构,那么这个人绝对会获得特别痛苦和憋屈,更不用说会产生什么有价值的思考了。所以保持一种对自己冷幽默的态度还是很重要。

兼具深度与启发性的分析,能有效帮助培养更敏锐的Research Taste:关于大海捞针是一个很好的评估长上下文的指标——https://www.zhihu.com/question/654570878/answer/1965228622118888157

AI的发展、LLM的发展太快了,落地的推进也很迅速,中国有无数能人志士正在各自岗位推动这件事情。今年看到的太多新闻都给我一种感觉:AI的浪潮不像是泡沫,未来3-5年AI的需求只会增加,不会减少。浪潮之下,要学习的东西还太多太多。

最近把MLLM当作OCR来用,大概就是识别图中的习题然后转成平台兼容的格式。这个过程中发现大模型的幻觉还挺可怕,他要是直接给你很离谱的错误也就罢了,他居然会给你修改选项中的一些细节,并且修改得很合理,让你完全看不出来。这种幻觉在很多领域我认为还是不可接受的,而且关键是怎么检测出来这种幻觉?如果还要靠人为来检测,那这种基于大模型的自动化工作流其实意义就大打折扣了。

今晚回顾了之前支教的照片,感慨颇深。想做一个好的老师,但确实做的不够好。

今天研究了Coze的Multi-Agent、豆包的语音合成大模型、开源的OpenWebUI和NewAPI,感觉都挺牛的,效果很令人振奋,可以试试组合起来做个项目。

同时我现在越来越觉得,不是为了追求技术而技术,而是要用技术做出真正的好产品,注重用户体验和实际价值。真正的好产品实在令人振奋,字节跳动公司推出的豆包语音系列效果震撼,飞书在办公方面做的绝绝子,今天实用了火山引擎的工单系统都觉得很nice。感觉字节的产品都很有灵气。

今晚看了看过去一年的日记,很有感触,记日记真的很有意思,只有通过当时的文字才能观照今日的自己是否已经成长了。我们需要隔一段时间询问一下自己:自己是否激情依旧,是否能留存有过去许下愿望那时的热情?

博客搬迁踩坑指南:实现markdown图片的自动化替换

需求来源 Hexo博客难以长期维护 博客,是学习计算机科学的同学所必备的网站,好的博文能够体现一个人的能力和思考水平,一个长期维护的博客更是一个人是否拥有长期坚持品质的重要证明。毕竟,如果你能长期维护好一个博客,那么由你负责的项目大概率不会被你中途放弃。 说起博客,我自22年11月起搭建起了个人博客

操作系统复习笔记(IV):文件管理

本文系统阐述了文件系统的核心概念与机制。文件是以磁盘为载体的信息集合,由文件名、数据、类型等组成,通过create、read等系统调用操作。文件目录通过FCB实现“以名存取”,结构包括单级、两级、树形及无环图,后者支持文件共享但需计数器防误删。索引节点(inode)分离文件名与描述信息,提升目录检索效率。文件逻辑结构分无结构(流式)和有结构(顺序、索引等),物理结构则采用连续分配(高效但碎片多)、链式分配(支持扩展但随机访问差)及索引分配(灵活需多级管理)。存储空间管理通过空闲表、链表或位视图法实现。文件共享分硬链接(基于inode)与软链接(符号链),保护机制包括口令、加密及访问控制列表(ACL)。最后,文件系统层次结构从用户接口到设备管理,虚拟文件系统(VFS)统一不同文件系统接口,挂载机制实现跨系统兼容。

操作系统复习笔记(V):I/O系统

IO管理概述 I/O设备的基本概念和分类 按使用特性分类: 人机交互类外设:鼠标、键盘、打印机 传输速率比较慢 存储设备:硬盘、光盘 传输速率比较快 网络通信设备:光猫 速度介于两者中间 按传输速率分类: 低速设备:几个-几百个KB/s。例如鼠标键盘 中速设备:几千个-上万个KB/s。例如激光打印机

动手学微服务(二):面试官问我有没有使用过ShardingJDBC

《动手学微服务》系列文章将专注微服务中的常见思想、常用技术和常见架构。本系列的特点是不仅在理论上对微服务的知识进行梳理,还会有一系列的动手实践,不仅在平时学习会有帮助,也有助于面试。本人也是微服务的小学徒,为了巩固所学而创建此专栏,欢迎大家持续关注。 前言 在《动手学微服务(一):实战MySQL读写

动手学微服务(一)实战MySQL读写分离和分库分表

《动手学微服务》系列文章将专注微服务中的常见思想、常用技术和常见架构。本系列的特点是不仅在理论上对微服务的知识进行梳理,还会有一系列的动手实践,不仅在平时学习会有帮助,也有助于面试。本人也是微服务的小学徒,为了巩固所学而创建此专栏,欢迎大家持续关注。 为何需要读写分离?从一个业务场景说起 我们以用户

微机复习笔记(I):8253芯片

8253是可编程定时/计数器,通过软硬结合实现定时计数,不占用CPU且可程控调节精度高。其内部含3个独立16位通道,每个通道可设6种工作方式。编程需先写控制字(选择通道、工作方式、计数方式及读写方式),再写计数初值(>255分两次)。6种工作方式中:方式0(计数结束中断,初始OUT低)、方式1(硬件触发单稳,负脉冲宽度可调)、方式2/3(连续负脉冲/方波,自动重装,分频应用)、方式4(软件触发选通单脉冲)、方式5(硬件触发选通单脉冲,自动重装)。例题涵盖控制字配置、定时波形生成及长延时设计,突出其在定时、分频、中断等场景的应用。

部署Nacos也能踩坑?Nacos2.3.1部署踩坑记录

前言 笔者最近在写一个微服务的项目,在技术选型方面采用了Dubbo作为RPC框架,注册中心选用了Nacos,在部署Nacos的时候,本着怎么方便怎么来的缘故,我选用了Nacos Docker进行部署,却没想到在鉴权上也踩了一些坑,特写一篇文章记录一下。 Nacos Docker部署 Nacos部署

阿里也出手了!Spring Cloud Alibaba AI初体验

Spring AI是受Python项目启发的AI应用开发框架,核心在于提供抽象能力、简化开发,支持多模型(如OpenAI、通义)及向量数据库,屏蔽底层交互细节。Spring Cloud Alibaba AI基于其适配国内通义大模型,支持对话、文生图、文生语音等功能,提供便捷的Spring Boot集成。动手体验显示,通过简单配置依赖与API-Key,即可快速实现文本问答、图像生成、语音合成等模型对接,代码简洁(如ChatClient一行调用)。使用小结指出其简化复杂AI应用开发的优势,但也存在响应时间优化空间及模型选择灵活性待提升问题,未来将持续适配VectorStore、RAG等场景,助力国内Java开发者高效构建AI应用。

实践札记:内网穿透Frp踩坑

本文针对物联网项目中华为云IoT平台数据需转发至本地Web服务的需求,探讨了内网穿透解决方案。作者排除了直接部署云服务器和转发脚本方案后,重点实践了内网穿透技术。过程中先后尝试了ngrok、CloudFlare tunnel等工具,遭遇了访问限制、带宽不足、URL格式错误等问题。最终采用frp(高性能反向代理工具)实现成功穿透,通过在云服务器和本地分别部署frps和frpc服务,配置HTTP代理使公网可通过自定义域名访问本地服务。文章详细分享了frp的配置要点、systemd管理最佳实践,为类似场景提供了可复用的解决方案。

系统设计:如何使用AOP设计一个防重提交功能

防重幂等的概念 防重幂等指的是我们的业务需要防止两条相同的数据重复提交导致脏数据或业务错乱。需要注意的是,重复提交属于小概率事件,这和并发压测不是同一个概念。 我们的目标是通过防重幂等的设计,让系统支持业务失败或异常快速释放限制。业务处理成功后,会在指定时间限定内限制同一条数据的提交。本文将介绍如何