AI/ML 论文与深度内容 — 2026-W10
本周收集的 AI/ML 相关论文、书籍、深度文章合集。涵盖 AGI 经济学、LLM 架构创新、认知卸载研究、工程实践等方向。
ZZ-703 | Some Simple Economics of AGI
来源: https://arxiv.org/abs/2602.20946
作者: Christian Catalini(112 页经济学论文)
核心框架
AI 让执行成本指数下降,但人类验证带宽受生物学限制——这两条成本曲线的碰撞决定了 AGI 转型的经济学。
- Cost to Automate — 指数级下降
- Cost to Verify — 受生物学瓶颈约束,难以快速扩展
- Measurability Gap — agent 能执行的 vs 人类能验证的差距越来越大
五个关键概念
- 从 skill-biased 到 measurability-biased 技术变革 — 租金迁移到验证级 ground truth、密码学溯源、责任承保
- Missing Junior Loop — 学徒制崩溃,从下方侵蚀 human-in-the-loop 均衡
- Codifier’s Curse — 专家将自身知识编码进 AI,加速自身过时
- Trojan Horse externality — 不验证直接部署在私人层面是理性的,但产生外部性
- Hollow Economy vs Augmented Economy — 不管理验证带宽 → 空心经济;扩展验证 → 增强经济
结论
今天的挑战不是部署最自主的系统,而是扩展验证/监督的带宽。论文提供了个人、企业、投资者、政策制定者的 playbook。
ZZ-851 | The Hundred-Page Language Models Book
来源: https://thelmbook.com
GitHub: https://github.com/aburkov/theLMbook
作者: Andriy Burkov(《The Hundred-Page Machine Learning Book》作者)
结构亮点
- 渐进式架构:count-based → RNN → Transformer → LLM 的自然演进路线,不直接丢 Transformer
- 数学 + 直觉双轨:每个概念都有清晰的数学推导和直觉说明
- 完整 PyTorch 实现:GitHub 仓库提供每个主题的可运行代码 + Jupyter Notebooks
- LLM 实战章节最大:覆盖 prompt engineering 技巧和 instruction finetuning
- 附赠 $150 Lambda GPU credits
适合人群
技术领导、工程经理、软件开发者、数据科学家、ML 工程师。Burkov 延续了上一本书「短小精悍、代码完整」的风格。
ZZ-255 | AI 与认知卸载研究
来源:
主题
关于 AI 对人类 cognitive offloading(认知卸载)影响的研究视频——AI 工具如何改变人类的思考和记忆方式。
与 ZZ-703 的 Measurability Gap 概念呼应:当 AI 代劳认知工作,人类如何维持验证能力?
ZZ-216 | DeepSeek Engram — Conditional Memory 论文
来源: https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf
GitHub: https://github.com/deepseek-ai/Engram
合作: DeepSeek + 北京大学,梁文锋署名
核心问题
MoE 通过条件计算实现稀疏化,但现有 Transformer 缺少原生知识查找机制,只能通过计算过程低效模拟检索行为。
Engram 架构
- 条件记忆(Conditional Memory) — 与 MoE 的条件计算互补的稀疏化新维度
- O(1) 查表:基于哈希 N-gram,确定性检索,不依赖运行时隐藏状态路由
- 系统解耦:确定性寻址支持从主机内存预取,几乎零额外延迟
实验数据
在等参数、等 FLOPs 的严格对照下,Engram-27B vs MoE-27B:
- 知识任务:MMLU +3.0,CMMLU +4.0,MMLU-Pro +1.8
- 推理任务:BBH +5.0,ARC-Challenge +3.7,DROP +3.3
- 代码/数学:HumanEval +3.0,MATH +2.4,GSM8K +2.2
- 长文本:Multi-Query NIAH 准确率从 84.2 → 97.0
U 型扩展规律
将约 20%-25% 的稀疏参数预算从 MoE 重新分配给 Engram 可获最优性能(最优点在 ρ ≈ 75%-80% 处稳定)。
意义
DeepSeek 认为条件记忆将成为下一代稀疏大模型的核心建模原语。结合 mHC(Manifold-Constrained Hyper-Connections),DeepSeek v4 的轮廓愈发清晰。
ZZ-186 | 智谱上市后的信
来源: https://www.latepost.com/news/dj_detail?id=3360
LatePost 对智谱 AI 上市后的深度报道。智谱是国内主要的大模型公司之一,背靠清华系。
ZZ-178 | Database 2025 — Andy Pavlo
来源: https://x.com/andy_pavlo/status/2008180749900648837
作者: Andy Pavlo(CMU 数据库教授)
Andy Pavlo 的年度数据库回顾系列。2025 年主要话题通常包括:向量数据库崛起、AI-native DB 架构、Postgres 生态爆发、NewSQL 演进。
参考博客:https://ottertune.com/blog/
ZZ-117 | 到底什么是 Reasoning?
来源: https://x.com/dongxi_nlp/status/2003574127211479442
关于 LLM “reasoning” 本质的 Twitter 讨论串。当前 AI 界对 reasoning 的定义众说纷纭,这个 thread 提供了一个有价值的视角。
ZZ-82 | Memory Paper Landscape
来源: https://x.com/wey_gu/status/2001239698501722296
Memory 相关论文全景图——与 ZZ-216(DeepSeek Engram)形成互补。目前 LLM memory 研究方向繁多,这个 list 提供了系统性概览。
ZZ-75 | TPU 101
来源: https://mp.weixin.qq.com/s/0PqT8cCfFiQlnKfhIVWN6g
TPU 基础科普文章。了解 Google TPU 架构对理解 LLM 训练基础设施有帮助。
ZZ-78 | Databricks Blog — ML Engineering
来源: Databricks Blog
标题: Machine Learning Engineering: Complete Guide to Building Production ML Systems (13 min read)
ML Engineering 生产系统完整指南。Databricks 视角的 ML 工程实践,涵盖从模型开发到生产部署的完整流程。
ZZ-90 | ADHD Paper
来源: https://x.com/NTFabiano/status/2000991883078574099
ADHD 相关研究论文的 Twitter 分享。
主题关联
验证带宽 (ZZ-703)
└── 认知卸载 (ZZ-255)
LLM 架构创新
├── DeepSeek Engram — Conditional Memory (ZZ-216)
└── Memory Landscape (ZZ-82)
系统学习资源
├── Hundred-Page LM Book (ZZ-851)
├── TPU 101 (ZZ-75)
└── ML Engineering Guide (ZZ-78)
行业观察
├── 智谱上市 (ZZ-186)
├── Database 2025 (ZZ-178)
└── What is Reasoning? (ZZ-117)