Blog

Series & Tag View on the left, newest posts on the right.

Posts (Newest First)

Pattern Recognition and Machine Learning 第一章：模式识别与机器学习导论

机器学习的大厦，究竟建立在哪些地基之上？本文是对 Christopher Bishop 经典著作《Pattern Recognition and Machine Learning》第一章的系统性精读笔记。Bishop 在这一章并非只是走马观花地介绍概念，而是以**多项式曲线拟合**这一极简模型为线索，将概率论、统计推断、决策理论与信息论串联成一个严密的整体，揭示出贯穿全书的核心思想。文章从**过拟合问题**切入——一个 $M=9$ 的多项式为何能完美拟合训练点却在测试集上一塌糊涂？沿着这个问题，我们推导最小二乘的正规方程，发现正则化背后藏着**高斯先验**，最小二乘背后藏着**高斯噪声假设下的最大似然**。这一系列发现将频率派与贝叶斯派的核心分歧具体化：参数到底是未知的常数，还是有自己概率分布的随机变量？在概率论部分，文章从加法规则和乘法规则出发严格推导贝叶斯定理，并给出均值/方差 MLE 的完整推导与**方差有偏性的数学证明**（贝塞尔校正的来源）。在决策论部分，将最优分类规则与损失矩阵统一在期望损失最小化的框架下，并讨论了三种推断范式（生成模型 / 判别模型 / 判别函数）各自的适用场景。最后，信息论部分揭示了一个深刻的等价关系：**最大似然估计 ≡ 最小化模型分布与数据经验分布之间的 KL 散度**，交叉熵损失函数因此获得了坚实的理论依据。全文包含完整的数学推导过程和可运行的 Python 代码示例，覆盖第一章全部 6 个小节（含 1.5 决策论与 1.6 信息论），适合有一定线性代数和概率基础、希望深入理解机器学习理论根基的读者。 **关键词**：PRML · 最大似然估计 · 贝叶斯推断 · 过拟合与正则化 · 决策论 · KL 散度 · 信息熵

2026-05-15 · 59 min read

#machine-learning

CSAPP 第 1 章硬核导读：从 hello.c 看懂整个计算机系统

一篇把 CSAPP 第 1 章讲透的系统入门：从位和上下文、编译链路、CPU 执行模型、缓存与存储层次，到操作系统抽象、网络、并发并行和 Amdahl 定律，用 hello.c 串起现代计算机系统的全景图。

2026-04-24 · 20 min read

#coumputer-science

Stanford CS336 Lang. Modeling from Scratch | Spring 2025 | Lec. 3: Architectures, Hyperparameters

*最好的学习方式是亲自动手。第二好的方式是从别人的经验中学习。*

2026-04-09 · 20 min read

#llm

ReAct：为什么只会“想”或只会“做”的大模型都不够？ Reasoning + Acting 的工程价值

大语言模型出来以后，研究里很快出现了两条路线。原文链接：https://arxiv.org/abs/2210.03629

2026-04-01 · 20 min read

#agent

LangChain Streaming：会不会流式输出？

在 LLM 应用里，Streaming 从来不只是“把字一个一个吐出来”。对真实项目来说，它解决的是另外几个更硬的问题：首字延迟太长、Agent 调工具时用户以为系统卡死、长链路任务没有过程反馈、线上排障时看不见中间状态。LangChain 在官方文档里把 Streaming 能力拆成了 updates、messages、custom 三类，而且支持同时开启多种模式；LangChain Agent 本身又是构建在 LangGraph 之上的，所以这些能力本质上是“把 Agent 执行过程变成事件流”。

2026-03-31 · 20 min read

#agent

LangChain Short-Term Memory 工程实战：“让模型记住你”？如何把线程状态管起来

做 Agent 时，大家经常说“给模型加记忆”。但在工程里，短期记忆的本质不是抽象的 memory，而是线程级状态管理：同一个会话里，前几轮用户说过什么、工具查到了什么、中间结果是否要保留、下一步提示词要不要动态改，这些都需要被可靠保存，并在后续步骤继续读取。LangChain 在这件事上的官方实现，核心不是往 prompt 里拼字符串，而是把短期记忆纳入 agent state，并通过 checkpointer 做持久化。([LangChain Docs](https://docs.langchain.com/oss/python/langchain/short-term-memory))

2026-03-23 · 20 min read

#agent