盛溪的博客

文章从人工智能的两大分支——符号主义与联结主义——展开，回顾了从感知机到多层感知机的发展历程，以及异或问题如何暴露出早期模型的局限，引发第一次 AI 寒冬。随后介绍了词嵌入、向量运算和注意力机制等关键技术如何推动联结主义的复兴，使大语言模型能够在高维“意义空间”中进行概率预测与生成。最后，结合对齐与强化学习，文章揭示了 ChatGPT 等现代 AI 在语言理解与生成上的核心原理。

异或的挫败与注意力的胜利：AI如何理解语言

LLM 推理“不确定性”的根因不在温度或“并发+浮点”，而在于 batch invariance 缺失：同一请求的数值会随拼批规模与切分策略改变。通过对 RMSNorm、Matmul、Attention 做 batch-invariant 改造（统一 KV 布局、固定 split-size 等），在 temperature=0 下可实现位级一致的可复现输出，代价是可接受的性能损失，为金融/法律等高确定性场景及 True On-Policy RL 奠定基础。

大模型“不确定性”的真相：不是温度而已，关键在 batch invariance

本文从“宽容”作为人类社会精神底座出发，延伸探讨了AI发展中的两个核心问题：价值对齐与算法偏见**。当AI逐渐获得接近乃至超越人类的智能时，我们必须重新思考，我们在数据中灌输的价值观，是否配得上我们期望未来机器所体现的理性与善意。
📌 主要内容概览：
1. AI系统若无法对齐人类价值，将面临灾难性风险
    ◦ 引用Anthropic提出的三种可能路径：乐观、中性、悲观
    ◦ 强调“技术对齐问题”的严峻性，尤其在AI智能接近或超越人类的情境下
2. 人类的偏见与仇恨正在污染训练数据
    ◦ 大模型学习的是人类语言、行为和价值的集合体
    ◦ 如果我们对“平凡人”“弱势群体”都缺乏宽容，最终塑造的AI也将对他们无情——而那最终会反噬我们自己
3. 数据偏见是结构性的、难以完全根除的
    ◦ 介绍经典文献：
        ▪ 《A Survey on Bias and Fairness in Machine Learning》
        ▪ 《Weapons of Math Destruction》
    ◦ 深入讨论偏见的来源、反馈循环与应对策略
4. “信息”≠“知识”，偏见的批判与防范需要真正的深度认知
    ◦ 仅靠“收集技术资料”远远不够，AI PM 和开发者需要形成独立的伦理判断力与系统性思维

对于人工智能时代的巨大思考————请你宽容

📌 一、核心观点概括
• 信息 ≠ 知识：信息只是“快照”，知识是经过深度理解与体系化构建的“内化产物”。真正的知识不能靠刷短视频获取，而要靠长期实践和认知构建。
• “努力万能论”是误导：教育常用“努力”来掩盖体制对记忆与逻辑的单一偏好，但真正的人才培养应走“扬长避短”之路，而不是一刀切地补短板。
• 教育的公平不在于平均，而在于差异化赋能：每个人应有公平的发展机会，但不必走相同的道路。真正的公平是根据天赋差异，提供不同的资源支持。
🎯 二、教育制度深层批判
• 当今考试制度强化记忆与逻辑推演，实际剥夺了学生探索自我的机会，导致“多数人成为少数人的陪跑”。
• 素质教育改革口号与现实背离：提出越多，反而应试越严重，暴露出制度设计与执行之间的巨大张力。
• “刷题思维”掩盖了教学功底的匮乏：真正优秀的教育者应当以少胜多、化繁为简，而不是数量堆砌。
🚀 三、解决之道与个人思考
• 人生智慧在于扬长避短：不是靠“死磕短板”换来尊严，而是选择适合自己的土壤生长。
• 探索热爱与擅长的交集：天赋提供正反馈，热爱赋予抗挫力，二者结合才是持续成长的根基。
• 教育应回归育人本质：发现人的独特性，而非塑造流水线标准品，是未来教育的真正使命。

找到自己想认真打磨的事情比什么都重要

本篇文章推荐了 7多款我亲测高效、值得长期使用的工具，覆盖笔记整理、文件检索、翻译、截图、PDF 阅读、电子书阅读与AI辅助总结等多个维度：
1. Notion：跨平台笔记管理神器，云同步、不卡顿，适合做系统性知识整理。
2. Everything：超快的本地文件搜索工具，效率远胜系统自带搜索。
3. 有道翻译：不仅支持划词、截图翻译，还具备出色的OCR功能，适合重度阅读场景。
4. Snipaste：可将截图“钉”在屏幕上，是阅读论文、比对公式的绝佳利器。
5. UPDF：PDF阅读+批注+云同步，阅读论文与做读书笔记两不误。
6. NeatReader：epub 电子书阅读好帮手，简洁无广告，支持批注。
7. Glarity：基于 ChatGPT 的网页内容总结工具，可快速提取 YouTube 视频、网页、PDF 的关键信息，还能辅助翻译和提问。

个人认为好用值得分享的插件、APPs（PC）

这是一篇关于成长与意义的随笔。它反思了内卷与奔跑的代价，提醒我们别只盯着终点，而要学会在途中停下脚步，看一次风景，留一寸柔软，保有情感与温度。成长，不只是速度与曲线，更是过程与感受。

在终点之前，请先活一次

过度在意他人只会让自己困在无形的枷锁里。人生不是唯一解的数学题，而是充满可能的 NP 难题。努力重要，但更重要的是扬长避短，找到属于自己的道路，去消除那些所谓的“负面效果”。

少有人不可替代：从自我困境到突破之路

这本书由前华尔街数据科学家 Cathy O’Neil 撰写，通过多个社会领域（教育、招聘、信贷、司法等）的真实案例，揭示了黑箱算法模型如何在无形中加剧社会不平等，并进一步侵蚀民主制度。
作者提出“WMD（Weapons of Math Destruction）”概念，指那些具备三大特征的算法系统：
• 不透明（Opacity）
• 影响广泛（Scale）
• 破坏性反馈循环（Damage）
这些系统往往将人类的偏见深深地嵌入模型中，对弱势群体的打击尤为严重，使穷人越穷、富人越富，形成数据歧视的死循环。

Weapons of Math Destruction 阅读笔记

在最近的对话中，Hinton教授和Ben Mann都提出了关于软件工程师未来角色的重要观点，认为随着人工智能的迅速发展，软件工程师这一职业可能不会像医生、法官或会计那样持久存在。

软件工程师大概率是个过渡职业

本视频采访了Anthropic的联合创始人Ben Mann，讨论了多项关于人工智能（AI）及其安全性、经济影响的议题。Ben提到，超智能（AGI）可能在2028年左右实现，而AI的进步并没有减缓，反而加速了。他离开OpenAI创立Anthropic的原因是觉得在OpenAI中AI安全问题没有得到足够重视，尤其是在超智能的对齐问题上。Ben分享了自己对AI带来失业率上升、经济结构变化的看法，并指出AI将重塑社会及职场，并对未来的人类角色提出了重要的思考。他还提供了未来AI时代中如何应对职业变动的建议，强调“使用工具”的重要性，并关注对孩子的教育，特别是好奇心和创造力的培养。
Highlights
• 🤖 超智能的到来： Ben预计超智能（AGI）将在2028年左右到来，超智能的对齐问题至关重要，可能会影响整个人类社会。
• 🔍 离开OpenAI的原因： Ben与团队离开OpenAI是因为认为AI安全未得到充分重视，尤其是如何“把上帝关进盒子”这一超智能控制问题。
• 📉 AI对就业的影响： AI的发展可能会导致失业率上升，尤其是低技能职位会遭到取代。社会需要应对这些变化，并提前规划过渡期。
• 📈 AI加速进步： Ben强调AI的进步没有减缓，模型发布频率逐渐加快，每月或每季度更新一次，而不是像过去那样一年一次。
• 💼 AI与工作： 他提出“经济图灵测试”的概念，表示AI如果能取代一定比例的工作，将对全球经济产生深远影响。
• 🧑‍💻 未来职业建议： Ben建议使用AI工具的能力至关重要，尤其是能够灵活调整与AI交互方式，提高工作效率和创造力。
• 👶 教育与未来： 对孩子的教育需要强调好奇心、创造力和善良，这些素质将帮助他们在未来的AI时代中获得成功。

Anthropic co-founder: AGI predictions, leaving OpenAI, what keeps him up at night | Ben Mann

Agent 认知

我渐渐明白，并不是所有热闹都有意义。
当人群开始复制彼此的姿势、语言和节奏时，宁静与真诚就悄然消失了。
这篇文章是一次关于“判断力”的反思：学会辨别，哪些地方值得去，哪些地方该避开。

为什么我不再去人多的地方扎堆

1. AI的潜力与风险：Hinton教授对人工智能未来的发展提出了深刻的见解，并警告了AI可能带来的威胁。
2. AI与人类智能的对比：他探讨了AI能否超越人类智慧，以及超人工智能的可能性。
3. 人工智能在各个领域的应用：包括AI如何影响未来的职业、就业以及全球经济格局。

Hinton采访 24.6.27

这篇文章探讨了现代社会中审美与实际实力的双重影响。文章深入分析了一个人展现个人风格和品味的能力，不仅仅是对美的欣赏，更是其内在能力和资源的体现。文章还探讨了外部形象在全球化背景下，如何帮助个人或文化保持独特性，并通过鲜明的特征来与他者区分开。核心观点强调，审美通常被视为表面上的东西，但实际上，它是个人内在力量和社会地位的深刻象征。

展现审美与实力：外在与内在的双重映射

本文系统总结了高效学习的核心要素：
1. 目标：用 SMART 原则制定清晰、可衡量、可实现的学习目标。
2. 方法：结合费曼学习法、刻意练习和“输入–内化–输出”循环，把知识转化为技能。
3. 时间：通过番茄工作法、GTD、时间切块，专注并高效利用学习时间。
4. 心态：保持成长型思维，接纳失败，持续好奇与探索。
同时，推荐了学习资源（Coursera、edX、B站、YouTube）、知识管理工具（印象笔记、Anki）、以及 AI 工具（ChatGPT、Claude、Perplexity），强调了学以致用与及时输出的重要性：把所学知识应用到项目、写作和分享中，并通过复盘和奖励机制维持长期动力。

如何高效学习

在悉尼的交换学期，我遇见了一位几乎“完美”的同学。他外表出众、性格谦逊，深受大家喜爱，却始终保持着一层距离。与他相处的日子，我既感到不真实，也在潜移默化中模仿了他的生活方式：护肤、健身、饮食清淡……直到有一天，我开始怀疑自己：这还是我吗？这篇文章记录了那段经历，以及我对“真实与不真实”的思考。

那个看似完美的同学，和我渐渐改变的生活

这篇笔记围绕 FBI 顶级探员的“识人术”展开，核心观点是 信任=可预测性。判断一个人是否值得信赖，不在于他是否“好人”，而在于能否预测其行为。文中提出六大信号——利益捆绑、长期意愿、可靠性、行为模式、沟通方式、情绪稳定——作为识人的系统方法。同时揭示“残酷真相”：人性善变、直觉靠不住、外表浮云、能力常被高估。最终强调，真正的识人之道在于基于事实和数据的理性分析，并辅以 Stempathy（坚忍+共情） 的心态，以此提高预测准确率，建立稳固信任关系。

FBI顶级探员的终极识人术

1. 🎯 期待的边界：不要把爱变成交换
• 父母的爱若附带“成才”的前提，本质上是一种情感绑架；
• 真正健康的亲子关系，应是无条件的接纳与支持；
• 孩子最需要的，不是“我要变好，才能被爱”，而是“我就是我，就值得被爱”。
2. 💞 爱的逻辑：双向奔赴，非功利对价
• 爱应是一种自发的情感流动，而非条件式的投入与回报；
• 如果孩子从小被教育“有用才被爱”，长大后也可能以同样标准对待父母；
• 这种条件式爱的逻辑若代际传递，将在家庭中形成隐形伤害与冷漠。
3. 🧠 价值感的建立：存在本身即有价值
• 真正的价值感源于被纯粹地接纳与理解；
• 当孩子的存在本身就能被肯定，他们更容易成长出自信、安全、主动的心灵结构；
• 父母的接纳，是孩子形成内在稳定的最重要起点。
4. 📉 时间的真相：因果的轮回与代际延续
• 若爱是带条件的，那么当父母老去失去“价值”时，也可能被忽视甚至被嫌弃；
• 这不是子女冷血，而是从小就内化了“爱需交换”的教育逻辑；
• 打破这种代际因果的唯一方式是：从当下给予真正无条件的爱。
5. 🧭 教育的本质：做园丁，而不是雕塑家
• 真正的教育应是顺性而育、因材施教；
• 孩子如花，各有花期，不能统一时间开放；
• 父母的职责不是塑造孩子的模样，而是营造适合孩子自由生长的土壤。

关于父母期待与孩子成长的深度思考

个人项目经历汇总

程序员职业困境：程序员“工作前苦、工作后更苦”，不仅学习阶段压力大、生活单调，入职后还容易陷入高强度、低回报、易被替代的现实困境。专业特性与行业变化：计算机是“现形”专业，真实能力很难掩饰，业态变化快，很多早期积累很快就会被淘汰；相比之下，其他工科实际工作时对专业能力要求反而不高。
AI冲击与行业升级：AI的飞速发展，已经让大量基础性代码工作被自动化，企业只需要少数能攻克难题的高端人才。入门门槛低、提升空间有限的岗位将被大规模替代。
个人建议与应对策略：在AI时代，最核心的竞争力，是认清自己的天赋与热爱，及时复盘，避免无意义的重复劳动。只有不断深挖、打造差异化，或者真心热爱并能坚持深耕的人，才能在变局中立于不败。

AI取代潮来袭，普通程序员如何自救？一位实习生的真实反思

在这个信息爆炸、内容泛滥的时代，信息获取已不是稀缺能力，信息内化才是关键竞争力。
本篇文章系统梳理了“信息”与“知识”之间的本质区别，核心观点包括：
• 信息是流动的、外在的，知识是结构化的、内化的；
• 信息可以传递，知识只能通过个人思考、实践、反复验证形成；
• 知识的力量不在于量的累积，而在于它能建立认知地图，带来框架性理解；
• 泛信息化环境下的“伪学习”正加剧我们的焦虑，而非真正带来成长。
通过俄语教学中的语义细节、编程知识的应用场景，以及“Docker”的认知模型，你将清晰看到——只有当信息能在我们已有知识体系中找到“位置”，产生预测、推理、判断和整合的能力，它才有资格被称为知识。未来的信息将免费泛滥，但真正稀缺的，是能把信息转化为知识的能力。

知识与信息的区别

本文聚焦 AI 革命带来的就业冲击。Anthropic CEO Dario Amodei 警告：未来 1–5 年，AI 或将消灭一半入门级白领岗位，失业率可能飙升至 10%–20%。这场技术浪潮与前三次工业革命不同，AI 不再只是工具，而是能直接替代人类智力劳动的“劳动力本身”。
面对挑战，UBI（全民基本收入）被寄予厚望，但在大国几乎难以实现。文章指出，未来的唯一出路是摆脱“牛马思维”，依靠创造力、洞察力和创新来破局。然而，二八定律将继续生效，80% 的人可能在新秩序中被边缘化。
结论：AI 革命不仅是技术转折，更是人类文明的自我重塑。唯有主动适应、不断重塑的人，才能在巨变中找到生存与发展的空间。

白领大屠杀 Behind the Curtain: A white-collar bloodbath

这篇文章围绕一个核心命题展开——知识的效用，不在于多，而在于是否贴合你的方向。主要观点如下：
• 知识的实用性是相对的：若你早早明确了人生方向，继续无目的地广泛涉猎知识，边际效用将迅速递减；反之，在方向未明之前，多元探索有助于拓宽认知边界。
• 真正需要的技能，生活会逼你掌握：不掌握“常识”并非原罪，若知识确实对生活构成必要性，个体自然会主动或被动习得。
• 有效学习的前提是清晰的志向：当人生方向确定后，围绕该目标构建知识体系，你将更高效、更有动力地精进。
• 认清方向，比学习更多知识更重要：真正的难题不是“学什么”，而是“你想成为什么样的人”，后者才是驱动知识转化为价值的引擎。

关于知识价值与人生道路的思考

我想起她在书中那句（轻轻改写自她的语气）：“如果世界不再温柔，那就由我们去练习温柔。”
或许，这正是“老派”的真意。
不是落伍，而是一种姿态——
在所有崩塌的关系、碎裂的理想和变形的爱里，
仍然愿意相信：温柔，是必要的。

世界并不非黑即白：读李维菁，想到爱与文艺之人的痛

1. 社会不平等的哲学基础与现实逻辑
• 绝对平等不可持续：从热力学到社会学，能量或资源的绝对平均将导致系统“死亡”。宇宙需要温差，社会需要差异。
• 不平等是常态：社会不可能完全平等。适度不平等激发效率与创造；过度不平等则带来矛盾、冲突甚至动荡。
• 平衡的关键：既要激励有能力的人，也要给予弱势群体希望。合理的不平等可以维持秩序和活力。
2. 阶级划分与社会分层的差异
• 阶级划分强调的是人与人之间在生产关系上的根本对立，比如是否拥有生产资料，往往伴随压迫性和斗争逻辑。
• 社会分层更侧重资源和机会的不均衡分布，是一种等级性但不一定对抗性的结构，如上层/中产/底层等。
• 前者用于批判与变革，后者用于描述与维稳。
3. 韦伯的三重分层标准
• 经济地位：取决于市场机会（如收入、资本、职业技能），影响个人资源获取能力；
• 社会地位：体现为声望和生活方式（如消费品味、文化喜好、交际圈层等），强调社会认同；
• 政治权力：影响他人行为的能力，常通过组织控制实现（如政府、军队、党派等）。
• 韦伯认为一个人社会地位的认同感与生活方式密切相关，地位群体有较强的自我边界与婚姻内循环。
4. 农民与底层群体的社会结构现实

中国当代社会阶层分析 杨继绳 梁晓声

这篇文章指出“努力教”的陷阱：单纯的拼命并不会带来理想结果，反而让人陷入“越努力越窘迫”的循环。真正高效的方法不是死磕，而是少但更好、化繁为简、找到关键点，并通过正向飞轮习惯与反向思考工具，让行动变得轻松自然。最终的目标是举重若轻，用最小的力气撬动最大的成果。

放弃"努力教"！让你事半功倍的《毫不费力》心法

《卓越》是吴军对个人成长与成功的深入探讨，结合了他丰富的经验与对未来的深刻理解。在这篇文章中，吴军阐述了在复杂多变的现代社会中，如何通过不断提升自身的能力，去追求卓越，进而实现个人的长期目标和价值。

《卓越》吴军

文章通过瓦格纳的书展开，强调 “景观思维” 对复杂问题的启示。作者认为，生命进化、创新与解题的本质都是在“适合度景观”中不断探索。我们要敢于跳出局部最优，升维思考，并拥抱发散与探索的过程。AI 时代更应聚焦于“解决问题”这一核心目标，把人类与机器各自的优势结合起来。最终，突破来源于 多样性、宽容失败、探索与选择的平衡。

《如何解决复杂问题》

本篇从《道德经》第一、二章出发，重新探讨“道”的本质与“无为”的智慧。
第一章揭示“有”与“无”的辩证关系——无名为本，有名为用，并延伸至爱情：“名”使爱有形，“无名”使爱有魂。
第二章阐述对立共生之理与“无为而治”的境界，指出真正的力量在于顺势而动，而非强争逞力。
文章结合现代语境，讨论“放下”与“竞争”的分寸，提出判断执念与顺势的实践方法：
在行动中不逆势，在竞争中不乱心，在得失中不失衡。

再读道德经 一二章

“无为”不是退缩，而是清醒。老子教我们的，是不被欲望驱使、不被焦虑裹挟，在纷扰中保持清明与节制。真正的智慧，不是多做，而是不乱做。

无为，不是不做，而是不乱做

这篇讨论“深度思考=还原事实真相”的方法论：先跳出当下与执念，拒绝灌输与情绪绑架，以“虚其心、实其腹”为准绳；警惕道德/情绪/偏好三大思维陷阱，并用“意志、趋势、时机、资源、运筹”五维框架看问题，做更稳更准的决策。

深度思考简单来说就是还原事件原貌的能力

本文通过对《艰难时代》《Not a Nickel to Spare》《The World in Depression》等经典书籍的阅读，深入挖掘了美国大萧条时期的爱情与社会现实，并由此引发对当代中国年轻人处境的深刻反思。在近百年前的经济灾难中，爱情不再是浪漫的选择，而是生存的权宜之计。而这，正与当下年轻人面对经济焦虑、亲密关系压力的现实悄然共鸣。
文章共分三大主题板块：
1. 历史的倒影：昨天的他们，今天的我们
    ◦ 经济不安全感如何动摇婚姻基础
    ◦ 恋爱从消费主义回归朴素
    ◦ 被心力透支的年轻人不再有余力维系情感
2. 跨时空共振下的爱情困境
    ◦ 你会发现：哪怕时代不同，但在不确定中挣扎的年轻人，面对爱情时的犹疑与脆弱竟惊人相似。
3. 深层发问：爱，是否成了一种奢侈？
    ◦ 面对就业焦虑、情绪透支、关系冷漠，我们还能相信爱吗？
    ◦ 如何在现实的压力与残酷中，重新学习去爱、去连接、去共情？
这不是一篇简单的历史随笔，而是一场关于经济周期下人性情感波动的当代表达，是一种试图在历史与现实之间，重建“温柔的价值观”的尝试。“不是绝望的共鸣，而是希望的传承。”

大萧条期间人们的感情状态

留学后更清晰地看到人与人之间的差距并非单一维度，而是阶级、资源与视野共同构成的立体鸿沟。许多成就看似靠努力，实则顺水推舟源于出身与资源。真正的清醒在于认清自己的位置，发挥可控优势，全力以赴完成属于自己的“人生任务”，而不是沉溺于平等幻象。

留学后才明白，人与人之间的差距是立体的

我们常以为关系的核心是信任或陪伴，但真正支撑人际连接的，是那份让人放下防御的安全感，以及让灵魂有共振的共鸣感。前者让人敢靠近，后者让人想留下。

安全感与共鸣感：关系的两根底线

自然选择和进化常常让物种停留在“局部最优”，最终因环境变化而被淘汰。局部最优陷阱不仅存在于生物进化，也存在于数据科学与现实生活：过度专注、短视追求眼前优势，可能错失更高的峰值。真正的智慧在于跳出局部限制，保持创造性与开放性，避免因过度“完美”而丧失长远生机。

大量的人失败在陷入局部最优解

这是一则来自某港口的真实案例：一位老师用嵌入式技术提出“在龙门吊上加装压力传感器”的方案，试图优化集装箱称重流程——低成本、高效率、可快速落地。
然而，方案被迅速否决，原因并不在技术，而在触碰了隐藏的利益链条：传统繁琐的称重流程中暗藏“油水”，优化流程意味着断了某些人的财路。
由此引出的反思令人深思：
• ✅ 技术本身不是瓶颈，真正的障碍在于既得利益的守旧心态与落后的治理机制。
• ⚠️ 若监管体系与思想观念不先行，即使技术再先进，也难以撬动变革。
• 🧠 真正推动社会进步的，不是盯着几平米地皮的蝇头小利，而是解放思想、释放创造力。“思想解放才是真正的第一生产力。”

技术创新要落地，必须先突破体制与认知的藩篱。

制度不变，技术再好也是空谈

在全球经济波动与教育投资理性回归的背景下，澳新留学市场正在发生结构性变化：
🦘 澳大利亚：名校热度不减，成本高压持续上升
• 留学目标高度集中在“澳洲前三”（墨尔本大学、悉尼大学、新南），其他学校吸引力下降。
• 学费年年上涨，生活成本高昂，硕士两年总开销普遍在110万人民币以上，引发家庭预算压力。
• “卡着预算”留学容易导致社交断层与体验感缺失，建议量力而行，重视隐性成本。
🇲🇾 马来西亚：性价比新贵，成为留学优选
• 莫纳什等高校分校申请量暴增5倍，验证“性价比+英语环境”策略奏效。
• 日常开销远低于国内中等城市，“留学幸福感”明显提升。
• 适合预算有限但希望获得国际教育背景的学生，逐渐成为“双非+中产”群体的新解法。
🧩 留学与移民：阶层逻辑的现实投射
• 留学不再是“精英”专属，而是“中产平民化”的趋势延伸。
• 移民政策背后隐藏的是阶层筛选机制：早期政策窗口期已关闭，当前更考验家庭认知与财力的双重实力。
• 教育投资的时效性与策略性变得尤为关键，延迟认知者面临更高门槛与更低性价比。

澳新留学成本攀升，马来西亚成新兴热门选择

我写下这些，是因为常在无形的内卷中问自己：我到底在为了什么？
一路追求成绩、履历、头衔，收获了认可，却也错过了许多不可复刻的瞬间。成长不该只是数字的攀升，还该允许自己在赶路时停一停，看一次风景，保留一寸不算的善意。
我始终相信，人是情感的动物，科技和进步的意义，是让我们回到本真与渴望。对我来说，成长是向上、向内、向外并行的旅程——在到达终点前，把沿途活得有温度、有余香。

人不是理性的产物，而是情感的动物

本文探讨了人类思维的局限与改进路径。作者指出，大脑的快速决策机制虽有进化优势，却在现代环境中易导致逻辑谬误、错误关联和自然主义偏见。同时，记忆并非客观记录，而是易受情绪、文化和时间影响的重构过程。
为应对这些系统性缺陷，文章强调批判性思维的可训练性，并提出七步实践指南：检查假设、检验逻辑、意识动机、推演含义、与他人核实、保持谦虚、接受不确定性。核心理念在于借助科学怀疑主义和可证伪性原则，建立起“心智免疫系统”，抵御谣言与错误信息。
最终结论是：理性思维的培养需要持续练习与自我修正，保持开放、谦逊和探索的态度，才能在复杂社会中做出更明智的判断。

学会科学怀疑

本文探讨了 AI 在创意工作中的机遇与风险。AI 的“幻觉”源于概率预测机制、随机性设计和混杂训练数据，这在事实严谨领域可能导致严重错误，但在创意生成中却成为优势。AI 能快速连接看似无关的概念，在创意竞赛与心理学测试中展现出超越人类的发散能力。

然而，AI 并不是人类创意的终结，而是其“民主化与重构”。未来的核心竞争力将从“亲自创作”转向“提出高质量问题与筛选结果”。人类需要发挥独特的品味、知识深度和批判性思维，既能引导 AI 发散，又能作为最终过滤器，筛选并深化输出。

如何用AI做创意性工作？沃顿商学院教授分享技巧

本文围绕学习、失败与行动三个主题展开，提出了几点关键洞见：
1. 失败的原因各不相同，但成功有其共通规律

借用托尔斯泰的名言“幸福的家庭都是相似的，而不幸的家庭各有各的不幸”，作者强调失败的路径可能千差万别，而成功却往往遵循一些共同原则。因此，与其过度研究失败，不如更专注于学习成功的经验并加以复制。
2. 行动不必等待

如果你打算用十年来完成一件事，应当思考能否在六个月内实现。长期计划往往隐藏着拖延和不必要的等待，真正的突破来自于立即行动和压缩实现路径。
3. 失败并非最佳导师

与流行的“从失败中学习”不同，文章认为失败带来的更多是挫败和破坏性，而非真正的成长。每一次企业倒闭都是一场悲剧，远不如从成功案例中提炼出规律更有价值。
4. 学习的核心是创造价值

学习与教育的差别在于：教育是外在的系统安排，而学习是个人的主动探索。真正有价值的学习，往往集中在最困难、最具挑战性的部分，因为创造价值永远伴随着难度。
结论：不要沉溺于失败，不要等待理想的时机，也不要把学习停留在表面。唯有直面挑战、模仿成功并在行动中创造价值，才能在不确定的未来中立于主动。

失败不是失败之母，成功才是

本文以《策略思维》第一章“十个策略故事”为切入点，介绍了策略思维的核心理念。通过商业、政治、体育、生活等案例，作者强调：在互动环境中，每个人都在预测对方的预测，并据此采取行动。
核心要点包括：
1. 预判与反预判 —— 换位思考，多层次博弈。
2. 向前展望，向后推理 —— 聚焦最终目标，从结果倒推每一步选择。
3. 互动的连锁效应 —— 行动会引发对手反应，再反馈到自己。
4. 相对位置与风险承担 —— 领先者偏保守，落后者更敢冒险。
5. 承诺与可信度 —— 展现“无退路”可迫使对方妥协，但需权衡风险。
6. 自我承诺装置 —— 利用机制约束未来的自己，克服短期诱惑。
7. 博弈结构设计 —— 改变规则与激励，重塑均衡。
8. 混合策略（随机化） —— 保持不可预测性，避免被对手利用。
9. 信息不对称 —— 从对方行为推断隐藏信息，防范“赢家的诅咒”。
10. 人性与情境因素 —— 理性需结合情感、文化与尊严，避免过度抽象化。
结论：策略思维并非只属于企业或政治博弈，而是一种普适的认知工具。它帮助我们在日常生活、职场和重大决策中更清晰地看待互动关系、权衡行动后果，并做出更高效的选择。但同时要警惕过度理性，学会结合人性和现实情境灵活运用。

策略思维入门 《战略的艺术》

大模型输出不确定性并非仅因“浮点运算+并发”，而是核心算子缺乏 batch invariance：不同批次大小会改变归约/并行策略，进而影响解码路径。通过让 RMSNorm、Matmul、Attention 等关键 kernel 保持批次不变性，可以实现温度 0 下的完全可复现推理。这意味着：在创意生成中，不确定性是有意的；在金融、医疗等场景，则可通过 batch-invariant kernel 获得稳定确定的结果。

大模型为什么输出有不确定问题，如何解决？

当代爱情：在欲望森林里迷路的人们

盛溪的博客 | Notion

password

icon

date

type

slug

status

title

summary

AI summary

Table

Post Gallery

Post Board

Config

类型为Notice的文章将被显示为公告

公告

单页不会显示在博客列表，会在导航添加一个菜单。

友链

Github

可用链接/about访问，不会在菜单栏显示

关于

首页

搜索

友情链接

往期整理

历史归档

文章分类

文章标签

关于我

个人描述

English

大模型

文字

思考

个人能力矩阵

🧪 一、大模型常用评估数据集
🔍 1. MMLU (Massive Multitask Language Understanding)
• 类型：英文多任务通用评估集
• 内容：57门学科（数学、法律、医学、历史等）
• 应用场景：零样本（Zero-shot）或少样本（Few-shot）设置下对模型多学科知识与推理能力进行测试
• 开发者：Dan Hendrycks 等（2020）
• 来源：各类学术测试、资格考试题库
• 参考：MMLU 数据集知乎解读
🔢 2. GSM8K（Grade School Math 8K）
• 类型：数学推理能力评估集
• 内容：8,500道小学水平的数学题
• 目标：测试语言模型的“算术推理”能力
• 应用：SOTA 算法排行榜参考：GSM8K Benchmark
📚 3. 中文评测数据集
• CEval：多领域中文测评集
• CMMLU：中文版的MMLU，覆盖法律、医学等高难度题目
• Gaokao：模拟高考题，注重逻辑推理和语言理解能力

评测数据集

🧠 AI 产品经理系统学习路径：三阶段进阶模型
📌 第一阶段：线性理解，全面扫盲
• 目标：建立对 AI 产品经理工作的整体认知框架
• 方式：跟随专栏完整学习，从产品定义到模型训练、评估全流程过一遍
• 意义：查缺补漏、搭建完整地图，便于未来定位问题、解决实际挑战
📌 第二阶段：结构化吸收，构建知识网络
• 目标：从知识点跃迁到知识体系，形成自己对 AI 产品的认知结构
• 方式：将学过的每个模块（如模型评估、特征工程、PRD撰写）抽象整合，构建知识树
• 关键词：提炼框架、高屋建瓴、体系感、知识联通
📌 第三阶段：批判性思维，形成底层 AI 思维
• 目标：构建自己的 AI 思维方法论，形成独立判断力
• 方式：批判性吸收已有知识，带着怀疑去理解每个技术方案、指标选取、建模路径
• 最终产出：不仅能用AI，还能“驾驭”AI，形成决策思维与底层判断逻辑

刘海丰 AI产品经理 01-04

开发

产品

产品经理的需求文档应该做到以下四点：
明确业务目标、输出形式、数据来源和验收标准

PRD 文档应该长什么样

🧠 Summary：掌握AI产品经理的全流程方法论
1️⃣ 产品定义阶段：明确AI价值定位
• 三问核心：是否有明确的业务问题？是否需要AI介入？AI能实现怎样的业务目标？
• 关键能力：懂得和业务方深度沟通，拆解“表层需求”挖掘“可AI化”的本质诉求。
2️⃣ 数据准备与特征工程：产品经理要深入介入
• 数据来源分三类：内部业务数据、跨部门集团数据、外部采购数据，获取方式各异。
• 特征工程是核心工作：特征决定模型上限，包括数值型、描述型、非结构化、关系型特征等。
• 数据清洗不可忽视：需处理缺失值、异常值、噪声，并用可视化手段洞察数据结构。
3️⃣ 模型构建流程：知其然，也要知其所以然
• 流程五步走：设计目标 → 数据预处理 → 模型训练 → 验证评估 → 模型融合
• 产品经理需掌握流程，即便不参与建模，也能有效与算法团队协同，评估进度与瓶颈。
• 核心术语：目标变量、样本构建、决策边界、过拟合/欠拟合、交叉验证等。
4️⃣ 模型评估与性能优化：拒绝“只交付不负责”
• 模型不是交付就结束，PM需参与指标设定与调优。
• 分类任务常用指标：AUC、KS、Recall；回归任务：MSE、MAE等。
• 产品经理要主导“验收定义”：不仅要模型“对”，还要业务“值”。
5️⃣ 核心算法扫盲：为落地服务，而非深入研究
• KNN：易实现，适合小数据场景，容错性低。
• 决策树/随机森林：强可解释性，易过拟合，集成学习（Bagging/Boosting）提升稳定性。
• 深度学习：结构复杂但性能最强，关键是“权重 + 偏置”最小化Loss函数。
• 特征表达重要性：从文本中抽取“词向量”、非结构化信息转结构化是关键任务。

刘海丰 AI产品经理 05-16

1️⃣ 产品定义阶段：理解业务与明确目标
• 核心任务：
    ◦ 搞清楚业务需求是否真的需要 AI 解决
    ◦ 明确AI能为业务带来哪些可量化的提升
    ◦ 与业务方确认预期目标、上线时间、使用场景
2️⃣ 技术预研阶段：与算法团队协同评估可行性
• 关键协作：
    ◦ 与算法团队初步沟通，判断现有数据/算法能力能否支撑需求
    ◦ 若不足，产品经理需主导或协助数据获取（尤其在垂类业务中，PM比算法更懂数据）
• 注意事项：
    ◦ 不只是评估算法可行性，更要结合数据完整性与代表性判断“能不能训出有效模型”

模型设计 

🧠 AI产品经理 vs 普通产品经理的本质区别
1. 工作目标不同
普通产品经理的目标是打造用户可感知的功能，提升用户体验，比如做一个清晰、易用的投诉入口。
AI产品经理则以构建“算法能力”为目标，提升系统的智能化或自动化水平，比如设计一个“用户投诉预测模型”，提前识别潜在问题并自动触发工单系统。
2. 工作流程不同
普通产品经理主要聚焦于功能设计、交互逻辑、业务流程，与用户体验密切相关。而AI产品经理则必须深入参与从数据采集、特征设计到模型评估、上线集成的全过程。
AI PM需要定义采集哪些数据、数据如何打标签、样本如何构造、模型好坏怎么评估（如AUC、KS等），以及模型上线后的持续优化和微调，这些环节普通PM通常不涉及。

AI产品经理与传统产品经理区别

1. 技术成长与职场初体验
• 在导师们（强哥、唐哥、刘工）的耐心指导下，解决了多个技术难题，全面了解了企业项目流程与会议机制。
• 技术之外，更深入理解了职场氛围与团队合作的价值。
2. 从代码到用户：需求理解的觉醒
• PDA页面设计中意识到：“技术实现”不能替代“场景理解”。
• 移植PC页面时忽略了使用者（工人）实际操作的便捷性需求——这成为一次重要的产品思维转折点。
3. 生涯启蒙：寻找内在驱动力
• 多位前辈没有直接给出“职业路径”，而是启发思考“你真正想成为什么样的人”。
• 明白了职业规划不应是盲从潮流，而是顺应自我兴趣与长期动力。
4. AI时代下的职业反思
• 程序员工作高薪但缺乏社会影响力，与警务、法律等职业相比，在“社会关系建构”上较为薄弱。
• 技术变革（Coding 3.0、AI辅助开发）进一步削弱了底层程序员的存在感。
5. 坚定的方向：走向AI产品经理之路
• 实习加深了对AI趋势与岗位生态的理解，AI产品经理结合了技术趋势与社会沟通双重优势。
• 希望未来从事具有技术前沿性与人际交互性的工作。
6. 温情时刻：感谢每一份关怀
• 感恩同事们在实习期间给予的耐心、温暖与支持。
• 特别铭记生日那天的蛋糕、一次次悉心的指导与分享。