💽评测数据集

🧪 一、大模型常用评估数据集 🔍 1. MMLU (Massive Multitask Language Understanding) • 类型:英文多任务通用评估集 • 内容:57门学科(数学、法律、医学、历史等) • 应用场景:零样本(Zero-shot)或少样本(Few-shot)设置下对模型多学科知识与推理能力进行测试 • 开发者:Dan Hendrycks 等(2020) • 来源:各类学术测试、资格考试题库 • 参考:MMLU 数据集知乎解读 🔢 2. GSM8K(Grade School Math 8K) • 类型:数学推理能力评估集 • 内容:8,500道小学水平的数学题 • 目标:测试语言模型的“算术推理”能力 • 应用:SOTA 算法排行榜参考:GSM8K Benchmark 📚 3. 中文评测数据集 • CEval:多领域中文测评集 • CMMLU:中文版的MMLU,覆盖法律、医学等高难度题目 • Gaokao:模拟高考题,注重逻辑推理和语言理解能力
评测数据集

📱个人认为好用值得分享的插件、APPs(PC)

本篇文章推荐了 7多款我亲测高效、值得长期使用的工具,覆盖笔记整理、文件检索、翻译、截图、PDF 阅读、电子书阅读与AI辅助总结等多个维度: 1. Notion:跨平台笔记管理神器,云同步、不卡顿,适合做系统性知识整理。 2. Everything:超快的本地文件搜索工具,效率远胜系统自带搜索。 3. 有道翻译:不仅支持划词、截图翻译,还具备出色的OCR功能,适合重度阅读场景。 4. Snipaste:可将截图“钉”在屏幕上,是阅读论文、比对公式的绝佳利器。 5. UPDF:PDF阅读+批注+云同步,阅读论文与做读书笔记两不误。 6. NeatReader:epub 电子书阅读好帮手,简洁无广告,支持批注。 7. Glarity:基于 ChatGPT 的网页内容总结工具,可快速提取 YouTube 视频、网页、PDF 的关键信息,还能辅助翻译和提问。
个人认为好用值得分享的插件、APPs(PC)

Lazy loaded image知识与信息的区别

在这个信息爆炸、内容泛滥的时代,信息获取已不是稀缺能力,信息内化才是关键竞争力。 本篇文章系统梳理了“信息”与“知识”之间的本质区别,核心观点包括: • 信息是流动的、外在的,知识是结构化的、内化的; • 信息可以传递,知识只能通过个人思考、实践、反复验证形成; • 知识的力量不在于量的累积,而在于它能建立认知地图,带来框架性理解; • 泛信息化环境下的“伪学习”正加剧我们的焦虑,而非真正带来成长。 通过俄语教学中的语义细节、编程知识的应用场景,以及“Docker”的认知模型,你将清晰看到——只有当信息能在我们已有知识体系中找到“位置”,产生预测、推理、判断和整合的能力,它才有资格被称为知识。未来的信息将免费泛滥,但真正稀缺的,是能把信息转化为知识的能力。
知识与信息的区别

Lazy loaded image对于人工智能时代的巨大思考————请你宽容

本文从“宽容”作为人类社会精神底座出发,延伸探讨了AI发展中的两个核心问题:价值对齐与算法偏见**。当AI逐渐获得接近乃至超越人类的智能时,我们必须重新思考,我们在数据中灌输的价值观,是否配得上我们期望未来机器所体现的理性与善意。 📌 主要内容概览: 1. AI系统若无法对齐人类价值,将面临灾难性风险 ◦ 引用Anthropic提出的三种可能路径:乐观、中性、悲观 ◦ 强调“技术对齐问题”的严峻性,尤其在AI智能接近或超越人类的情境下 2. 人类的偏见与仇恨正在污染训练数据 ◦ 大模型学习的是人类语言、行为和价值的集合体 ◦ 如果我们对“平凡人”“弱势群体”都缺乏宽容,最终塑造的AI也将对他们无情——而那最终会反噬我们自己 3. 数据偏见是结构性的、难以完全根除的 ◦ 介绍经典文献: ▪ 《A Survey on Bias and Fairness in Machine Learning》 ▪ 《Weapons of Math Destruction》 ◦ 深入讨论偏见的来源、反馈循环与应对策略 4. “信息”≠“知识”,偏见的批判与防范需要真正的深度认知 ◦ 仅靠“收集技术资料”远远不够,AI PM 和开发者需要形成独立的伦理判断力与系统性思维
对于人工智能时代的巨大思考————请你宽容

Lazy loaded image找到自己想认真打磨的事情比什么都重要

📌 一、核心观点概括 • 信息 ≠ 知识:信息只是“快照”,知识是经过深度理解与体系化构建的“内化产物”。真正的知识不能靠刷短视频获取,而要靠长期实践和认知构建。 • “努力万能论”是误导:教育常用“努力”来掩盖体制对记忆与逻辑的单一偏好,但真正的人才培养应走“扬长避短”之路,而不是一刀切地补短板。 • 教育的公平不在于平均,而在于差异化赋能:每个人应有公平的发展机会,但不必走相同的道路。真正的公平是根据天赋差异,提供不同的资源支持。 🎯 二、教育制度深层批判 • 当今考试制度强化记忆与逻辑推演,实际剥夺了学生探索自我的机会,导致“多数人成为少数人的陪跑”。 • 素质教育改革口号与现实背离:提出越多,反而应试越严重,暴露出制度设计与执行之间的巨大张力。 • “刷题思维”掩盖了教学功底的匮乏:真正优秀的教育者应当以少胜多、化繁为简,而不是数量堆砌。 🚀 三、解决之道与个人思考 • 人生智慧在于扬长避短:不是靠“死磕短板”换来尊严,而是选择适合自己的土壤生长。 • 探索热爱与擅长的交集:天赋提供正反馈,热爱赋予抗挫力,二者结合才是持续成长的根基。 • 教育应回归育人本质:发现人的独特性,而非塑造流水线标准品,是未来教育的真正使命。
找到自己想认真打磨的事情比什么都重要

Lazy loaded image关于父母期待与孩子成长的深度思考

1. 🎯 期待的边界:不要把爱变成交换 • 父母的爱若附带“成才”的前提,本质上是一种情感绑架; • 真正健康的亲子关系,应是无条件的接纳与支持; • 孩子最需要的,不是“我要变好,才能被爱”,而是“我就是我,就值得被爱”。 2. 💞 爱的逻辑:双向奔赴,非功利对价 • 爱应是一种自发的情感流动,而非条件式的投入与回报; • 如果孩子从小被教育“有用才被爱”,长大后也可能以同样标准对待父母; • 这种条件式爱的逻辑若代际传递,将在家庭中形成隐形伤害与冷漠。 3. 🧠 价值感的建立:存在本身即有价值 • 真正的价值感源于被纯粹地接纳与理解; • 当孩子的存在本身就能被肯定,他们更容易成长出自信、安全、主动的心灵结构; • 父母的接纳,是孩子形成内在稳定的最重要起点。 4. 📉 时间的真相:因果的轮回与代际延续 • 若爱是带条件的,那么当父母老去失去“价值”时,也可能被忽视甚至被嫌弃; • 这不是子女冷血,而是从小就内化了“爱需交换”的教育逻辑; • 打破这种代际因果的唯一方式是:从当下给予真正无条件的爱。 5. 🧭 教育的本质:做园丁,而不是雕塑家 • 真正的教育应是顺性而育、因材施教; • 孩子如花,各有花期,不能统一时间开放; • 父母的职责不是塑造孩子的模样,而是营造适合孩子自由生长的土壤。
关于父母期待与孩子成长的深度思考

Lazy loaded image大萧条期间人们的感情状态

本文通过对《艰难时代》《Not a Nickel to Spare》《The World in Depression》等经典书籍的阅读,深入挖掘了美国大萧条时期的爱情与社会现实,并由此引发对当代中国年轻人处境的深刻反思。在近百年前的经济灾难中,爱情不再是浪漫的选择,而是生存的权宜之计。而这,正与当下年轻人面对经济焦虑、亲密关系压力的现实悄然共鸣。 文章共分三大主题板块: 1. 历史的倒影:昨天的他们,今天的我们 ◦ 经济不安全感如何动摇婚姻基础 ◦ 恋爱从消费主义回归朴素 ◦ 被心力透支的年轻人不再有余力维系情感 2. 跨时空共振下的爱情困境 ◦ 你会发现:哪怕时代不同,但在不确定中挣扎的年轻人,面对爱情时的犹疑与脆弱竟惊人相似。 3. 深层发问:爱,是否成了一种奢侈? ◦ 面对就业焦虑、情绪透支、关系冷漠,我们还能相信爱吗? ◦ 如何在现实的压力与残酷中,重新学习去爱、去连接、去共情? 这不是一篇简单的历史随笔,而是一场关于经济周期下人性情感波动的当代表达,是一种试图在历史与现实之间,重建“温柔的价值观”的尝试。“不是绝望的共鸣,而是希望的传承。”
大萧条期间人们的感情状态

Lazy loaded imageWeapons of Math Destruction 阅读笔记

这本书由前华尔街数据科学家 Cathy O’Neil 撰写,通过多个社会领域(教育、招聘、信贷、司法等)的真实案例,揭示了黑箱算法模型如何在无形中加剧社会不平等,并进一步侵蚀民主制度。 作者提出“WMD(Weapons of Math Destruction)”概念,指那些具备三大特征的算法系统: • 不透明(Opacity) • 影响广泛(Scale) • 破坏性反馈循环(Damage) 这些系统往往将人类的偏见深深地嵌入模型中,对弱势群体的打击尤为严重,使穷人越穷、富人越富,形成数据歧视的死循环。
Weapons of Math Destruction 阅读笔记

📺AI取代潮来袭,普通程序员如何自救?一位实习生的真实反思

程序员职业困境:程序员“工作前苦、工作后更苦”,不仅学习阶段压力大、生活单调,入职后还容易陷入高强度、低回报、易被替代的现实困境。专业特性与行业变化:计算机是“现形”专业,真实能力很难掩饰,业态变化快,很多早期积累很快就会被淘汰;相比之下,其他工科实际工作时对专业能力要求反而不高。 AI冲击与行业升级:AI的飞速发展,已经让大量基础性代码工作被自动化,企业只需要少数能攻克难题的高端人才。入门门槛低、提升空间有限的岗位将被大规模替代。 个人建议与应对策略:在AI时代,最核心的竞争力,是认清自己的天赋与热爱,及时复盘,避免无意义的重复劳动。只有不断深挖、打造差异化,或者真心热爱并能坚持深耕的人,才能在变局中立于不败。
AI取代潮来袭,普通程序员如何自救?一位实习生的真实反思
软件工程师大概率是个过渡职业
盛溪
盛溪
盛溪的学习&生活博客
Announcement
🌟 欢迎来到盛溪的博客!🌟
大家好,我是盛溪。在这里,我将分享我的生活感悟、学习心得以及其他一些有趣的发现。希望我的文章能为你的生活带来一点启发和乐趣。
📅 更新通知:
  • 我会定期更新博客,分享新的内容。你可以通过RSS订阅或关注我的社交媒体账号来及时获取更新通知。
💬 互动环节:
  • 如果你有任何问题或想法,欢迎在评论区留言。我非常期待与你的互动!
📚 推荐阅读:
  • 不定期推荐一些我觉得有价值的书籍或资源,希望能对你有所帮助。
感谢你的访问和支持,希望你能常来逛逛!
盛溪敬上