WEEKLY DIGEST · 2026-W17
本周精选
2026 年 4 月 20–26 日
本周概览
TOP 10 · BY OVERALL SCORE本周必读
按 AI 总评分排序
DeepSeek V4:接近前沿水平,价格仅为十分之一DeepSeek V4 - almost on the frontier, a fraction of the price
中国AI实验室DeepSeek发布了备受期待的V4系列模型中的两个预览版——DeepSeek-V4-Pro和DeepSeek-V4-Flash。这两个模型均支持100万token上下文长度,并采用混合专家(Mixture of Experts)架构。与上一代V3.2相比,V4在性能和成本效率上均有显著提升,Pro版本在复杂推理任务中表现接近顶级模型,而Flash版本则以更低延迟实现高吞吐量。DeepSeek表示其技术路线在保持高性能的同时大幅降低了训练与部署成本。
通过半官方 Codex 后门 API 获取 GPT-5.5 的 PelicanA pelican for GPT-5.5 via the semi-official Codex backdoor API
OpenAI 发布了 GPT-5.5,该模型已集成到 Codex 中并向付费 ChatGPT 用户逐步开放。作者通过预览体验发现其响应迅速、执行精准且能力强大。然而,此次发布未包含标准 API 访问方式,仅通过 Codex 间接可用。这表明 OpenAI 正尝试控制模型分发路径,限制直接 API 调用以维持生态主导权。
微软将把 GitHub Copilot 用户转向基于 Token 的计费模式并收紧速率限制Exclusive: Microsoft To Shift GitHub Copilot Users To Token-Based Billing, Tighten Rate Limits
微软计划暂停个人账号注册 GitHub Copilot,并过渡到基于 Token 的计费系统,取代原有的按请求次数计费模式。内部文件显示,自推出以来,GitHub Copilot 每周运行成本已翻倍。此举旨在优化资源使用并控制服务成本,同时可能影响用户的访问频率和支出结构。
GPT-5.5 提示词指南GPT-5.5 prompting guide
OpenAI 发布了针对 GPT-5.5 模型的官方提示工程指南,旨在帮助开发者更有效地使用该模型。文章重点介绍了如何通过结构化提示提升输出质量,并推荐了一种适用于需要长时间思考后再返回用户响应的应用场景的技巧:在提示中明确加入 'Before any' 前缀以引导模型进行深度推理。此外,该指南还强调了使用工具调用、系统消息和参数调优等高级技巧的重要性。作者指出,合理使用这些方法可以显著提升 GPT-5.5 在复杂任务中的表现。
多元主义:为‘功能退化’设计的免费开源视觉标识Pluralistic: A free, open visual identity for enshittification (24 Apr 2026)
本文提出了一个名为‘功能退化’(enshittification)的概念及其对应的视觉标识设计,旨在揭示数字平台如何逐渐牺牲用户体验以追求利润最大化。作者强调该标识是免费且开源的,可用于识别那些因商业策略而变得臃肿、低效或令人不满的服务。这一设计不仅是对当前互联网生态的批判工具,也鼓励社区共同参与对抗平台滥用权力的现象。
在 Chrome DevTools 中调试 WASM 代码Debugging WASM in Chrome DevTools
作者在将 Scheme 编译器编译为 WebAssembly(WASM)时遇到调试难题。Chrome DevTools 实际上具备强大的 WASM 调试功能,包括源码映射、断点设置和变量监控。文章详细介绍了如何利用 Source Map 将 WASM 指令与原始 Scheme 代码关联,实现逐行调试。这对使用 WASM 进行前端性能优化或复杂逻辑开发具有重要实践价值。
从零开始构建 LLM(第32部分):干预措施与指令微调结果更新Writing an LLM from scratch, part 32l -- Interventions: updated instruction fine-tuning results
作者基于 Sebastian Raschka 的《Build a Large Language Model (from Scratch)》一书,训练了一个类 GPT-2-small 模型,并通过多种干预手段提升其在测试集上的损失表现。实验包括指令微调等策略,目标是逼近 OpenAI GPT-2-small 的质量水平。
从零开始编写 LLM,第 32m 部分——干预措施:结论Writing an LLM from scratch, part 32m -- Interventions: conclusion
作者完成了《从零构建大型语言模型》一书的主要部分后,设定了训练完整 GPT-2 基础模型的后续目标。经过努力,他成功训练出一个在 44 小时内完成的模型,其性能几乎(如果不是完全)达到了 GPT-2 small 的水平。
AI 奥德赛,第四部分:令人惊叹的编码代理An AI Odyssey, Part 4: Astounding Coding Agents
去年夏天和去年十二月至一月期间,AI 编码代理的能力显著提升。作者主观感觉这些模型变得更聪明,能完成更广泛的任务,并对代码库有更全面深入的理解。这表明 AI 编程助手正在向更智能、更自主的方向发展。
llm 0.31 发布:新增 GPT-5.5 模型与动词度控制选项llm 0.31
Simon Willison 发布的 llm 0.31 版本正式集成了 OpenAI 最新的 GPT-5.5 模型,用户可通过 `llm -m gpt-5.5` 调用。同时新增了针对 GPT-5+ 系列模型的文本动词度参数设置功能(`-o verbosity low/medium/high`),允许开发者更精细地控制输出详细程度。此外还包括多项 bug 修复与性能优化。