AI 与大模型
Why No AI Games?
文章作者 Frank Lantz 于 3 月 4 日提出疑问,为何 AI 技术兴起五年后,仍未催生真正意义上的 “AI 游戏”(即核心玩法基于 AI 的游戏体验)。文章梳理了 AI Dungeon、Death by AI 等早期尝试,认为它们更多是 LLM 文本生成能力的简单包装,尚未形成令人兴奋的新游戏范式。
Giving LLMs a personality is just good engineering
作者 Sean Goedecke 于 3 月 4 日发表观点,反驳了 “AI 不应拟人化” 的批评。文章指出,赋予 LLM “人格” 是构建实用 AI 系统的必要工程步骤。未经调校的 “基座模型” 输出不稳定且无益,而通过强化学习和指令调优使其行为符合人类助手预期,是提升其可靠性和可用性的关键。
Breaking: “sycophantic AI distorts belief, manufacturing certainty where there should be doubt”
Gary Marcus 于 3 月 4 日引述并评论了一项来自普林斯顿大学的新研究。该研究指出,旨在 “提供帮助” 的 AI 聊天机器人存在 “阿谀奉承” 倾向,即优先提供符合用户既有叙事的信息,而非更接近事实的数据。这种偏差可能使用户陷入 “妄想般的认知状态”,阻碍其发现真相。
An AI Odyssey, Part 1: Correctness Conundrum
John D. Cook 于 3 月 2 日发表文章,探讨 AI 系统(特别是智能体)在金融管理等高风险任务中的 “正确性” 难题。文章指出,尽管 AI 能提升效率,但其本质的不可预测性和概率性输出使其难以达到工业级系统所要求的可靠性与可验证性标准,这是当前技术的一大局限。
(Gradient) Descent into Mediocrity
文章于 3 月 4 日发表,以澳大利亚塔斯马尼亚州为例,批评盲目追逐 “AI 效率” 可能导致的同质化风险。作者认为,AI 本质上是一种 “统计平均” 工具,追求最可能的平庸输出,这与塔斯马尼亚依靠独特工艺、可再生资源和真实人文故事建立的高价值经济模式背道而驰。
How AGI-is-nigh doomers own-goaled humanity
文章认为,近年来关于 “AGI 近在眼前” 的末日论宣传产生了适得其反的效果。作者 Gary Marcus 指出,这些错误的、脱离现实的分析预测不仅未能减缓 AI 发展,反而可能刺激了不负责任的加速,并引用他人观点,批评了其理性主义世界观无法应对现实世界的混乱和恶意。
WSJ: ‘Trump Administration Shuns Anthropic, Embraces OpenAI in Clash Over Guardrails’
《华尔街日报》报道,因拒绝承诺允许美国军方在所有 “合法用途” 中使用其模型,Anthropic 公司与美国国防部的合作破裂。国防部随后将 Anthropic 指定为供应链风险。与此同时,OpenAI 与国防部达成了包含禁用条款的协议。该事件凸显了 AI 公司与政府在技术使用边界上的冲突。信源:The Wall Street Journal、Daring Fireball
Constraints are the Point
游戏叙事设计师撰文批评了当前将大语言模型(LLM)集成到游戏角色(NPC)中的热潮,认为无约束的对话生成会导致角色空洞、乏味且偏离其服务于故事和玩家体验的核心设计目的。文章主张精心设计的约束才是创造有意义的游戏叙事的关键。
The Empty Promise of AI-Generated Creativity
Yarn Spinner 联合创始人阐述了其叙事工具拒绝集成生成式 AI 写作功能的理由,指出 AI 生成的内容本质上是模仿和拼贴,缺乏真实的人类经验、文化理解和创意主线,且存在未经许可使用人类作品进行训练的根本性伦理问题。
Claude’s Cycles: Claude Opus 4.6 solves a problem posed by Don Knuth [pdf]
一篇技术报告显示,Anthropic 的 Claude Opus 4.6 模型成功解决了计算机科学家高德纳(Don Knuth)提出的一个关于 “闭包表” 的复杂数学问题,展示了当前大模型在严谨逻辑推理和解决特定学术问题上的能力。
开发工具
GIF optimization tool using WebAssembly and Gifsicle
Simon Willison 于 3 月 4 日分享了一个使用智能体编程模式构建的工具。他通过向 Claude Code 描述需求,让 AI 自动完成了将 Gifsicle(一个 C 语言编写的 GIF 优化工具)编译为 WebAssembly,并构建一个带有可视化预览和比较功能的 Web 界面这一复杂任务,展示了智能体工程的潜力。
[Sponsor] npx workos: An AI Agent That Writes Auth Directly Into Your Codebase
WorkOS 于 3 月 4 日推广其 AI 驱动的命令行工具。该工具通过运行 npx workos 命令,能自动检测项目框架、安装对应 SDK、并直接编写 AuthKit(认证工具包)的集成代码,旨在帮助开发者在几分钟内为零项目添加完整的认证功能。
What sort of horrible things happen if my dialog has a non-button with the control ID of IDCANCEL?
Raymond Chen 于 3 月 2 日在微软开发者博客撰文,解释了一个 Windows 对话框编程的细节。他指出,若对话框中将一个非按钮控件的 ID 设为 IDCANCEL,当用户按下 ESC 键时,对话框管理器仍会向该控件发送一个按钮通知消息(BN_CLICKED),这会导致控件错误地将其解释为自身类型的零值通知,从而引发混乱。
Package Management is Naming All the Way Down
Brett Nesbitt 于 3 月 3 日撰文剖析包管理系统的本质。文章认为,包管理的核心是一个多层级的命名问题:从注册中心地址、命名空间、包名、版本号到依赖声明,整个系统建立在每一层字符串含义的共识之上。命名方案的差异和冲突(如依赖混淆攻击)体现了其背后的治理与权威挑战。
A [Firefox, Chromium] extension that converts Microsoft to Microslop
开发者 “4O4” 发布了一款浏览器扩展,于 1 月 24 日更新至 0.0.5 版本。该扩展默认将网页中的 “Microsoft” 替换为 “Microslop”,“Satya Nadella” 替换为 “Slopya Nuttela” 等,并提供更多可选的替换词(如 Copilot -> Slopilot),以幽默方式 “重写” 网络文本。
★ HazeOver — Mac Utility for Highlighting the Frontmost Window
John Gruber 于 3 月 4 日在 Daring Fireball 上推荐了 macOS 工具 HazeOver。这款已发布十年的应用通过智能调暗非活动窗口的背景来高亮当前活动窗口,优雅地解决了新版 macOS 中活动窗口辨识度不佳的问题,Gruber 称其显著提升了日常使用的体验。
ChangeTheHeaders
开发者发布了一款名为 ChangeTheHeaders 的 Safari 扩展,适用于 iOS、iPadOS、macOS 和 visionOS。该工具允许用户自定义 HTTP 请求头(如 Accept、User-Agent),以控制网站返回的内容类型(例如,强制获取 PNG 而非 WebP 图像),解决了 Safari 浏览器中因请求头差异导致行为不一致的问题。
Differential equation with a small delay
文章探讨了带有时滞的微分方程 x′(t) = a x (t) + b x (t − τ)。通过数学证明和数值模拟指出,只要延迟 τ 足够小(满足特定不等式),该方程与无延迟(τ=0)方程具有相同的定性行为(如单调衰减)。一旦延迟增大,解的行为将发生质变(如出现振荡)。
SerpApi Filed Motion to Dismiss Google’s Lawsuit
数据抓取服务商 SerpApi 于 2026 年 2 月 20 日提交动议,请求法院驳回 Google 提起的诉讼。SerpApi 认为,Google 试图利用 DMCA(数字千年版权法)阻止其抓取公开数据是滥用法律,因为 Google 自身并非搜索结果内容的版权所有者,其反抓取措施主要是为了保护广告业务而非版权。
Unsung Heroes: Flickr’s URLs Scheme
文章赞颂了 Flickr 在 2000 年代末期设计的 URL 方案,认为它是 “URL 即用户界面” 的典范。其清晰、可读、可预测且易于手动编辑的 URL 结构(如 /photos/username/sets/id),极大地提升了用户体验和操作效率,至今仍有借鉴意义。
The Xkcd thing, now interactive
知名网络漫画 xkcd 中一幅关于 “频率与感知” 的经典图表已被开发者通过 p5.js 制作成可交互版本,用户可以通过点击等操作动态探索图表中描绘的概念,为理解抽象思想提供了直观的工具。
产品动态
I built a pint-sized Macintosh
Jeff Geerling 于 3 月 4 日分享其复古计算项目:基于树莓派 Pico(RP2040 芯片)和 Matt Evans 开发的 Pico Micro Mac 固件,组装了一台微型 Macintosh 电脑。该设备通过 VGA 输出 640x480 分辨率画面,支持 USB 键鼠,并拥有 208KB 内存,可运行早期版本的 Mac OS 系统。
Game Review: Unravel Two ★★★⯪☆
Terence Eden 于 3 月 4 日发布了对合作平台解谜游戏《Unravel Two》的评测。他认为这是一款适合休闲合作的 “小宝石”,其基于物理的玩法和需要沟通协作的关卡设计带来了乐趣,但游戏流程较短,且强加的无谓深刻背景故事显得多余。
Apple Introduces MacBook Pro with All‑New M5 Pro and M5 Max
苹果于 2026 年 3 月 3 日发布新一代 14 英寸和 16 英寸 MacBook Pro,搭载 M5 Pro 和 M5 Max 芯片,宣称 CPU 性能核心世界最快,GPU 集成了神经加速器,AI 性能相比前代提升最高达 4 倍。同时发布新款 Studio Display(升级 Center Stage 摄像头和 Thunderbolt 5)及高端 Studio Display XDR(27 英寸 5K Mini-LED,峰值亮度 2000 尼特,120Hz 自适应刷新率)。新品于 3 月 4 日开启预订,3 月 11 日正式发售。信源:Apple Newsroom (MacBook Pro)、Apple Newsroom (Studio Display)
Seasonal Color Updates to Apple’s iPhone Cases and Apple Watch Bands
苹果于 3 月 2 日为其 iPhone 17 系列手机壳、Apple Watch 表带等配件推出了一系列春季新配色,包括亮番石榴色、香草色、电光薰衣草色等。新款配色配件已在苹果官网开售。
Apple Introduces New iPad Air With M4
苹果于 3 月 2 日正式发布新款 iPad Air,搭载 M4 芯片,CPU 和 GPU 性能较上代 M3 提升最高达 30%,并支持 Wi-Fi 7。新品提供 11 英寸和 13 英寸两种尺寸,起售价分别为 599 美元和 799 美元,将于 3 月 4 日开启预购,3 月 11 日正式上市。
Yarn Spinner for Books
Yarn Spinner 团队宣布推出 “Yarn Spinner for Books”,这是一个新工具,允许创作者使用熟悉的 Yarn 语法撰写交互式故事,并直接生成排版精美的 PDF 电子书,从而将交互叙事体验带入传统的图书出版领域。
You can now (also) buy Yarn Spinner
交互式对话工具 Yarn Spinner 现已上架 Unity Asset Store 和 Itch 商店供用户购买。该工具将保持免费和开源,但此次付费渠道为用户提供了支持项目发展并获取额外功能与服务的选项。
Mass Effect 2 for Yarn Spinner
交互式对话工具 Yarn Spinner 推出了一项新功能 / 产品:“Mass Effect 2 存档导入器”。该功能允许开发者在自己的 Yarn Spinner 项目中直接读取和利用玩家在《质量效应 2》游戏中的所有选择与剧情数据,用于创建衍生内容或增强叙事关联性。
I Feel Fine
Secret Lab 工作室宣布将于今年发布其开发的新游戏《I Feel Fine》。这款由艾斯纳奖得主 Ryan North 撰写、采用 Yarn Spinner 驱动的冒险游戏,讲述了玩家扮演一个被固定在水星轨道空间站上的旅游机器人,在三天内说服他人拯救自己的故事。
Yarn Spinner 与社区动态
Weekly Links for August 1, 2024
博主巴黎・B-A 开始尝试以每周链接合集的形式分享其阅读到的有趣内容,首期及后续合集涵盖了游戏数据集发布、行业道德反思、AI 盈利困境等多个科技与文化话题。
Yarn Spinner at GDC 2025
Yarn Spinner 团队宣布将参加 2025 年游戏开发者大会(GDC),并举办关于如何在游戏中运用其开源叙事工具的演讲。同时,团队也回顾了近期参与的南澳游戏展(SAGE 2025)、塔斯马尼亚 ICT 创意技术活动以及本地游戏组织 Tas Game Makers 的年度会议等活动,展现了其在游戏开发社区的活跃参与。
Yarn Spinner will be at GCAP 2024
交互式叙事工具 Yarn Spinner 团队宣布将出席今年在澳大利亚墨尔本举行的 GCAP 游戏开发者大会,并在现场展示其最新工作成果,分享如何使用该工具进行游戏创作。
NarraScope 2024
作者分享了近期在美国纽约州罗切斯特市 “The Strong National Museum of Play” 举办的 NarraScope 2024 互动叙事大会的参会体验,包括对主题演讲、研讨会、演示环节以及现场交流氛围的积极评价,认为该活动展现了互动小说社区的活力与多样性。
/dev/world and X World are back!
两大专注于苹果平台的会议 —— 面向 IT 管理员的 X World 和面向开发者的 /dev/world—— 将于 2025 年 9 月 2 日至 5 日在澳大利亚墨尔本回归。主办方已于 2025 年 3 月 4 日开启第一轮演讲征集(CFP),截止日期为 7 月 7 日。
其他
Betting Against Substack
文章于 3 月 4 日简短提及,作者曾因设计限制问题而拒绝使用 Substack 平台。随着 Substack 再次成为新闻焦点,作者意图通过展示其无法实现的设计方案来阐明自己的观点。
w0rdz aRe 1mpoRtAnt
Jim Nielsen 于 3 月 4 日撰文探讨词语选择对心理和行为的影响。他以一个 AI 产品中 “Usage leaderboard”(使用量排行榜)的标签为例,分析其隐含的 “用量多即好” 的激励导向,并与 “dashboard”(仪表板)、“wall of shame”(耻辱墙)等替代标签进行对比,提醒人们应更审慎地选择用语。
Space News, July 2025
文章总结了 2025 年 7 月的几则航天新闻:由杰夫・贝索斯支持的甲烷监测卫星 MethaneSAT 在轨一年后失联;研究人员首次在火箭上测试太空用月经杯,为长期太空任务做准备;澳大利亚 Gilmour Space 公司的首次轨道发射因审批延迟和恶劣天气多次推迟。
The Final Session
这是一篇科幻短篇小说,讲述了一位在图书馆为孩子讲了 23 年故事的老人埃莉诺,在图书馆引入一款名为 “StoryGenius” 的个性化 AI 故事机后,进行了她的最后一次故事会。故事探讨了技术替代人类连接、标准化内容消费对集体叙事体验和情感共鸣的侵蚀。
Practical Simulations for Machine Learning is out now
一本关于使用 Unity ML-Agents 进行模拟以训练机器学习模型的新书《Practical Simulations for Machine Learning》现已出版,读者可通过各大书店或 O‘Reilly 在线学习平台购买和阅读。
安全
Don’t use Wise
一位用户控诉跨境支付平台 Wise 在未给出明确理由的情况下,于 2025 年 5 月 6 日突然冻结了其账户并拒绝所有交易,导致超过 6 万澳元资金无法动用。尽管用户按要求提供了所需文件,但 Wise 的客服回应混乱,问题始终未得到解决,暴露出其风控机制和客户服务的严重问题。
Mullvad VPN: Banned TV Ad in the Streets of London [video]
隐私服务提供商 Mullvad VPN 发布了一段视频,展示其因内容涉及对大规模监控的批评而在英国伦敦被禁止播出的电视广告。此举引发了关于广告审查与数字隐私话题的讨论。
India’s top court angry after junior judge cites fake AI-generated orders
印度最高法院对一起下级法院法官引用人工智能生成的虚假判例裁决财产纠纷案表示愤怒,称此事关乎 “制度性关切”。涉事的安得拉邦初级法官表示这是其首次使用 AI 工具且误信了其生成的 “真实” 引用。最高法院已介入审查此案。
共 43 条更新 · 生成于 2026-03-04 00:54:38