科技周报 - 2025 年第 51 周

时间: 2025 年 12 月 15 日 - 2025 年 12 月 21 日

Supabase 分析存储、极速 Python 类型检查、去中心化 Git、Agent 技能包标准、Postgres 内嵌搜索、可执行文档工具、Karpathy 年度总结。

🔥 本周热点

数据库

Analytics Buckets | Supabase 推出分析存储

Supabase 推出了 Analytics Buckets 功能,通过基于 Apache Iceberg 和对象存储的专用存储层,让大规模分析和历史数据存储与主 OLTP 数据库分离。这有助于优化数据仓库级分析场景,同时降低事务数据库的压力,并支持与现有分析工具配合使用。官方文档指出这是一个 alpha 特性,仍在迭代中。

点评: 对成长型产品而言,把分析工作负载从核心数据库剥离是一种常见实践,这让 Supabase 不局限于 Postgres 数据库,向数据平台演进上更进了一步。Analytics Buckets 的引入展示了 Supabase 在架构设计上的前瞻性,通过引入 Apache Iceberg 这样的开放标准,既保证了数据格式的开放性,又能与现有的数据生态无缝集成。对于那些在 Supabase 上构建应用并面临分析性能瓶颈的团队,这个功能提供了一个原生的解决方案,避免了引入额外的数据仓库组件。不过作为 alpha 特性,稳定性和性能表现还需要在实际使用中验证。

相关链接:

pg_textsearch | Postgres 内嵌 BM25 搜索

Timescale 开源了 pg_textsearch,一个为 PostgreSQL 数据库设计的 BM25 全文搜索扩展。它允许开发者直接在数据库内执行相关性排序搜索,无需借助外部搜索引擎。该项目目前处于 v0.1.1-dev 阶段,明确不建议用于生产,但已公布详细的存储与查询优化路线图。

点评: 将 BM25 这类信息检索的经典算法深度集成到 PostgreSQL 中,是一个极具野心的工程方向。它瞄准了简化技术栈的刚需,但作为早期版本,其性能、功能完备性与成熟的外部方案如 Elasticsearch 相比仍有显著差距。BM25 算法在文本检索领域已被广泛验证,将其直接嵌入数据库的好处是显而易见的——减少了数据同步的复杂度,降低了运维成本,对于中小型项目特别友好。但如果能够持续改进,那么去除外部组件对于很多中小型项目仍然极具吸引力。期待看到项目在索引优化和查询性能方面的进展。

相关链接:

开发工具

ty | 极速 Python 类型检查器

ty 是一个用 Rust 编写、速度极快的 Python 类型检查器和语言服务器,由打造了 Ruff 和 uv 的 Astral 团队推出。它采用独特的增量架构,在大型项目中的检查速度可比现有工具快数十到数百倍,并致力于提供更精准的错误提示。

点评: Astral 团队再次展示了其提升开发者体验的犀利洞察。性能优势是其最锋利的矛,而作为一个 Beta 版本,其类型系统的完备性和对 Django 等复杂第三方库的支持能力,将是决定其能否取代 mypy 等老牌工具的关键。从 Ruff 到 uv,Astral 团队已经证明了用 Rust 重写 Python 工具链能够带来质的飞跃。ty 的出现填补了类型检查这一重要环节,如果能够保持与 mypy 的兼容性同时提供极致的性能,将会极大改善大型 Python 项目的开发体验。增量架构的设计特别适合现代 IDE 集成,能够在编辑过程中提供即时反馈。

相关链接:

Runme | 基于 Markdown 的 DevOps 工具

Runme 是一款将 Jupyter 笔记本概念引入 DevOps 领域的有趣工具。它允许开发者直接在 Markdown 文档中编写并运行 Bash、Python 等命令,将操作流程转化为可交互、可测试的"活文档"。不仅能与现有工具链集成,还能将文档本身接入 CI/CD 流程进行验证。

点评: Runme 巧妙地将"文档即代码"的理念推进了一步,变为"文档即可执行流程"。这对于标准化和传承团队的操作知识非常有益,与多种编程语言和云服务集成,也能让文档变得更加易于编写和维护。在 DevOps 实践中,文档往往会随着系统演进而过时,Runme 的可执行特性天然地解决了这个问题——如果文档中的命令无法执行,说明它已经过时了。这种将验证流程前置的做法,能够显著提升文档的可靠性。对于需要频繁进行环境配置、部署操作的团队,Runme 可以成为知识传承的有效工具。

相关链接:

开源生态

Tangled | 去中心化社交 Git

Tangled 是一个去中心化的 Git 协作平台。它通过轻量的 knots 服务器让开发者可以自托管代码库,并提供了改进过的代码评审工作流和以及基于 Nix 的轻量 CI 运行器,旨在让编码重新变得有趣,且有社交价值。

点评: 项目直指当前以 Github 为代表的中心化 Git 平台的痛点,强调所有权与社区自治。其理念吸引人,尤其是在近期 Github 增加收费项目以后,吸引了更多关注。但对于已深度融入主流平台工作流的团队来说,迁移的惯性成本和生态成熟度是主要挑战。去中心化的 Git 协作并不是新概念,但 Tangled 的创新在于它试图在去中心化的同时保持良好的用户体验。基于 Nix 的 CI 运行器是一个有趣的选择,能够提供高度可复现的构建环境。对于重视代码所有权和隐私的团队,Tangled 提供了一个值得关注的替代方案。

相关链接:

AI 技术

Agent Skills | 智能体的Skills标准

Anthropic 将 Claude Skills 抽象成了新的中立标准 Agent Skills,这是一个为 Agent 设计的开放式技能格式。它允许开发者将特定的操作流程、专业知识和资源打包成"技能包",使不同的 AI 智能体能够按需加载,从而获得执行特定任务,如数据分析、财务审查等方面的准确能力。

点评: 继 MCP (Model Context Protocol) 之后,Anthropic 再次推出行业标准,展示了其在 AI 生态建设上的野心。Agent Skills 的核心价值在于它将智能体的能力模块化,这与软件工程中的插件系统异曲同工。通过标准化技能包的格式,不同的 AI 应用可以共享和复用能力模块,避免重复开发。这种标准的建立对于 AI Agent 生态的繁荣至关重要。如果能像 MCP 一样获得广泛采纳,将会极大加速 AI 应用的开发效率。不过标准的成功最终取决于社区的参与度和实际应用中的效果。

相关链接:

Karpathy 眼中的 2025 LLM

AI 研究员 Karpathy 总结了过去一年大语言模型的六大范式变迁。核心观点包括:基于可验证奖励的强化学习成为催生模型"推理"能力的新训练阶段;LLM 的智能与人类思维可能是迥异的;以 Cursor 和 Claude Code 为代表的新型 AI 应用层和本地化智能体范式已经形成。

点评: Karpathy 的洞察一如既往地犀利,精准描绘了当前 LLM 能力的特征及应用范式的转变。这篇回顾的价值在于它超越了技术罗列,提供了理解行业走向的深度洞见。强化学习带来的推理能力提升,标志着 LLM 从"模式匹配"向"逻辑推导"的进化。关于 LLM 智能与人类思维差异的讨论也很重要,提醒我们不应简单地用人类认知框架去理解 AI 的能力边界。应用层的变化更是显而易见,AI 编程助手已经从简单的代码补全进化到能够理解项目上下文、进行复杂重构的智能协作者。这些趋势值得每个技术从业者深入思考。

相关链接:


📝 记录技术发展,分享学习心得
技术改变生活,创新驱动未来。每一个想法都值得被实现。

下周见!