专题:language-model

按该标签聚合的大模型资讯列表(自动分类与标签提取)。6 篇文章。

媒体AINews2026/03/23 13:446870
Anthropic发布新工具扩展代理能力
Meta推动代理自我优化与效率提升

Anthropic推出Claude Cowork和Claude Code,扩展AI代理的桌面控制能力。多代理框架Hermes Agent等提升协作效率,但子代理仍存缺陷。Meta AI的Hyperagents/DGM-H技术融合RL与LM实现自我优化,WebArena-Infinity降低环境构建成本,推动代理技术向实用化发展。

社区Hacker News2026/03/17 12:396750
Kagi Translate支持LinkedIn Speak输出
AI实现语言风格迁移与适配

Kagi Translate新增LinkedIn Speak输出语言支持,帮助用户生成符合职业社交平台风格的翻译内容。该功能基于AI模型和语言风格迁移技术,提升了内容的可读性和传播效果,是AI在文本生成和语言适配领域的重要应用。

媒体Lobsters AI2026/02/25 18:025740

Mercury 系列模型采用扩散算法实现并行文本生成,在 H100 GPU 上实现 1,109 tokens/s 的超高速解码。Mini 版在质量评测中与 GPT‑4o、Claude 3.5 Haiku 等主流模型持平,平均延迟仅 25 ms。该工作证明扩散模型可在离散序列上大规模训练,为代码生成等高吞吐任务提供了新的高效路径。

社区Reddit r/LocalLLaMA2026/02/20 22:554650

作者在 GPT‑2 的残差流中发现,句子“The temperature was 98.”的句点会被模型误判为小数点,置信度 88%。通过特定的 768 维方向干预,模型的判定会突变且呈不对称性——从数值化到结构化的转变所需力度约为逆向的四倍。该行为与灾变理论的折叠模型吻合,作者提供了可在 CPU 上 29 秒复现的开源脚本,邀请社区验证其普遍性。