大模型资讯聚合站

专题：context-length

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 4 篇文章。

北大团队提出HISA稀疏注意力机制，超长文本处理速度提升四倍

媒体量子位2026/04/06 23:255840

• HISA提升超长文本处理速度

• 无需重新训练，即插即用

北大团队提出HISA稀疏注意力机制，通过分层筛选提升超长文本处理速度，最高提速四倍且精度几乎不变，具备即插即用、工程友好等优势。

注意力机制稀疏注意力大型语言模型上下文长度模型优化

OpenAI 发布 GPT-5.4：整合多项能力，实现任务闭环

媒体爱范儿2026/03/06 17:068950

• 整合多项能力，提升任务处理效率

• 支持实时调试与中途调整功能

OpenAI 发布 GPT-5.4，整合编程、推理、计算机操控、网页搜索和百万 Token 上下文能力，显著提升知识工作、编程和自动化任务处理表现。模型支持实时调试与任务中途调整，API 定价合理，但部分用户反映其推理能力在轻量任务上成本过高。

GPT-5.4系列计算机操控上下文长度工具搜索实时调试

OpenAI发布GPT-5.4：专业级AI模型新标杆

官方OpenAI Blog2026/03/05 18:006430

• GPT-5.4发布

• 支持100万标记上下文

OpenAI推出GPT-5.4，专为专业工作设计。该模型具备100万token上下文处理能力，强化了编码、计算机操作和工具搜索功能，旨在提升复杂任务处理效率与资源利用率，为开发者提供更高效的AI解决方案。

大语言模型上下文长度专业应用编码能力工具搜索

Meta 发布 Llama 4 系列多模态模型，MoE 架构引领新突破

媒体Gino Notes2025/04/06 08:007850

Meta 发布 Llama 4 系列多模态模型，包括 Scout、Maverick 和 Behemoth。采用 MoE 架构，显著提升性能、效率和上下文长度，Scout 支持 1000 万 token 上下文处理，Maverick 专注多模态理解与生成，Behemoth 作为教师模型。此次发布代表多模态 AI 技术的重要进展。

Llama 4 Mixture-of-Experts 多模态生成开源框架上下文长度