媒体量子位2026/04/06 23:255840
• HISA提升超长文本处理速度
• 无需重新训练,即插即用
北大团队提出HISA稀疏注意力机制,通过分层筛选提升超长文本处理速度,最高提速四倍且精度几乎不变,具备即插即用、工程友好等优势。
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 4 篇文章。
北大团队提出HISA稀疏注意力机制,通过分层筛选提升超长文本处理速度,最高提速四倍且精度几乎不变,具备即插即用、工程友好等优势。
OpenAI 发布 GPT-5.4,整合编程、推理、计算机操控、网页搜索和百万 Token 上下文能力,显著提升知识工作、编程和自动化任务处理表现。模型支持实时调试与任务中途调整,API 定价合理,但部分用户反映其推理能力在轻量任务上成本过高。
OpenAI推出GPT-5.4,专为专业工作设计。该模型具备100万token上下文处理能力,强化了编码、计算机操作和工具搜索功能,旨在提升复杂任务处理效率与资源利用率,为开发者提供更高效的AI解决方案。
Meta 发布 Llama 4 系列多模态模型,包括 Scout、Maverick 和 Behemoth。采用 MoE 架构,显著提升性能、效率和上下文长度,Scout 支持 1000 万 token 上下文处理,Maverick 专注多模态理解与生成,Behemoth 作为教师模型。此次发布代表多模态 AI 技术的重要进展。