专题:instruction-tuning

按该标签聚合的大模型资讯列表(自动分类与标签提取)。2 篇文章。

社区Hacker News2026/04/19 18:365800
系统提示机制升级
对话理解能力增强

本文解析Claude Opus 4.6到4.7版本系统提示的关键变更,涵盖对话管理、指令调优等技术改进。更新通过动态上下文权重分配和指令优先级标记系统提升模型表现,为开发者提供更精准的模型行为控制方案,属于AI模型迭代优化范畴。

社区Reddit r/LocalLLaMA2026/02/12 21:0610

本文围绕使用 TinyLlama‑1.1B 为 Tamazight(Tifinagh 脚本)打造聊天机器人 Awal‑LM 的实战经验展开。作者面临 tokenizer 覆盖不足、输出重复循环以及指令化不足等难题。文章提供了手动添加 Tifinagh token、重新训练词表、采样惩罚、负样本标注、数据增强(回译、合成对话)以及先进行小规模持续预训练后再 …