专题：instruction-tuning

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 2 篇文章。

Claude Opus 4.6至4.7版本系统提示更新解析

原文

社区Hacker News2026/04/19 18:365800

• 系统提示机制升级

• 对话理解能力增强

本文解析Claude Opus 4.6到4.7版本系统提示的关键变更，涵盖对话管理、指令调优等技术改进。更新通过动态上下文权重分配和指令优先级标记系统提升模型表现，为开发者提供更精准的模型行为控制方案，属于AI模型迭代优化范畴。

系统提示提示工程对话管理指令调优模型更新

TinyLlama 微调实战：打造 Tamazight（Tifinagh）聊天机器人

原文

社区Reddit r/LocalLLaMA2026/02/12 21:0610

本文围绕使用 TinyLlama‑1.1B 为 Tamazight（Tifinagh 脚本）打造聊天机器人 Awal‑LM 的实战经验展开。作者面临 tokenizer 覆盖不足、输出重复循环以及指令化不足等难题。文章提供了手动添加 Tifinagh token、重新训练词表、采样惩罚、负样本标注、数据增强（回译、合成对话）以及先进行小规模持续预训练后再 …

TinyLlama 微调 LoRA/QLoRA 低秩适配 Tifinagh 脚本低资源领域指令调优