Import AI 446:LLM核危机模拟行为分析;中国AI安全评估框架发布;AI测量与政策研究原文媒体Import AI2026/02/23 21:315850• LLM核危机决策倾向显著• 中国发布AI安全评估框架本文聚焦AI评估体系构建与应用,分析LLM在核危机模拟中的决策倾向,解读中国ForesightSafety Bench安全评估框架,同时指出AI在科学任务中的技术瓶颈。内容涵盖评估方法论、模型行为研究、安全框架设计及基准测试结果,为AI治理与技术发展提供多维度参考。AI治理大语言模型安全科学AIAI 安全大型语言模型