专题:data-privacy

按该标签聚合的大模型资讯列表(自动分类与标签提取)。9 篇文章。

媒体InfoQ 中文2026/04/09 01:004770
GitHub 收集 Copilot 使用数据用于模型训练
数据在进入训练前进行脱敏和匿名化处理

GitHub 公开了 Copilot 如何收集、脱敏并利用用户代码交互数据训练其后续大语言模型的完整流程。文章说明了数据范围、隐私保护措施、训练方法以及质量评估手段,并提供了用户数据管理入口,帮助开发者了解其代码如何被用于模型迭代。

媒体爱范儿2026/04/03 09:006770
Gemma 4实现完全开源与本地部署
Apache 2.0许可证降低使用门槛

Google推出Gemma 4系列开源小模型,支持手机等设备本地运行。通过Apache 2.0许可证实现完全开源,配套专利保护机制。该模型突破数据中心依赖,满足医疗、金融等行业数据安全需求,引入多步推理与Agent模式等核心技术,推动AI技术在边缘设备的广泛应用。

媒体UX Magazine2026/03/17 14:095670
界面设计模拟选择,实则操纵用户同意
利用认知偏见影响用户决策

本文探讨‘同意剧场’现象,即用户界面设计中看似提供选择实则操纵用户同意的策略。分析了视觉偏见、同意疲劳、默认勾选等常见手法,并指出其对用户自主权的侵犯。文章结合心理学理论与现实案例,强调伦理设计的重要性,呼吁设计师正视用户心理与权利。

媒体SuperTechFans2026/03/04 08:166770

本文精选了2026年3月4日Hacker News的多篇热门文章,涵盖AI伦理、技术应用、行业动态及开源项目发展。重点包括Meta AI眼镜的数据隐私问题、Apple M5芯片的AI性能提升、AI在新闻中的误用、开源项目SEO挑战及AI在科研中的突破。内容涉及技术实现、社会影响与行业趋势,具有较高的参考价值。

社区Reddit r/LocalLLaMA2026/02/10 12:2260

针对AI模型训练中普遍存在的“先抓取后道歉”的数据爬取乱象,作者提出疑问:是否存在一种更优的训练方式,能在不损害数据所有者控制权的前提下进行模型训练或微调?文中提及联邦学习和安全环境训练等潜在方案,但对其应用现状表示不确定,并对当前大规模数据抓取模式表示不满。