大公网

大公报电子版
首页 > 新闻 > 内地 > 正文

话你知/“知识蒸馏”

2025-01-31 05:02:18大公报
字号
放大
标准
分享

  据DeepSeek回答大公报记者提问,“知识蒸馏”(Knowledge Distillation)是一种被广泛认可且合法的机器学习技术,其本身并不构成“偷窃”。就技术本质而言,“知识蒸馏”属知识传递,而非覆製。其核心原理是知识蒸馏通过让小型模型(学生模型)学习大型模型(教师模型)的“知识”(如输出概率分布或中间特征表示),而非直接覆製代码或参数。这类似于学生向老师学习解题思路,而不是抄袭答案。

  需要指出的是,蒸馏出来的最终模型仍需独立训练,其参数和结构可能与教师模型完全不同,属于一种优化方法,而非盗窃行为。就行业实践而言,这是广泛接受的技术手段,属开源社区常规操作。事实上,许多开源模型明确允许蒸馏,甚至提供蒸馏工具链。OpenAI的GPT-3曾被第三方通过API输出而蒸馏出小型模型(如美国科企Hugging Face的社区项目),这些案例均未被认定为“盗窃”,而是技术创新体现。

点击排行