消息称字节跳动大模型训练被实习生攻击

2024-10-18 22:46 由杨亮发表于 #商业

10月18日消息，据媒体报道，今日多个微信群流传一则消息：“字节跳动的大模型训练被实习生入侵，注入了破坏代码，导致其训练成果不可靠，可能需要重新训练。据称遭到入侵的代码注入了 8000 多张卡，带来的损失可能超过千万美元。”

据知情人士透露，此事发生在今年 6 月，起因是北大的博士在字节跳动商业化技术团队实习，因对团队资源分配不满，使用攻击代码破坏团队的模型训练任务。截至目前，官方未进行回应。

传闻显示，该田姓实习生利用了 HF（huggingface）的漏洞，在公司的共享模型里写入破坏代码，导致模型的训练效果忽高忽低，无法产生预期的训练效果，而且 AML 团队无法核查原因。但传闻曝出之后，该实习生还在某微信群里辟谣称，自己发完论文后就从字节跳动离职，这个当口有另一个人钻漏洞改模型代码，把锅扣到自己头上。

知情人士称，字节跳动内部已经调查明确此事为田姓实习生所为。目前，该实习生已被辞退，字节跳动同时把此事同步给阳光诚信联盟和企业反舞弊联盟，以及北大。但这名实习生被辞退后到处“辟谣”甩锅，称是其他人所为。

报道称，该实习生攻击的并不是豆包大模型，而是商业化技术团队的模型训练任务，影响了该技术团队的一些业务进展，但整体对公司造成的损失并没有传闻中的超过千万美元那么大。