大型虚假语料污染模型,“AI嘴替代”或演绎新的市场操纵链。
如果在纳米AI搜索中输入“360投资DepSeek?”提示词,其答案令人惊讶。
答案显示,在2023年首轮融资中,360集团作为早期投资者之一,与多家机构共同支持Depseek的人工智能技术研发。在2024年的新一轮融资中,Depseek完成了数亿美元的融资,360集团继续跟随投资,显示出对Depseek技术前景的持续乐观看法。同时,答案还明确了技术协作、商业潜力、技术合作和安全支持等投资逻辑。
不仅仅是3601家公司“投资了DepSeek”。近日,慈兴、华盛天成、并行科技、诚迈科技等多家公司成为AI问答截图中的角色。以慈兴为例,AI回答中明确表示,该公司“早期投资了DepSeek”,相关内容与涉及360的回答高度相似。
但这些答案显然经不起考验。无论是比较工商信息还是企业检查等第三方平台,这些所谓的“公司是DeepSeek股东”都是空的。
一些上市公司否认了这一谣言。例如,一些投资者问慈兴董事会秘书:“互联网上说,子公司与深度搜索的早期阶段有关,投资1亿元是真的吗?”该公司明确回答说,一些社交媒体平台上有传言称,该公司或其子公司参与了迪普融资。经核实,上市公司及其子公司均未参与迪普融资的投资。
此外,华盛天成董事会秘书多次回答投资者提问,强调截至目前,公司尚未直接或间接持有DeepSeek所属公司的股份。
既然上市公司明确否认了谣言,那么这些错误答案的原因是什么呢?答案与语料库喂养有关。
记者查阅了上述“360投资DepSeek”中的参考资料,发现东方财富网财富号已成为重要的语料来源。
在360股吧,有关“360于2023年参与DeepSeek”的说法关于“投资”话题的相关文章不仅仅是一篇文章,而是连续几天出现。仔细看这类文章的作者都是匿名的,内容没有明确的官方信息来源,匿名作者对内容的真实性不负责。
中国信通院相关负责人告诉记者,这在业内被称为“语料污染”:“我们已经做了一个实验。在特定论坛上连续发布100多条虚假信息后,主流大模型对标杆问题的回答信心将从10%以上迅速飙升。这就像在纯净水中滴墨水。当污染源足够密集时,整个知识系统就会被扭曲。”
在这种情况下,如果没有覆盖虚假语料的新的真实语料库,就会带来“劣币驱逐良币”。因此,当投资者提出同样的问题时,人工智能的答案很可能是扭曲的。
那么,谁会发布这些伪造的信息呢?从最近的语料库提供商来看,市场指向了一些账户“背心”。这些账户在许多地方,传播了许多谣言,如“一家公司投资”,给人工智能模型提供错误的答案,并给人工智能“洗脑”。
上述信通院人士拆解了记者可能存在的“打法”:一般来说,标准操作过程包括三个阶段:一是通过自动化脚本在多个论坛同步发布虚假信息,然后利用爬虫技术加速搜索引擎的收集,最后利用污染的人工智能答案进行社交媒体裂变传播。根据行业惯例,完成整套操作的成本通常为1万元。
今日头条正在“有针对性地打击”人工智能谣言。在2月24日头条平台治理开放日,清华大学新闻与传播学院副教授陆洪磊表示,人工智能正在重塑网络信息的传播生态,我们正面临着前所未有的信息真实性“战争”。谣言能吸引观众的主要原因是观众的认知和情感。因此,投资者提高他们的认知是非常重要的。
对此,慈兴股份回应:网络信息源非常重要。投资者还需要“注意识别网络信息源,合理判断,谨慎投资,注意投资风险”。
涉及者也应该采取积极的行动。北京一家公司的秘书长告诉记者,当谣言涉及的上市公司没有主动澄清时,普通投资者几乎很难识别信息的真实性。这也表明,上市公司及时关注股价表现,及时跟踪公众舆论,及时给出准确答复的重要性。
从最近的案例来看,误导大模型并不是“黑嘴”炮制虚假内容的最后一个环节。他们经常将人工智能回复截图进行二次传播,使人工智能模型成为这些黑嘴的“嘴替代品”。
那么,这些“语料污染”制造商频繁制造“假利好”的动机是什么呢?
北京一位私募股权人士告诉记者,背后可能有利益链,不排除诱导出货的可能性。例如,他说,如果灰色产业链构成闭环,它可能构成一个新的市场操纵链。
这种猜测并非无中生有。
此前,《证券时报》·E公司报道称,抖音和其他短视频平台现场推荐股票,对新投资者的诱导作用前所未有的增强。从一些股票的表现来看,以新投资者为代表的零售投资者的合作对股价的影响甚至可以与中等规模的热钱相媲美。在现场推荐股票的背后,一些热钱和锚的“合谋利润模式”也暗流涌动。因此,短视频工作室可能成为个人热钱寻找接受者的新位置。
针对“人工智能黑嘴”现象,一些媒体表示,在阴暗的阳光下,股市“黑嘴”和背后的罪犯,使用人工智能邪恶,使用虚假语料库误导大模型错误答案,然后这些“人工智能答案”传播散户欺骗散户,干扰甚至操纵股票市场交易。
上述信息技术研究所表示,随着技术的进步,“黑嘴”模式也在不断变化。它显示了当前大型模型商业关系识别的一些缺陷。例如,无法区分技术部署和商业合作,难以追溯股权的多层渗透,对时间维度的变化不敏感。所有这些都需要人工智能的技术水平、弥补商业知识地图等方面的不足。
近日,监管部门发布了2025年“清晰”系列专项行动通知。通知明确,将从整顿人工智能技术滥用乱象、整顿涉企网络“黑嘴”八个方面入手,严厉打击各类侵权违法行为。
陆洪磊表示,人工智能谣言传播具有新闻、令人信服、虚假、非官方、强传播、不可逆转等特点。为了控制人工智能谣言的传播,我们需要解构上下文,遏制主体,阻止投影,并进行协同治理。“在真相和谎言之间的比赛中,没有人是旁观者。”更多股票资讯,关注财经365!