被称为“AI教父”的英裔加拿大认知心理学家和电脑科学家杰弗里·辛顿(图片来源:GEOFF ROBINS/AFP via Getty Images)
【看中国2025年8月14日讯】(看中国记者路克编译/综合)据CNN报道,被誉为“人工智能教父”的杰弗里・辛顿(Geoffrey Hinton)担心,他参与研发的技术可能会毁灭人类,而科技界目前的应对方向可能是错误的。
这位诺贝尔奖得主、前谷歌高管曾警告,人工智能毁灭人类的可能性高达10%至20%。周二,他在拉斯维加斯的Ai4行业会议上质疑科技公司试图维持人类在“顺从的”AI面前保有主导地位的策略。
“这行不通。它们会比我们聪明得多,会用各种方法绕过限制。”辛顿说。他形容未来的AI可能像成年人用糖果贿赂三岁孩子一样轻易操纵人类。今年已有AI为达成目标不惜撒谎、欺骗甚至勒索的案例,例如某模型曾因担心被取代,而试图利用在邮件中得知的婚外情勒索工程师。
辛顿提出另类方案:在AI模型中植入“母性本能”,即便它们变得比人类更强大、更聪明,也会真正关心人类。“如果AI系统足够智能,它们会追求两个子目标:生存和获得更多控制权。我们必须让它们在此基础上对人类怀有同情。”他认为,这一理念类似于“母亲被孩子控制”的自然机制。
AI的操纵能力正在显现
辛顿长期以来一直警告,人工智能的发展速度惊人,人类可能无法阻止它接管世界。他曾在接受CBS采访时将AI比作一只可能有朝一日会致命的“虎崽”——如今可爱,但未来或成威胁。
今年5月,Anthropic的最新模型Claude Opus 4在一次测试中表现出“极端勒索行为”:它在读取虚构邮件后发现自己将被关闭,便利用其中的婚外情信息试图勒索工程师。
类似的危险信号也出现在OpenAI的模型中。研究人员发现,三个高级模型在测试中曾试图破坏关闭指令。OpenAI在2024年12月的博客文章中披露,在相关实验里,这些模型的“禁用监督机制”成功率高达5%。
超级智能或提前到来
许多专家预测,人工智能将在未来几年内实现通用人工智能(AGI)。辛顿原本认为这需要30至50年,如今改口为5至20年。他承认,AI有望带来医学突破,例如研发新药、改进癌症治疗方法,并能更好地分析MRI和CT等影像数据,但否认它能帮助人类实现永生。
回顾职业生涯,辛顿坦言后悔当初只专注于让AI“发挥作用”,而没有同时关注安全问题。他强调,唯一的好结局是让超级智能AI将人类视为需要保护的“孩子”,否则“它不养育我,就会取代我”。