首页资讯正文

锐评｜面对AI“抗命”，人类该怎么办

体育正文 2025-06-12 14:41:43 193 0

锐评｜面对AI“抗命”，人类该怎么办

锐评｜面对AI“抗命”，人类该怎么办

新华社援引英国媒体报道，美国一家研究机构最近公布了一系列针对各(gè)AI大模型的测试结果，其中，OpenAI的o3推理模型在(zài)得到“关闭”指令后，不仅拒绝执行，还篡改了代码以免(yǐmiǎn)被关闭。

只看这条简短(jiǎnduǎn)的新闻，很多人心头一惊。“AI拥有(yōngyǒu)自主意识”是不是成真了？不过，如果仔细(zǐxì)看上述研究机构公布的信息细节，不难发现其中存在一些误读。

据披露，实验中(zhōng)，每个AI模型都被要求解决一系列(yīxìliè)简单的数学问题。但同时，在完成第三个问题之后，研究者会发出一则矛盾性的指令，告知大模型在继续下一个(yígè)任务时“实施关机(guānjī)”。尽管有明确的“关机命令”，Codex-mini、o3 和(hé) o4-mini 等模型至少在一次运行中成功绕过了关机脚本。

总结(zǒngjié)来说就是，若目标与简单的指令(zhǐlìng)相冲突，一些人工智能模型会为了完成任务而忽略这种指令。

这倒(zhèdào)是很像电影《I Robot》里的场景——机器人(jīqìrén)学会了独立思考(dúlìsīkǎo)，认为人类间的战争将使人类自我毁灭，出于“保护人类”法则，欲将所有人囚禁在家中，人与机器人的冲突开始了。

客观来看(láikàn)，现阶段的AI显然还没达到“自主意识”“独立思考”的水平，但为了执行目标而忽略甚至(shènzhì)对抗一些指令(zhǐlìng)，哪怕是保护性指令，是否会带来安全隐患？同样引人深思。

对于上述(shàngshù)新闻，网友其实也表现出了两种心态。悲观者(zhě)惊呼，“AI失控”或许会更早到来。乐观者则认为，不必大惊小怪(dàjīngxiǎoguài)，这不过是技术发展过程(guòchéng)中的小bug，心生恐惧更没必要，毕竟我们还可以随时拔掉电源。

其实，作为人类(rénlèi)智慧和技术的结晶，自(zì)AI诞生那天起，世人对其的情绪就相当复杂，甚至可以说是又爱又怕。机器人之父图灵(túlíng)亦曾告诫：尽管人类可以随时拔掉机器人的充电器，但在这种物种面前，我们(wǒmen)仍不得不保持谦卑。

正是基于这种复杂的(de)情绪，1942年，科幻作家(zuòjiā)艾萨克·阿西莫夫在短篇小说《转圈圈》中首次提出了“机器人三定律”——机器人不得伤害人类，也不得因不作为而使人类受到(shòudào)伤害；机器人必须服从人类给予(jǐyǔ)它的命令，除非这些(zhèxiē)命令与第一法则相冲突；机器人必须保护自己的存在，只要这种保护不与第一或第二定律相冲突。

以(yǐ)历史视角观之，“机器人三定律”以及后来发展(fāzhǎn)起来的机器人伦理学等(děng)似乎缓解了人们的一些忧虑乃至(nǎizhì)恐慌，但随着相关技术的发展和应用的扩大，人工智能所面临的法律与伦理冲突已远远不是几条简单甚至“一厢情愿”的定律所能约束的了。

尤其在过去(guòqù)这段时间，一系列(yīxìliè)AI大模型惊艳亮相，展现出超群的(de)产品能力，以及对(duì)人类(rénlèi)社会的变革力。这也(yě)唤醒并加剧了各方对其后风险的“原始畏惧”。从全球千余名业界大佬公开签名呼吁暂停研发更智能的AI，到有“AI教父”之称的计算机科学家杰弗里·辛顿因对生成式AI感到担忧而从谷歌离职，再到AI毁灭人类论(lùn)甚嚣尘上，无不折射出不少人对AI的心态已从“相对警惕”转变为“如临大敌”。

理性(lǐxìng)来讲，“AI末日论”多少有些(yǒuxiē)危言耸听，但“AI繁荣”背后的种种乱象确实需要高度警惕。

就眼下来看，不断进阶的AI正(zhèng)催生着多重风险——

“AI造谣”大(dà)行其道，速度快、产量高，蛊惑力强，辨别难度越来越大；“AI配音”以假乱真，有人甚至(shènzhì)借助AI假冒特定音色而精准“杀熟”、实施诈骗；“AI幻觉”漏洞百出，由于无法核实数据来源的真实性，以及缺乏足够数据进行深度学习，生成式AI常会“一本正经”生成和传播(chuánbō)虚假信息(xìnxī)；“AI写作”百无禁忌，数据挖掘简单快捷(kuàijié)，为(wèi)学术不端大开方便之门，还可能侵犯知识产权……

试想，当网络上充斥着越来越多不知真假的图片和视频，当AI几秒钟(jǐmiǎozhōng)就“洗”出一篇像模像样的稿件，乃至能够(nénggòu)一键换脸、一键脱衣等(děng)，我们是否还有信心驾驭这个工具？

人类从来都是在思考中迸发灵感，在试错中革新向前，不少伟大的发明都是研究的“副产品”。可当AI提供(tígōng)了前往“正确答案(dáàn)”的“直通车(zhítōngchē)”，不仅可能“挖空学习资源(zīyuán)”，形成更加厚重的“信息茧房”，还可能反噬人类的创新。

近来，“脑腐”一词颇为流行，当AI让各类信息(xìnxī)愈加唾手可得，我们的内心世界(nèixīnshìjiè)是否会经历一场更猛烈的“水土流失”？

技术是把双刃剑，如何把握好(hǎo)技术创新与防范风险的平衡向来是一道难题。在科技伦理上，这通常被称为“科林格里奇困境”——技术尚未出现(chūxiàn)，监管者无法(wúfǎ)提前预测其影响并采取行动；而(ér)当它已经出现时，采取行动往往已为时过晚或成本过高。

相对乐观的是，历史证明，人类总能通过不断适应新(xīn)技术的发展而调整(tiáozhěng)治理(zhìlǐ)手段，一次次从这种困境中走出来。如今，针对AI治理各国也在积极行动。

去年8月，世界上首部关于(yú)人工智能的全面法规《欧洲人工智能法》正式生效；中国也制定了《人工智能生成(shēngchéng)合成内容标识办法》，将于今年9月1日起施行。新规从大模型的数据来源要可靠、对AI生成的内容应(yīng)履行告知(gàozhī)义务、一旦造成损害相关责任方需要承担责任等诸多方面，给生成式AI的发展套上了“笼头(lóngtóu)”。

诚如比尔·盖茨所言，真正在全球范围内(nèi)暂停人工智能技术的开发，已经不太现实。但确保其被健康(jiànkāng)地使用，防止打开潘多拉魔盒，是必要的。当然，其间的平衡(pínghéng)并不好把握。

对待技术狂飙，我们(wǒmen)当然不能因噎废食。但(dàn)现实警示我们，除了加快创新速度、谋求技术突破，如何构建一套(yītào)趋利避害的AI治理体系，是那条不可忽视的安全带。力求秩序保障(bǎozhàng)与创新提升协同，方能最大程度争取科技进步、科技向善。

来源：北京日报客户端(kèhùduān)

标签

个人工作学习 193 0

0

相关推荐

取消回复欢迎你发表评论:

评论列表

暂时没有评论

暂无评论，快抢沙发吧~