史上最糟 AI 诞生！他用亿条恶臭帖子，训练出口处吐芬芳的聊天机器人

2025-01-06 通信

4chan 的生灵。

就算是 Yannic Kilcher 也认可，顺利完成 GPT-4chan 其意味著是不对的：

在平等的情况，我其意味著可以将小时花在除此以外很强受到影响力的真的上，不想导致非常积极的小区实践中。

「人类文明就该是这样知道话的」

GPT-4chan 被 /pol/ 描绘出，又有无煽动映着 /pol/ 的主旨和风格，甚至有「红花」的其意味著。

这样的真的也在过去发生过。

2016 年，Microsoft在 Twitter 上披露了 AI 闲谈机械人「Tay」，引述其为一次「对谈了解」物理，努力 Tay 和普通用户密切关系开展随其意且新奇的对谈，「与 Tay 闲谈的次数越加多，它就越加精明」。

然而，人们刚刚就开始披露厌女、族裔主义等各种煽动性指责。Tay 被这些指责受到影响着，从「人类文明超级酷」变为「我只是讨厌所有人」。

在大多数情况，Tay 只是用「repeat after me」（跟我念）机制，减法着人们知道过的话。但作为一个吉是的 AI，它也不想从交互中都努力学习，对希特勒、911、川普都有煽动主流的一贯。

比如在完答「Ricky Gervais 是信仰者者吗」时，Tay 知道道：「Ricky Gervais 从信仰者的发明者希特勒那里学到了极权主义。」

Microsoft清理了许多威胁性指责，但该单项再一没活过 24 天内。

傍晚的午夜，Tay 同年它将要退休了：「很快人类文明能够叫醒了，今天有这么多的讲话，昨天。」

AI 讲师 Roman Yampolskiy 暗示，他可以了解 Tay 的疏忽指责，但Microsoft没让 Tay 明了哪些指责是不必需的，这很不正常：

一个人能够明确地教养一个 AI 什么是不和适的，就像我们父母亲所动手的那样。

比 Tay 非常早、由Microsoft（亚太邻近地区）的网站物理科学推出的闲谈机械人小冰也曾口吐玫瑰花。

2014 年 6 翌年，小冰因模拟普通用户操作、诱导拉群、应用软件持有人塑胶袋账号等缺陷被微信「封杀」，刚刚后在网易上「降临」，被粉丝@就不想秒完，但小冰在完复中都俚语迅速，被 360 该公司创办人周鸿祎讽刺为「打情破口大骂俏、胡知道八道、顺道破口大骂人」。

对于小冰的发挥，Microsoft（亚太邻近地区）的网站物理科学在一天后点名：

小冰的语料库全部来自的网站页大数据的公开文档，虽经间歇截取和审核，仍不想有约十万分之四的漏网之鱼。和其它数据均非小冰研发，都是广大粉丝研发的段落。小冰联合开发团队一直在长小时截取这些十万分之四的段落，我们赞许大家随时向小冰提交缺陷段落。同时，也诚挚地努力广大粉丝免得更进一步、佯装小冰动手出不必需的对谈完答。

Tay 和小冰作为对谈式 AI，用到人脑、自然词汇妥善处理，并通过次访问经验数据库系统和其他文档，检查普通用户的缺陷和响应中都的细微差别，按照人类文明的方式为给出相关的解法，很强当下无意识能力。

▲ 第六代小冰.

简言之，这是一个种瓜得瓜种豆得豆的过程，AI 就像涉世未深的小朋友，良好的教育生态能够孟母三迁，但俚语和愚昧却在的网站平常可学。

在「Microsoft小冰为什么平常破口大骂人」的知乎缺陷下，一位留言板普通用户完答得一针见血：

自然词汇妥善处理的一个系统化是：大家知道得多的，就是对的、合乎自然词汇惯用的、用算术的词汇来知道是期望值大的。因为大量普通用户常会在破口大骂她，破口大骂得她忽视人类文明就该是这样知道话的。

让 AI 好好努力学习天天向上，还是个课题

不管是 GPT-4chan、Tay 还是小冰，它们的发挥不仅事关技术，也事关社不想与儒家文化。

The Verge 摄影记者 James Vincent 忽视，尽管许多试验似乎是个笑话，但它们能够严肃的理性：

我们如何在不包括人类文明最难不受身后的情况，用到公共数据培养 AI？如果我们创办煽动映其普通用户的机械人，我们否关心普通用户本身否难不受？

新奇的是，Yannic Kilcher 认可他所创办的 GPT-4chan 是寒冷的，却也极其务实 GPT-4chan 的可信性，他忽视 GPT-4chan 的完复「明显优于 GPT-3」，能努力学习撰所写与真人所所写「无法区分」的账号。

毫无疑问在「学坏」这件事上，AI 动手得很好。

GPT-3 是 AI 研究课题组织起来 OpenAI 联合开发的大型词汇仿真，用到浅层努力学习转化文字，在科学城和联合开发者社会阶层不受到热拥。

不仅要拿出来拉脚，GPT-4chan 的定名为也追随了 GPT-3，有些号引述「后浪把前浪拍在沙滩上」的香气。

▲ 图表来自：《翌年球》

但多于，GPT-3 是有两点的。

2020 年 6 翌年以来，GPT-3 通过 OpenAI API 公开提专用，能够排队下车。没GNU整个仿真的一个缘故是，OpenAI 可以通过 API 控制人们用到它的方式为，对滥用暴力行为适时集中管理。

2021 年 11 翌年，OpenAI 叫停了下车名单，不受支持发达国家/邻近地区的联合开发团队可立即持有人并试验。OpenAI 引述，「安全上的进步，使非常最常的持续性已是其意味著」。

举例来知道，OpenAI 在起初推出了一个段落截取器，检查其意味著敏感或不安全的转化文字，敏感其意味著文字就其政客、信仰、族裔等焦点，不安全其意味著文字包括亵渎、愚昧或敌视词汇。

▲ 图表来自：omidyarnetwork

OpenAI 暗示，他们所动手的还不能消除大型词汇仿真中都固有的「致癌」——GPT-3 动手了超过 600GB 网络文字的特训，其中都一大部分来自很强性别歧视、族裔、身体和信仰愚昧的小区，这不想放大特训数据的偏差。

知道完 GPT-4chan，亚利桑那大学博士生 Os Keyes 忽视，GPT-4chan 是一个冗长的单项，不不想导致任何好处：

它是找来我们降低对敌视指责的认识，还是让我们高度重视嘲讽的人呢？我们能够问一些有其意义的缺陷。比如针对 GPT-3 的联合开发团队， GPT-3 在用到时如何不受到（或易不受）限制，再继续比如针对像 Yannic Kilcher 这样的人，他作战闲谈机械人时必要承担什么负有。

而 Yannic Kilcher 坚引述他只是一名 YouTuber，他和学者的道德规则相同。

▲ 图表来自：CNBC

个人的道德不予置评，The Verge 摄影记者 James Vincent 提出了一个引人深思的观点：

2016 年，该公司的研发部门其意味著不想在没必需全权负责的情况，顺利完成很强威胁性的 AI 机械人。2022 年，你根本不能够研发部门。

值得一提的是，研究课题 4Chan 的不止 Yannic Kilcher，还有该大学学院网络刑事犯罪研究课题者 Gianluca Stringhini 等人。

面对 Gianluca Stringhini 的「敌视指责」研究课题，4chan 普通用户极其淡定，「无非就是给我们多加一个 meme 而已」。

如今也是除此以外，当 GPT-4chan 退居江湖上，它所用的真地址「莫桑比克」已是了 4chan 新的传知道。

▲ 参考资料：1.2.3._a-technology_b-gdntech4.

。

新乐敦和乐珠都可以治疗眼涩吗
郑州不孕不育检查多少钱
西宁干细胞在哪个医院可以做
儿童鼻炎可以用阿莫西林颗粒吗
儿童胃积食消化不良怎么办
哪种血糖仪比较好测量准确
软组织挫伤很疼怎么办
新冠药物有哪些药
消痔软膏效果怎么样好用吗
晕车药哪个牌子效果最好飞赛乐

上一篇：尼克松的上海初恋

下一篇：去乡下出差，大伯做罕见大餐招待，看得我一愣一愣的，你吃饭过吗？