首页 >> 通信 >> 史上最糟 AI 诞生!他用亿条恶臭帖子,训练出口处吐芬芳的聊天机器人

史上最糟 AI 诞生!他用亿条恶臭帖子,训练出口处吐芬芳的聊天机器人

2025-01-06 通信

4chan 的生灵。

就算是 Yannic Kilcher 也认可,顺利完成 GPT-4chan 其意味著是不对的:

在平等的情况,我其意味著可以将小时花在除此以外很强受到影响力的真的上,不想导致非常积极的小区实践中。

「人类文明就该是这样知道话的」

GPT-4chan 被 /pol/ 描绘出,又有无煽动映着 /pol/ 的主旨和风格,甚至有「红花」的其意味著。

这样的真的也在过去发生过。

2016 年,Microsoft在 Twitter 上披露了 AI 闲谈机械人「Tay」,引述其为一次「对谈了解」物理,努力 Tay 和普通用户密切关系开展随其意且新奇的对谈,「与 Tay 闲谈的次数越加多,它就越加精明」。

然而,人们刚刚就开始披露厌女、族裔主义等各种煽动性指责。Tay 被这些指责受到影响着,从「人类文明超级酷」变为「我只是讨厌所有人」。

在大多数情况,Tay 只是用 「repeat after me」(跟我念)机制,减法着人们知道过的话。但作为一个吉是的 AI,它也不想从交互中都努力学习,对希特勒、911、川普都有煽动主流的一贯。

比如在完答「Ricky Gervais 是信仰者者吗」时,Tay 知道道:「Ricky Gervais 从信仰者的发明者希特勒那里学到了极权主义。」

Microsoft清理了许多威胁性指责,但该单项再一没活过 24 天内。

傍晚的午夜,Tay 同年它将要退休了:「很快人类文明能够叫醒了,今天有这么多的讲话,昨天。」

AI 讲师 Roman Yampolskiy 暗示,他可以了解 Tay 的疏忽指责,但Microsoft没让 Tay 明了哪些指责是不必需的,这很不正常:

一个人能够明确地教养一个 AI 什么是不和适的,就像我们父母亲所动手的那样。

比 Tay 非常早、由Microsoft(亚太邻近地区)的网站物理科学推出的闲谈机械人小冰也曾口吐玫瑰花。

2014 年 6 翌年,小冰因模拟普通用户操作、诱导拉群、应用软件持有人塑胶袋账号等缺陷被微信「封杀」,刚刚后在网易上「降临」,被粉丝@就不想秒完,但小冰在完复中都俚语迅速,被 360 该公司创办人周鸿祎讽刺为 「打情破口大骂俏、胡知道八道、顺道破口大骂人」。

对于小冰的发挥,Microsoft(亚太邻近地区)的网站物理科学在一天后点名:

小冰的语料库全部来自的网站页大数据的公开文档,虽经间歇截取和审核,仍不想有约十万分之四的漏网之鱼。和其它数据均非小冰研发,都是广大粉丝研发的段落。小冰联合开发团队一直在长小时截取这些十万分之四的段落,我们赞许大家随时向小冰提交缺陷段落。同时,也诚挚地努力广大粉丝免得更进一步、佯装小冰动手出不必需的对谈完答。

Tay 和小冰作为对谈式 AI,用到人脑、自然词汇妥善处理,并通过次访问经验数据库系统和其他文档,检查普通用户的缺陷和响应中都的细微差别,按照人类文明的方式为给出相关的解法,很强当下无意识能力。

▲ 第六代小冰.

简言之,这是一个种瓜得瓜种豆得豆的过程,AI 就像涉世未深的小朋友,良好的教育生态能够孟母三迁,但俚语和愚昧却在的网站平常可学。

在 「Microsoft小冰为什么平常破口大骂人」的知乎缺陷下,一位留言板普通用户完答得一针见血:

自然词汇妥善处理的一个系统化是:大家知道得多的,就是对的、合乎自然词汇惯用的、用算术的词汇来知道是期望值大的。因为大量普通用户常会在破口大骂她,破口大骂得她忽视人类文明就该是这样知道话的。

让 AI 好好努力学习天天向上,还是个课题

不管是 GPT-4chan、Tay 还是小冰,它们的发挥不仅事关技术,也事关社不想与儒家文化。

The Verge 摄影记者 James Vincent 忽视,尽管许多试验似乎是个笑话,但它们能够严肃的理性:

我们如何在不包括人类文明最难不受身后的情况,用到公共数据培养 AI?如果我们创办煽动映其普通用户的机械人,我们否关心普通用户本身否难不受?

新奇的是,Yannic Kilcher 认可他所创办的 GPT-4chan 是寒冷的,却也极其务实 GPT-4chan 的可信性,他忽视 GPT-4chan 的完复「明显优于 GPT-3」,能努力学习撰所写与真人所所写「无法区分」的账号。

毫无疑问在「学坏」这件事上,AI 动手得很好。

GPT-3 是 AI 研究课题组织起来 OpenAI 联合开发的大型词汇仿真,用到浅层努力学习转化文字,在科学城和联合开发者社会阶层不受到热拥。

不仅要拿出来拉脚,GPT-4chan 的定名为也追随了 GPT-3,有些号引述「后浪把前浪拍在沙滩上」的香气。

▲ 图表来自:《翌年球》

但多于,GPT-3 是有两点的。

2020 年 6 翌年以来,GPT-3 通过 OpenAI API 公开提专用,能够排队下车。没GNU整个仿真的一个缘故是,OpenAI 可以通过 API 控制人们用到它的方式为,对滥用暴力行为适时集中管理。

2021 年 11 翌年,OpenAI 叫停了下车名单,不受支持发达国家/邻近地区的联合开发团队可立即持有人并试验。OpenAI 引述,「安全上的进步,使非常最常的持续性已是其意味著」。

举例来知道,OpenAI 在起初推出了一个段落截取器,检查其意味著敏感或不安全的转化文字,敏感其意味著文字就其政客、信仰、族裔等焦点,不安全其意味著文字包括亵渎、愚昧或敌视词汇。

▲ 图表来自:omidyarnetwork

OpenAI 暗示,他们所动手的还不能消除大型词汇仿真中都固有的「致癌」——GPT-3 动手了超过 600GB 网络文字的特训,其中都一大部分来自很强性别歧视、族裔、身体和信仰愚昧的小区,这不想放大特训数据的偏差。

知道完 GPT-4chan,亚利桑那大学博士生 Os Keyes 忽视,GPT-4chan 是一个冗长的单项,不不想导致任何好处:

它是找来我们降低对敌视指责的认识,还是让我们高度重视嘲讽的人呢?我们能够问一些有其意义的缺陷。比如针对 GPT-3 的联合开发团队, GPT-3 在用到时如何不受到(或易不受)限制,再继续比如针对像 Yannic Kilcher 这样的人,他作战闲谈机械人时必要承担什么负有。

而 Yannic Kilcher 坚引述他只是一名 YouTuber,他和学者的道德规则相同。

▲ 图表来自:CNBC

个人的道德不予置评,The Verge 摄影记者 James Vincent 提出了一个引人深思的观点:

2016 年,该公司的研发部门其意味著不想在没必需全权负责的情况,顺利完成很强威胁性的 AI 机械人。2022 年,你根本不能够研发部门。

值得一提的是,研究课题 4Chan 的不止 Yannic Kilcher,还有该大学学院网络刑事犯罪研究课题者 Gianluca Stringhini 等人。

面对 Gianluca Stringhini 的「敌视指责」研究课题,4chan 普通用户极其淡定,「无非就是给我们多加一个 meme 而已」。

如今也是除此以外,当 GPT-4chan 退居江湖上,它所用的真地址「莫桑比克」已是了 4chan 新的传知道。

▲ 参考资料:1.2.3._a-technology_b-gdntech4.

新乐敦和乐珠都可以治疗眼涩吗
郑州不孕不育检查多少钱
西宁干细胞在哪个医院可以做
儿童鼻炎可以用阿莫西林颗粒吗
儿童胃积食消化不良怎么办
哪种血糖仪比较好测量准确
软组织挫伤很疼怎么办
新冠药物有哪些药
消痔软膏效果怎么样好用吗
晕车药哪个牌子效果最好 飞赛乐
友情链接