240. 开启AI狼人杀!(1 / 2)
不知不觉当中,时间来到了14年9月初。
距离孟繁岐在韩国首尔宣布通用对话智能已经三月有余,距离openAI成立,也已经有两个月之久了。
这段时间当中,似乎技术短暂地进入了停滞期,除了一些跟进式修修补补的工作之外,AI界没有什么大动静。
不过孟繁岐的这个核心小团体却很清楚,有趣的事情马上就要开始了。
语言方面,初版的bERt和Gpt已经训练完成,图像方面,换脸的技术也已经逐渐接近成熟。
“语言生成,图像换脸和语音生成都已经稍微像点样子了,不过怎么去发布,还是有点讲究的。”经历过上次人机大战之后,孟繁岐已经深刻体会到了,直接发论文公开代码,其实关注度会大打折扣。
得让普通民众参与进来,以一种大家都可以理解的形式进行。
这一次,孟繁岐就准备逐一发布,先以文本模型模仿人类的能力作为噱头引发关注,有了大量关注度之后再继续放出后续的换脸和声音合成技术。
就如同上次人机大战一样。
“不过你确定bERt和Gpt真的能够潜伏在群聊当中而不被人识别出来吗?”稍微看了一些bERt模型和Gpt模型的回复之后,路易斯和克莱尔两人对这个计划能否奏效非常怀疑。
初版的bERt和Gpt方法已经基本完成了,孟繁岐于一两周前提出了这样一个设想,组织一个一两百人左右规模的群聊,让大家在里面畅所欲言的聊天。
待得三四天后,再告诉他们,其实人群当中混入了一个数字生命。
“这其实就是一种另类的图灵测试,一般来说,进行图灵测试的人,会试图分辨与自己对话的到底是机器还是人类。可是通常来说,人类是不会进入图灵测试状态的。”
孟繁岐指的是,在大多数情况下,人类是不会怀疑与自己进行对话的究竟是人类还是机器。
“一个人到底是不是处于图灵测试状态,他的思维模式很可能会产生非常巨大的变化,因此我们这其实是一个多阶段的测试。”
“第一阶段,我们在公布存在数字生命之后,让用户在一两分钟内,就必须凭记忆和感觉做出回答和预测。”
“第二阶段,我们允许他们仔细翻阅这几天的聊天记录,给他们24小时的时间,让他们深思熟虑后做出猜测。”
“第三阶段,我们允许所有人彼此之间讨论交流,看看他们能不能在一两天之内,讨论出一个比较靠谱的结果。”
“我们倒不是觉得这个流程有什么问题,这个阶段设置还是非常科学的。关键是现在bERt和Gpt的语言对话能力,好像显得太过笨比了一些。”路易斯和克莱尔大量阅读了一些机器回复,觉得但凡是脑子正常的人,都可以很轻松地辨别出来这两个机器人。
“你们被知识诅咒了。由于你们知道到底谁是AI,因此不免会过于关注AI的回复,并且任何蛛丝马迹都会加剧你们的怀疑和猜测,实际上是带着答案找问题。”
韩辞掏出一张没有标注AI的聊天记录,让路易斯和克莱尔去分辨到底哪些是AI发布的,两人自信满满地迅速给出了自己的答复,却被韩辞告知,这张聊天记录里其实根本没有AI。
“我们评判AI的时候,总是以一种非常严格的标准去评价,但实际上在聊天群和互联网里,智商和言论让人震惊的情况是非常常见的。”
韩辞是八月底来到硅谷的,自上次西尼会议结束,分别之后。韩辞犹豫了良久,最终还是选择了来到斯坦福交换。