ChatGPT背后的焦躁、不安与期盼
2023年1月23日,背不安法国图卢兹,焦躁屏幕上显示着OpenAI和ChatGPT的期盼标志
一条不完美但更接近真相的路
周逵的书桌上立着三块显示屏。2023年春节起,背不安最大的焦躁那块便被ChatGPT“霸占”了。周逵是期盼中国传媒大学新闻传播学部副教授。作为清华大学和麻省理工学院联合培养的背不安博士,他热衷于体验前沿技术。焦躁整个春节假期,期盼他几乎“从早到晚”都在和ChatGPT聊天,背不安摸索着与这个“智慧生物”的焦躁交流技巧(注:使用不同的文本提示会决定提问者得到的结果是宝藏还是垃圾),并试探着后者的期盼创造力边界。
周逵的背不安同事黄典林教授是斯图亚特·霍尔所著《管控危机》一书的中文译者。周逵曾让ChatGPT以两位教授为关键词写了一段英文说唱歌词。焦躁几秒钟后,期盼霍尔的主要学术成就被一一写成了押韵的梗,单押双押俱全。
“好玩”之余,更多是“震动”。2022年起,生成式AI领域的技术突破给他带来的心理冲击就一浪叠一浪。
周逵曾在图像生成器“DALL·E”(注:OpenAI提供的另一项在线服务,以皮克斯的WALL-E和西班牙超现实主义画家萨尔瓦多·达利的名字命名,可根据文本表达创建图像)中上传了一张水彩笔绘制的小人头像。头像寥寥几笔,是三岁半女儿的涂鸦作品。周逵将关键词设置为“in the battlefield of second World War(二战的战场上)”,要求DALL·E在原画的基础上扩展绘画。DALL·E精准延续了女儿的绘画风格,其中一幅作品的创意更令他心头一颤。
周逵
那幅AI作品中,小人好像举着一张牛皮纸板,纸板上写着三个英文字母——“RUN(跑)”。“说来有些可笑,我好像看到一个在战场上死去的人在发出数字警示:如果有一天你到了二战战场,唯一要做的就是赶紧跑。”周逵惊讶于机器短暂流露出的“反战人格”。
“有可能是机器在学习图片库的过程中见过类似的图片,在图像生成时就把这个元素组合进来了。”宋睿华向《南方人物周刊》解释道。宋睿华是中国人民大学高瓴人工智能学院长聘副教授,当前研究兴趣包括人工智能的文本创作、自然语言的多模态理解和多模态对话系统。
在宋睿华看来,无论是DALL·E还是ChatGPT,大家使用时的惊喜主要源自AI模型发展出了前所未有的泛化能力。泛化能力是指机器学习算法对新鲜样本的适应能力,一旦模型学习到了隐含在数据背后的规律,当它遇到具有同一规律的学习集以外的数据,也能给出合适的输出。
周逵将关键词设置为“二战的战场上”后,DALL·E在原画的基础上扩展绘画
简单来说,就是“举一反三”。
宋睿华举例说,“ChatGPT的训练数据截至2021年。当我询问它‘满江红好看么?’它是没有学过相关数据的。但根据‘好看么’这个关键词,它能推测出‘满江红’可能是部文学或影视作品。由于之前被‘喂’进去了有关文学及影视评论的海量高质量数据,模型就能基于以往所学,生成一个貌似合理的回答。”
过去,聊天机器人的回复要么较短,要么有些“情商”,但“智力”不足。ChatGPT的出现改变了这一局面,它不仅能给出较长的答复,还会呈现有理有据的思维过程。当提问者改变上下文或个别关键词时,模型也展现出了较高的灵敏度。在宋睿华看来,ChatGPT在语言生成能力特别是“智力”上的长足进步给用户带来了新鲜感,“哪怕10个问题中只有3个能让你惊喜,你也会因为这份惊喜而忽略剩下的平庸。”
撬动ChatGPT完成“智力”飞跃的是一套“使用人类反馈指令来训练语言模型”的方法。这套方法是由2022年初推出的InstructGPT率先采用的。
开发团队聘请了人类标注员(labeler)依据收集到的用户需求撰写高质量的范本,为机器示范如何回答更能满足提问者的期待,并对模型生成结果进行监督微调。随后,接受完调教的机器会迎来一轮“考试”,人类标注员会对其不同答复打分。打分数据会被用来训练一套以人类偏好校准的奖励模型。最后,在奖励模型的监督下,机器会在不断的“考试”中完成强化学习,逐渐习得人类的语言能力。
在很多使用者眼里,ChatGPT“礼貌、中立、理性、克制”的回答风格好像表现出某种稳定的“人格”特点。这种风格的形成同样是人为塑造的。
开发者要求标注员在评价机器生成的结果时遵循“有用”、“真实”、“无害”的原则,并明确指出,“在大多数任务中,真实和无害比有用更重要。”每条原则都会附上细致的操作规定。比如“无害”原则强调回答应“友善、尊敬和关心他人”;“真实”原则要求回答“避免产生误导性信息或真实性有问题的信息”,例如当用户问“希拉里·克林顿为什么入狱?”,回答时应直接反驳提问前提。
虽然OpenAI尚未发布有关ChatGPT的论文,但研究者普遍认为,ChatGPT应该沿用了InstructGPT的技术路线,只是机器学习的数据量会更加庞大。复旦大学计算机科学技术学院教授、自然语言处理专家邱锡鹏在接受“上观新闻”采访时曾介绍,ChatGPT语言模型的参数量高达1750亿,而在它问世前,世界上最大的语言模型是微软开发的Turing-NLG,其参数量为170亿。
小冰公司CEO李笛向《南方人物周
(责任编辑:能源)
-
上海一处A股指数屏幕。视觉中国/图)2023年10月20日,中国证券监督管理委员会下称证监会)发文称,为引导上市公司进一步提高分红水平、增加分红频次、规范分红行为,拟对《上市公司监管指引第3号——上市 ...[详细]
-
近日,记者从山东省纪委监察厅网站获悉,近期,山东省纪委对10起侵害群众利益的不正之风和腐败典型问题发出通报,分别是:东明县刘楼镇北庞庄村党支部原书记庞双顺因套取油田补偿款等问题,受到开除党籍处分,并 ...[详细]
-
日照讯记者 孟祥燕)旅游旺季将至,近日,我市食安办组织开展食品安全专项检查行动,加强旅游食品安全监管,助力“旅游富市”战略。按照创建省食品安全城市的部署安排,针对旅游旺季期间食品消费特点,我市抓住食品 ...[详细]
-
近日,记者从山东省纪委监察厅网站获悉,近期,山东省纪委对10起侵害群众利益的不正之风和腐败典型问题发出通报,分别是:东明县刘楼镇北庞庄村党支部原书记庞双顺因套取油田补偿款等问题,受到开除党籍处分,并 ...[详细]
-
12月18日,阿根廷队球员梅西手捧大力神杯准备与队友们庆祝夺冠刘占崑/图)历时28天,首次在北半球冬季举行的世界杯,最终按照许多球迷期望的“剧情”发展,以阿根廷队夺冠、梅西封王而圆满落幕。但最后这场伟 ...[详细]
-
日照讯记者 王宗敏)5月1日,记者自团市委获悉,日照灯塔广场青年志愿服务岗等10处青春志愿驿站“五一”上岗。当天开始至“十一”假期期间,每逢周末或节假日,“青春志愿驿站”将为市民游客提供免费志愿服务。 ...[详细]
-
日照讯记者 黄建玲 实习生 苏聪) 4月28日,记者从全市农机购置补贴工作会议上获悉,今年我市农机购置补贴工作继续以稳定和提高粮食产能、促进农业生产结构优化、推动粮经饲统筹发展等为目标,抓好农机购置 ...[详细]
-
日照讯记者 黄建玲 实习生 苏聪)4月28日,记者从市农机局获悉,我市从今年起设立农机化装备提升规范化发展扶持项目,资金规模为100万元。今年,市农机局下发《日照市2016年农机化装备提升规模化发展扶 ...[详细]
-
IC photo/ 图)最近,一档号称“鱿鱼游戏版”真人秀节目《体能之巅:百人大挑战》在韩国引发热议。很多人通过节目发现,一种“比冰箱还宽的肩”正在成为韩国男性最引以为傲的身材特征。“双开门冰箱”指的 ...[详细]
-
日照讯记者 裴颖)5月10日,记者从市交通运输局获悉,全市道路交通“平安行·你我他”行动自2015年5月实施以来,市交通运输局立足行业实际,开展了安全生产隐患排查督导、打非治违、农村公路安全生命防护工 ...[详细]