我问答网
有问必答

ChatGPT 写的东西假大空?这是人工智能的通病吗?

哎,说真的,你是不是也发现——让 ChatGPT 写个演讲稿、周报,出来的东西,读着特别像……怎么说呢,像领导开会念的稿子,正确,但毫无灵魂。每个词都好听,连在一起就让人犯困。这不是你一个人的错觉,我身边好多朋友都吐槽过,甚至有人直接开骂:这人工智能,怕不是人工智障吧?

那问题到底出在哪?咱们今天就掰扯掰扯。直接上那个扎心问答:

问:ChatGPT 写的东西为啥老是假大空?
答:因为它的内功心法就是从假大空的数据里炼出来的。

别急着反驳,往下看你就懂了。

🧠 它的大脑怎么长的?

先得明白这玩意儿的基本原理。ChatGPT 这类的语言模型,说到底就是个概率预测机器。你给它一个开头,它就去算,下一个词最可能是啥?再下一个呢?一步步铺开,一段话就出来了。它没有真正的理解,没有意图,更没有灵魂。它追求的是“最可能”,而不是“最真实”或者“最精彩”。就像让一个三好学生背课文,背得贼溜,但你要他即兴编个故事,完了,全是模范作文里的套话。

那“最可能”是基于啥?训练数据。它读过的网页、书、新闻、论坛帖子……可以说,整个互联网是它的食堂。但你想啊,互联网上什么最多?不是个人博客里那些灵光乍现的句子,而是公司官网的“赋能”、政府公报的“进一步落实”、营销号的“震惊了”。这些玩意儿数量庞大,四平八稳,又臭又长,把语言模型的审美直接带沟里去了。说实话,有时候我让它写点东西,读着跟《人民日报》海外版似的,真能把人气笑。

大语言模型训练数据中官方语料与口语化内容占比对比图
大语言模型训练数据中官方语料与口语化内容占比对比图

📚 喂它吃了什么,它就拉什么

有句话叫 garbage in, garbage out,用在这特别贴切。OpenAI 在训练 GPT 的时候,虽然对数据做了筛选,但骨子里的偏向改不了。维基百科的权重肯定高于 Reddit 的梗楼吧?新闻稿多于聊天记录吧?这就导致模型学到的“标准语言”是那种脱离真实烟火气的腔调。

更搞笑的是后来的人工反馈强化学习(RLHF)。想象一下:模型吐出一个回答,负责打分的人类评审觉得“嗯,不正确,太尖锐”,给了低分;另一个回答“非常抱歉给您带来了不便,我们将持续改进服务”,高分!你猜模型会往哪边优化?没错,它学会了讨好,学会了把棱角都磨平。久而久之,就成了一个无比安全、无比正确的假大空制造机。我有个朋友让 GPT 写一封给客户的道歉信,好家伙,出来的东西全是“我们深感愧疚”“您的反馈是我们前进的动力”——客户看了估计更火大,心想:你就不能说人话?

基于人工反馈的强化学习训练流程示意图
基于人工反馈的强化学习训练流程示意图

🤔 那它真的就只会打官腔吗?

也不是完全没救。你要是会玩,能逼出一些不一样的东西。比如在提示里加料:“请用最没礼貌、最口语化、带点脏话的风格解释相对论”——嘿,它还真能给你整一出街头物理。但这恰恰说明问题:它本质上还是在模仿,不是真懂。它的“创造力”取决于你给定的“越界”程度,一旦离开提示词的约束,立马缩回安全区。

有时候你会觉得它在糊弄,比如问一个专业问题,它煞有介事地编造参考文献,人物都能凭空捏造。这就是所谓的“幻觉”。因为它的目标不是给出正确答案,而是生成像正确答案的东西。这毛病,目前看改不了,架构缺陷。

✨ 我们该怎么办?

认清现实,降级期待。别指望 AI 替你写出有血有肉的文章,它没流过泪,没挨过饿,没谈过恋爱,你让它怎么共情?把它当个超高速的搜索引擎加素材拼接器就行。写周报?让它先列个大纲,具体的事你自己填。写邮件?让它起头,你改得口语化一点。尤其是搞创作的,别让 AI 剥夺了你自己磕磕绊绊找到的那个独特句子的成就感。

而且,我真心想说:过度对齐不但没让模型变聪明,反而把它搞傻了。OpenAI 整天担心安全、偏见,结果弄出一个谁都不冒犯的完美哑巴。我怀念 GPT-3 刚出来那会儿,虽然也胡说八道,但有种愣头青的生猛感,现在呢?像个被驯服的公务员。哎。

说到底,它就是个镜子,照出我们自己的无聊和妥协。我们整天用模板、套话喂它,却怪它无趣。话说回来,偶尔让 AI 写点假大空的东西,或许也挺解压——你看,连机器都这么虚伪,我抱怨两句怎么了?对吧。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。如有侵权请联系删除。
文章名称:ChatGPT 写的东西假大空?这是人工智能的通病吗?
文章链接:https://www.wowenda.cn/a/52782.html