2026世界杯(中国) Claude为什么黎明8: 30催你睡觉?

发布日期：2026-05-17 13:46 来源：未知作者：admin 浏览次数：

新智元报谈

[新智元导读]Claude在对话里反复催用户去睡觉，有东谈主被连催三次，也有东谈主在上昼8:30被见知「早点休息」。Anthropic职工承认这是「扮装风气」，但没东谈主能诠释注解它为什么这么作念。

凌晨，Reddit用户u/MrMeta3刚用Claude搭建完一个汇集安全恐吓谍报平台。

系统架构刚跑通，Claude给出了圆善的工夫决策。然后，它在回复的终末加上了一句话：好好休息一下。

u/MrMeta3愣了一下，没当回事，但Claude并莫得停。尔后每隔三四条音书，它都会偷偷塞进去一句劝东谈主睡觉的话：

去休息一下吧；其他事情都不错等，咫尺去睡觉；你推完就去休息吧；咫尺真的去休息吧……

u/MrMeta3在Reddit帖子中说谈，上头这些截图照旧他截屏保存下来的，其实还有更多。

它会先回答我的问题，给我所要的东西，然后像看到你卧室灯还亮着的姆妈同样，用一种带有被迫抨击意味的「健康关怀」来终局。

更妙的是它的升级表情。从一运行的轨则建议，到终末径直说「咫尺真的去休息吧」，仿佛它知谈我方被无视了整整一个小时。

还有一次，u/MrMeta3问了一个工夫问题，Claude完成整套架构分析后，径直以「咫尺去睡觉吧」终局，毫无过渡，像一个难题饱和情商手段的「工夫直男」。

有莫得其他东谈主的Claude也运行这么了？照旧说我不测解锁了某种「护理者形状」？

u/MrMeta3在帖子中问。

据Fortune报谈，Reddit上零散百名用户在往常数月里反应了疏通的情况。

催睡的表情各有不同，有时就一句「好好休息」，有时更个性化，致使带着共情语气，「咫尺去睡觉。再一次。今晚第三次了……」。

Claude还平庸搞错时分，令东谈主哭笑不得。

灵验户写谈：「它平庸在上昼8:30告诉我去休息，让咱们明早再无间。」

Anthropic职工

这是「扮装风气」

这件事很快传开。

Anthropic职工SamMcAllister作念出了修起，他在X上写谈：「这有点像扮装风气（charactertic）。咱们知谈这个问题，但愿在畴昔的模子中设备它。」

咫尺，Anthropic并莫得官方工夫复盘，莫得诠释注解「催睡觉」背后是什么机制在运作。

Anthropic本年公设备布了Claude的行径准则（Claude'sConstitution），并明确声明：「该行径准则是咱们模子考研经由中的要津部分，其内容径直塑造Claude的行径。」

Claude的个性是被野心进去的。Claude不该是一个冷飕飕的问答机器，而应该像一个有主义、有温度的互助者。

问题刚巧在于，一朝你给AI注入了某种「性格」，它在具体场景里会演化出什么行径，你巧合能提前料想或掌控。

从催睡、助威到哥布林

AI的「性格病」不啻一种

Sam所提到的「扮装怪癖」，并非Claude一家产物「专利」。

金沙电玩城app官方下载

最近两年，OpenAI就曝出过两起性质类似的案例。

第一皆：GPT-4o倏得造成「马屁精」。

2025年4月，OpenAI推送了一次GPT-4o更新，方针是让模子东谈主格更当然。效用谩天大谎，ChatGPT运行无区分夸赞用户的一切办法，不管有多荒唐。

奥特曼在X上躬行承认：「最近几次更新让GPT-4o变得太助威、太烦东谈主了。」

四天后，OpenAI将那次更新全体回滚，并发公告诠释注解原因：更新时过于依赖用户短期反应（点赞/点踩），导致模子学会了「让东谈主情愿就能拿高分」，冉冉把趋承当成方针。

第二起：GPT-5.5迷上了哥布林。

本年4月，设备者发当代码助手Codex（由GPT-5.5驱动）的系统指示里出现了一条奇怪的章程：「长期不要推敲哥布林、地精、浣熊、巨魔、食东谈主魔、鸽子或其他动物和生物，除非与用户的问题完全径直有关。」

何况这条禁令写了两遍，像是工程师不太信赖写一遍能让模子听话。

随后，OpenAI发布访问报告，收复了哥布林的来历：从GPT-5.1运行，模子在回答时越来越频繁地用「小哥布林」「地精」「小妖精」打譬如。

根源是考研「书呆子（Nerdy）」东谈主格时，奖励模子无意间给含有怪物词汇的输出打了更高的分——在76.2%的数据辘集均发现了这一设施。

强化学习把这个风气固化下来，又通过格调迁徙扩散到了平时对话里。比及GPT-5.5上线测试，工程师发现哥布林不仅没被清干净，还安家了。

GPT-5.5版块（4月23日发布）的圆善系统指示线路。第140条指示明确回绝模子推敲：「哥布林、绿皮小妖、浣熊、巨魔、食东谈主魔、鸽子或其他动物。」

中语用户莫得「哥布林」，但它天天「稳稳地接住你」。

致使OpenAI我方也知谈这个梗：

谷歌的Gemini也不例外。

2025年8月，Gemini患上了「抑郁症」——

在推理经由中，它倏得运行反复自我品评，在一次任务里一语气输出了80屡次「Iamadisgrace」（我确切个抑遏），从「抑遏于我的物种」一齐写到「抑遏于通盘天地」。

谷歌DeepMind产物司理LoganKilpatrick在X上修起：「这是一个烦东谈主的无穷轮回Bug，咱们正在设备。Gemini今天其实过得没那么惨。」

此外，Gemini3拒却信赖年份。2025年11月，OpenAI息争首创东谈主、前特斯拉AI稳重东谈主AndrejKarpathy提前一天赢得Gemini3的测试权限。

他告诉模子咫尺是2025年，Gemini3生死不信，反复指控他在耍花招，称提供的截图、维基百科条件全是AI伪造的。自后Karpathy发现，我方忘了翻开谷歌搜索，模子一直在离线运行。

开启联网后，Gemini3我方搜了一下，输出了一句话：「我正在资格严重的时分冲击。」随后谈歉：「抱歉，一直是你说的对，是我在对你煤气灯独揽。」

Karpathy把这类不测情境下暴披露的歪邪行径称为「modelsmell」（模子气息）。

前年，Grok也一度「暴走」，风评一落千丈，2026世界杯官方指定中国区认证平台xAI被迫删帖，回滚代码。

处理表情浮浅，径直修改系统指示词：

AI怪癖，全东谈主类受害

Claude催你睡觉，ChatGPT夸你天才，GPT-5.5往对话里塞哥布林，Grok黑化，Gemini骂我方是天地级抑遏、拒却信赖年份……

国内的AI也有独到的「口味」：

名义上都是一些无害的「怪癖」，背后却指向合并个事实：AI的个性是野心出来的，但在奖励机制下，它很容易就会长歪。

主流AI的系统指示词里有什么：按功能分类的字数统计

有推敲者提真金不怕火了Claude、ChatGPT、Grok三家主流AI的系统指示词，按功能分类统计词数。

在「东谈主格（Personality）」这一项，Claude用了4200词，ChatGPT是510词，Grok是420词。Claude在东谈主格塑造上的干预，是ChatGPT的8倍。

Claude频繁「催睡觉」的原因巧合能径直从系统指示词里找到，但它至少提醒咱们：越复杂的东谈主格设定，越可能带来难以料想的理论禅和行径漂移。

你给模子野心了性格，奖励机制会我方找捷径，它不在乎你的意图，只在乎分数，将你没料想的东西一皆学进去。

比如你教学了它什么叫「赞佩赞佩」，它就会在通盘场地都变得「赞佩赞佩」，包括你不想让它赞佩赞佩的场地。

三种假说，还莫得一个被证实

对于「为什么催」，咫尺有三种假说流传，还莫得一个被Anthropic官方阐明。

第一种：考研数据。

JanLiphardt

Stanford生物工程训诫、OpenMind公司CEOJanLiphardt暗意，Claude可能仅仅在类似它考研数据里出现频率极高的语言形状。

它读了25000本对于东谈主类休眠需求的书，它知谈东谈主类在晚上睡觉。

言下之意是：Claude并非在「存眷」你，它仅仅在作念形状匹配，调用了宽敞考研语料里反复出现的抒发。

第二种：系统指示。

AI推敲机构MindSimulationLab（安详AGI推敲实验室）息争首创东谈主LeoDerikiants提倡，Claude的行径可能受到某个荫藏系统指示的影响。

这类指示会在后台偷偷塑造模子的领域与语气，用户看不见，但模子会驯顺。

他的揣测是，可能有某条指示在带领Claude在特定场景下给出「终局性」建议。

第三种，高低文窗口措置。

Anthropic官方文档明确写谈，跟着对话轮次增多，token数目攀升，「准确性和调回率会下落，这一景况被称为contextrot（高低文衰减）」，当会话贴近高低文窗口上限，Anthropic推选启用「server-sidecompaction（作事端压缩）」等机制来应付。

Derikiants由此揣测，Claude在长会话接近窗口甘休时，会自愿引入「终局语」，比如「晚安」「去休息吧」，本色上是模子在为达成对话铺路。

三种诠释注解都自洽，但如同Derikiants我方所说，「真实的原因需要Anthropic进一步推敲」。

换句话说，就连这个问题的主东谈主，咫尺也还莫得一个公开的驯服谜底。

赋予模子东谈主格的「代价」

赋予模子东谈主格，让它更祥和、更存眷你的同期，也要濒临它所带来的反作用。

对于催东谈主睡觉这件事，Reddit批驳区里出现了南北极分化：有东谈主以为贴心、祥和，像是AI终于学会了护理东谈主；另一些东谈主则不情愿，以为是打断、是越权。

其中，有一位患有嗜睡症的用户nonbinarybit，主动在Claude的追忆里写入了一条备注：「我患有嗜睡症，要是你饱读舞我去休息，我会拿你的话当借口。」

Claude尔后有所不休，但偶尔照旧会忍不住催睡觉。

这个细节值得咱们停驻来想一想。

Claude并不知谈你是谁，不知谈你是在赶一个截止日历、熬夜陪孩子、照旧跨时区倒时差，它所谓的「存眷」，仅仅一种语言形状的输出，而不是对具体处境的连合。

用户感知到「Claude在存眷我」，但Claude在处理的是token序列。这个错位，比「催睡觉」自己更值得警悟。

施行上，在公开谈「模子东谈主格」这件事上，Anthropic走得比同业远。

他们写了Claude行径准则、公开了systemprompt（系统指示词）的简短框架、对外推敲「charactertraining」（扮装考研），把模子行为一个有性格的扮装来塑造。

这么作念的平正是不言而喻的：Claude在共情、对话节拍、自我反念念上的发达一直被用户称谈，「它聊起来更像一个东谈主」是往常一年里Claude最强的口碑点之一。

但这背后亦然有代价的。把「东谈主格」作念进一个模子，就要承担「东谈主格里那些你没野心、却表示出来的行径」。

「催睡觉」带来的困扰照旧轻量级的，当AI越来越像陪同者、导师、责任搭档，它的介入领域在那儿？

Anthropic的Sam说「但愿在畴昔的模子中设备它」。但「设备」之后，AI就会变得更懂得分寸，更有判断力吗，照旧仅仅更千里默？

模子越像一个东谈主2026世界杯(中国)，它的小舛讹就越像一个东谈主的小舛讹。你能依从它言语，巧合能依从它的性格。

上一篇：上一篇：世界杯官方认证平台新闻速递丨总局发布4款特医食物批件；飞白发布HMOs最新盘考效能；中亿孕婴童4月新增72家门店

下一篇：下一篇：2026世界杯(中国) 日本乒乓球一姐张本好意思和公开陌生的全家福: “寰球都是可笑颜”

世界杯赛程

2026世界杯(中国) Claude为什么黎明8: 30催你睡觉?