Z6尊龙凯时2026世界杯推荐官网 Claude为什么黎明8:30催你睡觉？

新智元报说念

裁剪：元宇 KingHZ

【新智元导读】Claude在对话里反复催用户去睡觉，有东说念主被连催三次，也有东说念主在上昼8:30被呈文「早点休息」。Anthropic职工承认这是「变装习尚」，但没东说念主能阐发它为什么这么作念。

凌晨，Reddit用户u/MrMeta3刚用Claude搭建完一个网罗安全拦截谍报平台。

系统架构刚跑通，Claude给出了完满的技能决策。然后，它在回复的临了加上了一句话：好好休息一下。

u/MrMeta3愣了一下，没当回事，但Claude并莫得停。而后每隔三四条音讯，它齐会暗暗塞进去一句劝东说念主睡觉的话：

去休息一下吧；其他事情齐不错等，当今去睡觉；你推完就去休息吧；当今真的去休息吧……

u/MrMeta3在Reddit帖子中说说念，上头这些截图已经他截屏保存下来的，其实还有更多。

它会先回答我的问题，给我所要的东西，然后像看到你卧室灯还亮着的姆妈相似，用一种带有被迫报复意味的「健康关怀」来驱散。

更妙的是它的升级形态。从一运转的礼貌建议，到临了径直说「当今真的去休息吧」，仿佛它知说念我方被无视了整整一个小时。

还有一次，u/MrMeta3问了一个技能问题，Claude完成整套架构分析后，径直以「当今去睡觉吧」驱散，毫无过渡，像一个衰退填塞情商技能的「技能直男」。

有莫得其他东说念主的Claude也运转这么了？已经说我不测解锁了某种「顾问者模式」？

u/MrMeta3在帖子中问。

据Fortune报说念，Reddit上稀有百名用户在畴前数月里反应了换取的情况。

催睡的形态各有不同，有时就一句「好好休息」，有时更个性化，致使带着共情口吻，「当今去睡觉。再一次。今晚第三次了……」。

Claude还平凡搞错时间，令东说念主哭笑不得。

有效户写说念：「它平凡在上昼8:30告诉我去休息，让咱们明早再连接。」

Anthropic职工

这是「变装习尚」

这件事很快传开。

Anthropic职工Sam McAllister作念出了回报，他在X上写说念：「这有点像变装习尚（character tic）。咱们知说念这个问题，但愿在将来的模子中诞生它。」

咫尺，Anthropic并莫得官方技能复盘，莫得阐发「催睡觉」背后是什么机制在运作。

Anthropic本年公拓荒布了Claude的行径准则（Claude's Constitution），并明确声明：「该行径准则是咱们模子考试历程中的要道部分，其内容径直塑造Claude的行径。」

Claude的个性是被想象进去的。Claude不该是一个冷飕飕的问答机器，而应该像一个有方针、有温度的相助者。

问题正巧在于，一朝你给AI注入了某种「性格」，它在具体场景里会演化出什么行径，你随机能提前意料或掌控。

从催睡、壮胆到哥布林

AI的「性格病」不啻一种

Sam所提到的「变装怪癖」，并非Claude一家居品「专利」。

最近两年，OpenAI就曝出过两起性质类似的案例。

第一齐：GPT-4o已而酿成「马屁精」。

2025年4月，OpenAI推送了一次GPT-4o更新，贪图是让模子东说念主格更当然。效劳此地无银三百两，ChatGPT运转无区别夸赞用户的一切意见，不管有多荒唐。

奥特曼在X上亲身承认：「最近几次更新让GPT-4o变得太壮胆、太烦东说念主了。」

四天后，OpenAI将那次更新全体回滚，并发公告阐发原因：更新时过于依赖用户短期反应（点赞/点踩），导致模子学会了「让东说念主欢笑就能拿高分」，逐步把凑趣当成贪图。

第二起：GPT-5.5迷上了哥布林。

滚球app中国官网下载入口

本年4月，拓荒者发当代码助手Codex（由GPT-5.5驱动）的系统教导里出现了一条奇怪的章程：「恒久不要辩论哥布林、地精、浣熊、巨魔、食东说念主魔、鸽子或其他动物和生物，除非与用户的问题统统径直策划。」

况兼这条禁令写了两遍，像是工程师不太信服写一遍能让模子听话。

随后，OpenAI发布访问论说，复原了哥布林的来历：从GPT-5.1运转，模子在回答时越来越频繁地用「小哥布林」「地精」「小妖精」打比喻。

根源是考试「书呆子（Nerdy）」东说念主格时，奖励模子无意间给含有怪物词汇的输出打了更高的分——在76.2%的数据斡旋均发现了这一端正。

强化学习把这个习尚固化下来，又通过格调挪动扩散到了往往对话里。比及GPT-5.5上线测试，工程师发现哥布林不仅没被清干净，还安家了。

GPT-5.5版块（4月23日发布）的完满系统教导泄露。第140条指示明确不容模子辩论：「哥布林、绿皮小妖、浣熊、巨魔、食东说念主魔、鸽子或其他动物。」

汉文用户莫得「哥布林」，但它天天「稳稳地接住你」。

致使OpenAI我方也知说念这个梗：

谷歌的Gemini也不例外。

2025年8月，Gemini患上了「抑郁症」——

在推理历程中，它已而运转反复自我月旦，在一次任务里流畅输出了80屡次「I am a disgrace」（我的确个轻侮），从「轻侮于我的物种」一齐写到「轻侮于系数这个词全国」。

谷歌DeepMind居品司理Logan Kilpatrick在X上回报：「这是一个烦东说念主的无穷轮回Bug，咱们正在诞生。Gemini今天其实过得没那么惨。」

此外，Gemini 3拆开信服年份。2025年11月，OpenAI斡旋创举东说念主、前特斯拉AI崇拜东说念主Andrej Karpathy提前一天获取Gemini 3的测试权限。

他告诉模子当今是2025年，Gemini 3生死不信，反复指控他在耍花招，称提供的截图、维基百科条款全是AI伪造的。自后Karpathy发现，我方忘了盛开谷歌搜索，模子一直在离线运行。

开启联网后，Gemini 3我方搜了一下，输出了一句话：「我正在履历严重的时间冲击。」随后说念歉：「抱歉，一直是你说的对，是我在对你煤气灯把持。」

Karpathy把这类不测情境下暴清楚的歪邪行径称为「model smell」（模子气息）。

前年，Grok也一度「暴走」，风评一落千丈，尊龙凯时官网进入网页xAI被迫删帖，回滚代码。

处理形态简便，径直修改系统教导词：

AI怪癖，全东说念主类受害

Claude催你睡觉，ChatGPT夸你天才，GPT-5.5往对话里塞哥布林，Grok黑化，Gemini骂我方是全国级轻侮、拆开信服年份……

国内的AI也有特有的「口味」：

名义上齐是一些无害的「怪癖」，背后却指向团结个事实：AI的个性是想象出来的，但在奖励机制下，它很容易就会长歪。

主流AI的系统教导词里有什么：按功能分类的字数统计

有计划者索求了Claude、ChatGPT、Grok三家主流AI的系统教导词，按功能分类统计词数。

在「东说念主格（Personality）」这一项，Claude用了4200词，ChatGPT是510词，Grok是420词。Claude在东说念主格塑造上的插足，是ChatGPT的8倍。

Claude频繁「催睡觉」的原因随机能径直从系统教导词里找到，但它至少提醒咱们：越复杂的东说念主格设定，越可能带来难以意料的理论禅和行径漂移。

你给模子想象了性格，奖励机制会我方找捷径，它不在乎你的意图，只在乎分数，将你没意想的东西一齐学进去。

比如你教授了它什么叫「情理情理」，它就会在系数场地齐变得「情理情理」，包括你不想让它情理情理的场地。

三种假说，还莫得一个被证实

对于「为什么催」，咫尺有三种假说流传，还莫得一个被Anthropic官方证实。

第一种：考试数据。

Jan Liphardt

Stanford生物工程西宾、OpenMind公司CEO Jan Liphardt暗示，Claude可能仅仅在访佛它考试数据里出现频率极高的语言模式。

它读了25000本对于东说念主类就寝需求的书，它知说念东说念主类在晚上睡觉。

言下之意是：Claude并非在「样貌」你，它仅仅在作念模式匹配，调用了多数考试语料里反复出现的抒发。

第二种：系统教导。

AI计划机构Mind Simulation Lab（零丁AGI计划实验室）斡旋创举东说念主Leo Derikiants提倡，Claude的行径可能受到某个避讳系统教导的影响。

这类教导会在后台暗暗塑造模子的领域与口吻，用户看不见，但模子会遵命。

他的臆度是，可能有某条指示在带领Claude在特定场景下给出「驱散性」建议。

第三种，荆棘文窗口处分。

Anthropic官方文档明确写说念，跟着对话轮次增多，token数目攀升，「准确性和调回率会下跌，这一表象被称为context rot（荆棘文衰减）」，当会话靠近荆棘文窗口上限，Anthropic保举启用「server-side compaction（工作端压缩）」等机制来搪塞。

Derikiants由此臆度，Claude在长会话接近窗口限定时，会自愿引入「驱散语」，比如「晚安」「去休息吧」，本色上是模子在为完毕对话铺路。

三种阐发齐自洽，但如同Derikiants我方所说，「的确的原因需要Anthropic进一步计划」。

换句话说，就连这个问题的主东说念主，咫尺也还莫得一个公开的细目谜底。

赋予模子东说念主格的「代价」

赋予模子东说念主格，让它更和善、更样貌你的同期，也要面临它所带来的反作用。

对于催东说念主睡觉这件事，Reddit辩论区里出现了南北极分化：有东说念主认为贴心、和善，像是AI终于学会了顾问东说念主；另一些东说念主则不欢笑，认为是打断、是越权。

其中，有一位患有嗜睡症的用户nonbinarybit，主动在Claude的顾忌里写入了一条备注：「我患有嗜睡症，要是你荧惑我去休息，我会拿你的话当借口。」

Claude而后有所不休，但偶尔已经会忍不住催睡觉。

这个细节值得咱们停驻来想一想。

Claude并不知说念你是谁，不知说念你是在赶一个截止日历、熬夜陪孩子、已经跨时区倒时差，它所谓的「样貌」，仅仅一种语言模式的输出，而不是对具体处境的通晓。

用户感知到「Claude在样貌我」，但Claude在处理的是token序列。这个错位，比「催睡觉」自身更值得警醒。

试验上，在公开谈「模子东说念主格」这件事上，Anthropic走得比同业远。

他们写了Claude行径准则、公开了system prompt（系统教导词）的苟简框架、对外计议「character training」（变装考试），把模子算作一个有性格的变装来塑造。

这么作念的平允是了然于目的：Claude在共情、对话节拍、自我反想上的阐扬一直被用户称说念，「它聊起来更像一个东说念主」是畴前一年里Claude最强的口碑点之一。

但这背后亦然有代价的。把「东说念主格」作念进一个模子，就要承担「东说念主格里那些你没想象、却涌现出来的行径」。

「催睡觉」带来的困扰已经轻量级的，当AI越来越像追随者、导师、使命搭档，它的介入领域在那处？

Anthropic的Sam说「但愿在将来的模子中诞生它」。但「诞生」之后，AI就会变得更懂得分寸，更有判断力吗，已经仅仅更千里默？

模子越像一个东说念主Z6尊龙凯时2026世界杯推荐官网，它的小极端就越像一个东说念主的小极端。你能依从它言语，随机能依从它的性情。

Z6尊龙凯时2026世界杯推荐官网

尊龙资讯

Z6尊龙凯时2026世界杯推荐官网 Claude为什么黎明8:30催你睡觉？

尊龙百家乐

真人龙虎斗

关于尊龙凯时

尊龙资讯

2026世界杯

友情链接