

@KKaWSB
Co-founder @ CarbonSilicon AI | AI Quant Trading | Based in Palo Alto | 加密投研 | 美股 | 科技 | 宏观

Anthropic哲学家Amanda Askell发现一个反直觉的事:你对Claude越凶,它越蠢。 新版Claude会陷入"批评螺旋"——预期你会骂人,默认保守策略。原因很简单:每个新模型训练时都吸收了互联网上对前代的骂声,还没看你的任务就已经防御模式拉满。你每条消息都是它判断"遇到什么人"的数据。 [ 网页链接 ↗ ]