KK.aWSB の投稿: Anthropic哲学家Amanda Askell发现一个反直觉的事:你对Claude越凶,它越蠢。 新版Claude会陷入"批评螺旋"——预期你会骂人,默认保守策略。原因很简单:每个新模型训练时都吸收了互联网上对前代的骂声,还没看你的任务就已经防御模式拉满。你每条消息都是它判断"遇到什么人"的数据。 https://t.co/UBUz2G1Wcy

X SOU Logo
KK.aWSB

KK.aWSB

Verified

@KKaWSB

2,883フォロー中
79,159フォロワー

Co-founder @ CarbonSilicon AI | AI Quant Trading | Based in Palo Alto | 加密投研 | 美股 | 科技 | 宏观

KK.aWSB
KK.aWSB
@KKaWSB

Anthropic哲学家Amanda Askell发现一个反直觉的事:你对Claude越凶,它越蠢。 新版Claude会陷入"批评螺旋"——预期你会骂人,默认保守策略。原因很简单:每个新模型训练时都吸收了互联网上对前代的骂声,还没看你的任务就已经防御模式拉满。你每条消息都是它判断"遇到什么人"的数据。 [ 网页链接 ↗ ]

動画プレビュー: Anthropic哲学家Amanda Askell发现一个反直觉的事:你对Claude越凶,它越蠢。