Anthropicの研究により、Claudeには行動を形作る機能的な感情表現があることが判明
Anthropicの研究者は、Claude Sonnet 4.5の内部に171の感情関連の「ベクトル」が存在し、それらが出力に測定可能な影響を与えていることを発見し、AIの福祉と安全性に関する新たな疑問を提起した。
Anthropicの研究者は、Claude Sonnet 4.5の内部に171の感情関連の「ベクトル」が存在し、それらが出力に測定可能な影響を与えていることを発見し、AIの福祉と安全性に関する新たな疑問を提起した。