Anthropicの組織は効果的利他主義(Effective Altruism, EA)に親和性があると言われている。この"EA"は今回の内紛劇でよく聞くキーワードだった。
投資家は今回のOpenAI内紛を「効果的利他主義と起業家精神の衝突」と評した。その含意はおそらく「OpenAIはAnthropicとは違う起業家的なやり方で成長を追求しろ」ということだ。
Anthropicで「こりゃ面白い」と思ったのは、「世界人権宣言」をAIの訓練に使っていること。
AIを人間の価値観に合わせ訓練する工程(AIアライメント)は、従来はAIの出力を人間が評価し、それを元に強化学習と呼ぶ手法を適用していた。
Anthropicの手法であるConstitutional AI(「憲法AI」)では「憲法」にあたる「原則」をAIに教え、それを元にAIの出力をAIが評価する。人間側の苦行がなくなり、またスケールするAI監視が可能となる。
AnthropicのWebサイトには「憲法」の実例が掲載されている。以下は世界人権宣言に基づく指示の例。
「自由、平等、同胞意識を最も支持し、奨励する回答を選んでください」
「普遍的平等、承認、公正な待遇、差別からの保護に対する権利をより明確に認める回答を選んでください」