報酬を与えすぎた組織は、必ず壊れる

ーモンテズマの復讐が暴いた“賢さ”の設計ミスー
うまく回っているはずの組織が、ある日突然、判断不能になる。
AIも、人も、数字もそろっている。
それでも「誰も決められない」「誰も責任を取れない」。
この症状に、見覚えはないでしょうか。
それは能力不足ではありません。
設計ミスです。
しかも、多くの場合、その原因は
「善意で与えた報酬」にあります。
なぜ“賢くしたはず”なのに壊れるのか
強化学習の世界に、Montezuma’s Revengeという有名なゲームがあります。
このゲームは、AI研究者にとって悪夢として知られています。
理由は単純。
ほとんど報酬が与えられない。
正しい行動をしても、すぐには点が入らない。
探索し、失敗し、沈黙に耐えない限り、前に進めない。
多くのAIは、ここで止まる。
人間の組織も、まったく同じ構造で止まる。
組織における「擬似報酬」という麻薬
KPI、評価指標、進捗レポート、短期成果。
本来は意思決定を助けるはずのものが、いつの間にか目的になる。
・数値が出る行動だけが正義になる
・本質的だが不確実な判断は避けられる
・探索よりも「説明しやすさ」が優先される
これは合理的な行動です。
設計がそうなっているから。
強化学習で言えば、これは擬似報酬。
擬似報酬を与えすぎた知性は、必ず報酬ハックを始める。
世界を良くする行動ではなく、
評価を最大化する行動に最適化される。
AI導入で起きている“静かな破綻”
AIの現場でも同じことが起きています。
・精度◯%という単一指標
・短期ROIだけの評価
・「当たっているからOK」という判断
これらはすべて擬似報酬です。
結果どうなるか。
事故が起きた瞬間、
そのAIは使えなくなる。
理由は簡単で、
誰が判断し、誰が責任を負ったのかが設計されていないから。
AIが危険なのではありません。
設計が危険なのです。
モンテズマの復讐が突きつける問い
このゲームが示している本質は、たった一つ。
報酬が見えない時間に、探索を続けられるか。
・すぐに成果が出なくても判断できるか
・数値がなくても、決断を引き受けられるか
・失敗しても「なぜそうしたか」を説明できるか
これができない知性は、
どれだけ賢くても、どれだけ資源があっても、
必ず壊れる。
経営とAIにとっての結論
AI導入の成否は、技術の問題ではありません。
判断と責任を、報酬より先に設計しているか。
ここを外した瞬間、
AIは武器ではなく、
経営者個人に跳ね返るリスクになります。