AI で実現する、納得感のあるエンジニア評価のあり方¶
問題: DORA 指標の限界¶
GameWith では delivery 健全性を DORA/Four Keys で測ってきた。しかし一定水準を超えると「維持」が目標になり、品質維持のためのリファクタリングや技術改善が外から見えにくくなる課題がある。
AI 導入がさらにジレンマを強める¶
AI を使いこなすエンジニアは、一人で複数タスクを並行し、設計・AI 生成・レビュー待ちを複数回す。組織全体のスループットは上がるが、個別タスクの完了期間が伸びることがある。DORA では評価しにくい。
AI 見積もりを評価に組み込む¶
| 評価軸 | 内容 |
|---|---|
| 見積もり / 実工数による改善率 | AI が客観的見積もりを出し、実工数との差で努力を可視化 |
| エンジニア組織外への説明可能性 | ビジネス側に改善をどう伝えるか |
| 作業ログの言語化 | 「書かれていない作業は存在しない」という品質の強制 |
メトリクスフロー¶
(図: SVG)