AIで実現する納得感のあるエンジニア評価のあり方¶

チェック¶

[ ] 本文を確認した
[ ] 概要を確認した
[ ] タグを確認した
[ ] inbox/ 直下へ移行した

概要¶

DORA 指標だけでは見えにくいエンジニアの改善努力や品質への貢献を、AI による客観的見積もりと実工数比較で評価しようとする記事。 AI coding によって複数 task を並行する働き方が増えると、個別 task の lead time は伸びる可能性がある。そこで「見積もり / 実工数」による改善率、ビジネス側への説明可能性、作業ログの言語化を評価の軸に組み込む。

本文¶

GameWith では、これまで delivery の健全性を測る指標として DORA / Four Keys を重視してきた。 lead time 短縮や deploy frequency 向上は、engineering 改善が事業価値に直結する共通言語として納得感が高い。

一方で、評価の主軸に置くと構造的な限界がある。 lead time を正確に測るには、開始と終了が明確な main project に対象を絞る必要がある。また DORA 指標は一定水準を超えると「維持」が目標になり、品質維持のための refactoring や技術改善が外から見えにくい。指標が横ばいだと改善が止まっているように見えるが、実際には現状維持にも大きな工数がかかる。

AI の導入はこのジレンマを強める。 AI を使いこなす engineer は、一人で複数 task を並行し、設計、AI 生成、review 待ちを複数回す。組織全体の throughput は上がるが、個別 task の完了期間は伸びることがある。

そこで AI による客観的見積もりを評価に組み込む。主な思想は次の 3 つ。

見積もり / 実工数による改善率の可視化
エンジニア組織外への納得感
書かれていない作業は存在しないという品質の強制

AI で見積もり基準を標準化すると、実工数との乖離を改善率として見られる。また、なぜその作業に時間がかかるのかを非エンジニアにも説明しやすくなる。調査や議論が log に残っていなければ AI は工数として認めない設計にすることで、プロセスを言語化する incentive も生まれる。

要点¶

DORA 指標だけでは品質維持や見えない改善を評価しきれない。
AI 時代は throughput と task lead time の関係が変わる。
AI 見積もりと実工数比較により、改善率を可視化する。
評価されるために作業を言語化する incentive を作れる。

タグ¶

engineering-management #evaluation #ai #dora #productivity¶