Lessons from Building a First-Pass AI PRD Reviewer at Uber¶
チェック¶
- [ ] 本文を確認した
- [ ] 概要を確認した
- [ ] タグを確認した
- [ ]
inbox/直下へ移行した
概要¶
Uber が PM 向けに構築した AI PRD レビュアの学びをまとめた記事。 PRD の文章を整えるツールではなく、関連ドキュメント、過去実験、会議メモ、社内原則、メトリクス定義などを集めて、レビュー前の文脈不足や意思決定上の穴を見つける仕組みとして設計されている。 出力は、ローンチ準備度、観点別評価、重要な修正箇所、証拠付きの改善提案、優先アクションを含む scorecard。 AI の役割を、人間の判断を置き換えるものではなく、高コストなレビュー会議に入る前の成果物を強くするものとして位置づけている。
本文¶
記事は、PRD レビューの難しさを「PM の厳密さ不足」ではなく、意思決定に必要な文脈が広すぎる問題として捉える。 PRD には、未検証の市場規模仮説、隣接システムへの影響、二次効果、ポリシー上のリスク、過去に検証済みの類似仮説などが潜む。 それらの文脈は、docs、decks、dashboards、会議メモ、組織の記憶に散らばっているため、レビュー時に初めて発見されると手戻りが大きい。
Uber の PRD Evaluator は、PRD を入口に、リンクされた文書、関連する deck や meeting notes、過去実験、横断組織の artifacts、Uber 固有の原則やメトリクス定義を組み合わせ、ローンチ準備度を構造的に評価する。 目的は senior judgment を置き換えることではなく、レビュー会議に入る前に PRD の品質を上げ、避けられる穴を減らすこと。
ワークフローは 4 段階。 まず PRD の周辺に広い knowledge base を組み立てる。 次に、UX parity、discoverability、incremental workflow、internal tooling migration、net-new capability、policy/pricing/marketplace など、提案タイプに応じてレビュー深度を調整する。 そのうえで、Opportunity and Hypothesis、Product Scope、User Experience and Impact、Metric and Data Rigor などの観点で評価する。 最後に、launch readiness rating、観点別スコア、最初に直すべき箇所、各ギャップの欠落内容、書き換え候補、根拠、critical requirements と optimizations を含む action items を返す。
価値は、PM の視野を広げること、自己レビューを構造化すること、レビュー会議をトレードオフと判断の議論に寄せること、批評を実際に書き換え可能な指示へ変換することにある。 たとえば「もっと具体的に」ではなく、baseline を定義する、target を明示する、guardrail を追加する、初回リリースを狭める、依存関係を明示する、といった修正可能な形にする。
学びとしては、汎用コメントよりも実際の意思決定基準と failure mode に紐づいた framework が効くこと、言語品質と同じくらい文脈が重要なこと、critical gap の境界を明確にすると出力が正直になること、すべてを重要扱いしない優先順位付けが製品価値の一部であることが挙げられている。
要点¶
- AI PRD レビュアの価値は、文章の添削ではなく、意思決定に必要な文脈を広げることにある。
- PRD 単体では見えない過去実験、隣接影響、依存関係、guardrail の欠落を早期に検出する。
- 汎用的な批評より、組織の review criteria と failure mode に紐づいた framework が有効。
- 出力は「何が悪いか」だけでなく「最初に何をどう直すか」まで落とす必要がある。
- AI は承認者ではなく、人間の高コストなレビューに入る前の artifact を強くする structured thought partner として使う。