AIに同じ仕事を20回任せたら、品質が25%劣化した
デモ動画では確かに上手く動いていました。しかし実務で同じモデルに似た作業を繰り返し任せると、ある瞬間から成果物が静かに崩れ始めます。日本のSIerでAzureソリューションアーキテクトを務めるエンジニアが、この感覚を数字で捉えました。
Claude Code、Codex、MCPを使い、同じドキュメントを20回連続で修正・追記させたところ、平均25%が劣化したのです。情報が抜け落ち、なかった事実が紛れ込みました。メッセージはシンプルです — AIへの任せ方そのものが、企業の資産になる時代に入りました。
"vibe coding"の限界が数字で見えた
「雰囲気でAIに丸投げするコーディング」を指すvibe codingは、一時期、生産性の象徴のように扱われていました。検証なき累積委任は、結局ノイズを積み上げます。25%劣化という数字は、5〜10回ごとに人間レビューを挟むべきだという実務ガイドラインに直結しています。
AGENTS.md、SKILL.md、DESIGN.md — 3枚の指示書
同時期、別の流れも一気に整いました。AGENTS.mdはOpenAI・Google・Sourcegraph・Cursor・Factoryが共同で策定し、2025年12月にLinux Foundationへ寄贈されています。AnthropicはClaude Skillsと併せてSKILL.mdを、2026年4月にはGoogle LabsがDESIGN.mdを公開しました。
DESIGN.mdにはnpx @google/design.md lintという検証CLIまでセットになっています。AIエージェントが読める指示書ファイルが3種そろい、仕様駆動開発(Spec-Driven Development)が新しい標準になりつつあります。
非エンジニアが9日で社内ツールを作った
韓国のNAVER D2が興味深い事例を公開しました。技術PMが「組織の生産性をどう測るか」という問いから出発し、社内ガイド文書とAIを傍に置いて、9日間で独自の測定ツールを完成させた記録です。社内DevOpsボードのDORA指標だけでは足りず、より細分化された分析が必要だったためです。
ポイントは「非エンジニア」だったということ。整理された社内ナレッジをAIが読める形にしておけば、コードを書いたことのない人でも、9日で動くツールを持ってきます。
2,450円でPVが1本
クリエイティブ領域でも同じパターンです。Claude DesktopからHiggsfield(AI動画生成)をMCP経由で操作する構成で、個人が約2分のオリジナル楽曲のPVを当日中に完成させました。コストは¥2,450、Higgsfield Starter Plan 1ヶ月分のみでした。
日本のB2Bが今やるべきこと
サンフランシスコのRailwayがAIネイティブクラウドという潮流で1億ドルを調達したのも、同じ文脈にあります。ツールは急速に標準化し、価格は急速に下がります。差を生むのはツールではなく、自社の知識をAIにどう食べさせるかという設計です。
具体的な活用例は5years+のポートフォリオでご覧いただけます。
本日のアクションアイテム
- 指示書ファイルを作りましょう。 社内コードとドメイン知識をAGENTS.md/SKILL.md/CLAUDE.mdなどの形式で整理します。一度作れば、すべてのAIツールが共有できます。
- 20回の無人委任を断ち切りましょう。 5〜10回ごとに人間レビューをワークフローに組み込みます。25%劣化は、検証なき累積が生んだ結果です。
- 非エンジニアにAIを渡しましょう。 社内ガイドさえ整理されていれば、非エンジニア職でも9日で独自ツールを作れます。小さなPoCから始めてください。
無料相談はこちら — 指示書ファイルの設計とAIワークフロー構築、5years+がお手伝いします。
よくある質問
vibe codingは常に危険ですか?
いいえ。短い単発作業やプロトタイプ段階では依然として強力です。ただし同じコンテキストに累積して任せる長期作業で劣化が生じます。人間レビューの地点を明示的に挿入することが鍵です。
AGENTS.mdを導入するには何から始めればよいですか?
リポジトリのルートに空のAGENTS.mdを作り、「このコードベースに初めて参加するエンジニアに30秒で伝えたいこと」から書きます。ビルドコマンド、テスト方法、ドメイン略語、避けるべきパターン程度から始めれば十分です。
非エンジニアでも本当にツールを作れますか?
はい。ただしドメインドキュメントが整理されている必要があります。整理された社内ガイド、AIエージェント、明確な目標が揃えば、9日という期間は決して誇張ではありません。