Devin API統合の実装ガイド【2026年版】— セッション管理×ACU制御×エラーハンドリングの本番アーキテクチャ | 記事

Devinは2026年現在、自律型AIエンジニアとして注目を集めるAI開発ツールである。プロンプトを渡すだけでコーディング・PR作成・テスト実行までを自動で行う。本記事では、Devin APIを自社システムに統合する際の実装パターンを、renueが実装している`DevinClient`をもとに解説する。セッション管理、ACU(Agent Compute Unit)制御、プレイブック活用、3階層のエラーハンドリングまで、本番運用に耐える設計を公開する。

Devin API統合の基礎

Devinはブラウザ経由だけでなく、REST APIで外部システムから制御できる。これにより以下のような運用が可能になる。

Slackからの起動: ボットコマンドでDevinセッションを開始
CI/CDとの連携: PRコメントでDevinを呼び出し
チケット駆動開発: JiraチケットからDevinに自動割当
大量タスクの並列処理: 複数のDevinセッションを同時起動
管理された子セッション: 親Devinが子Devinを制御

本番品質Devin API統合に必要な5レイヤー

レイヤー1: エラー階層の設計

Devin APIとの統合で最初に設計すべきは、エラー階層である。renueの実装では3つの例外クラスを定義している。

class DevinClientError(Exception):
    # Devin API関連のエラー(基底クラス)
    pass

class DevinConfigurationError(DevinClientError):
    # Devin API設定エラー(APIキー未設定など)
    pass

class DevinAPIError(DevinClientError):
    # Devin API呼び出しエラー
    def __init__(self, message, status_code=None):
        super().__init__(message)
        self.status_code = status_code

3階層にする理由

DevinClientError(基底): 一括catchで全Devinエラーを捕捉できる
DevinConfigurationError: 起動時チェックで早期検出
DevinAPIError(status_code付き): HTTPステータスコードで適切なリトライ判断

この階層化により、呼び出し側は「設定ミスはfail-fast、API一時障害はリトライ、それ以外は管理者通知」という分岐を自然に実装できる。

レイヤー2: セッション作成APIの実装

Devinの中核機能は「セッション作成」である。1つのセッションが1つのタスクに対応し、プロンプトに応じてDevinが自律的にコーディングする。

create_session のパラメータ設計

async def create_session(
    self,
    prompt: str,
    snapshot_id: Optional[str] = None,
    playbook_id: Optional[str] = None,
    unlisted: bool = False,
    idempotent: bool = False,
    max_acu_limit: Optional[int] = None,
) -> Dict[str, Any]:
    url = f"{self.base_url}/sessions"
    payload = {"prompt": prompt}

    if snapshot_id:
        payload["snapshot_id"] = snapshot_id
    if playbook_id:
        payload["playbook_id"] = playbook_id
    if unlisted:
        payload["unlisted"] = unlisted
    if idempotent:
        payload["idempotent"] = idempotent
    if max_acu_limit is not None:
        payload["max_acu_limit"] = max_acu_limit
    # ...

各パラメータの使い分け

パラメータ	用途	使うべきシーン
prompt	タスクの詳細指示	必須。具体的かつ明確に書く
snapshot_id	マシンスナップショット	特定の環境設定を再現したい場合
playbook_id	プレイブック参照	定型タスクで品質を安定化
unlisted	非公開セッション	機密性の高いタスク
idempotent	冪等性確保	同じプロンプトで二重起動を防ぎたい
max_acu_limit	ACU上限	コスト制御(必須設定推奨)

レイヤー3: ACU(Agent Compute Unit)の制御

Devinの料金体系は「ACU(Agent Compute Unit)」というユニット制である。本番運用ではACU消費を厳密に管理する必要がある。

ACUの基本

1 ACU ≒ 約15分の作業時間
Devinが稼働しない時間はACU消費されない
複雑なタスクほどACU消費が大きくなる
月額契約にACU数が含まれ、追加購入も可能

max_acu_limit の設定指針

`max_acu_limit`を指定することで、セッションあたりのACU消費上限を設定できる。これを超えるとセッションは自動停止する。renueの実装ではタスク種別に応じた目安を設けている。

小タスク: max_acu_limit = 2 (〜30分)
中タスク: max_acu_limit = 4 (〜1時間)
大タスク: max_acu_limit = 8 (〜2時間)
調査・プロトタイピング: max_acu_limit = 1 (〜15分)

制限なしで実行するとACUが予期せず大量消費されるリスクがある。必ず上限を設定することが推奨される。

ACU管理の運用パターン

事前予算化: プロジェクト別にACU予算を割り当て
実績集計: 週次でACU消費をダッシュボード表示
コスト配賦: 部門別/プロジェクト別にチャージバック
異常検知: 単一タスクで想定以上のACU消費があればアラート

レイヤー4: プレイブックの活用

プレイブックはDevinの「定型タスクのテンプレート」である。同じ種類のタスクを繰り返し実行する場合、プレイブックを使うことで品質が安定する。

プレイブックが有効なユースケース

PRレビュー: コード品質チェック、命名規則、コメントの妥当性
バグ修正: 再現 → 原因調査 → 修正 → テストの標準フロー
新機能実装: 要件確認 → 設計 → 実装 → テストの標準フロー
ドキュメント作成: コードから仕様書を自動生成
リファクタリング: 特定パターンのコードを一括修正

プレイブック運用のメリット

Devinの出力品質が安定する(毎回「どう進めるべきか」考える必要がない)
ACU消費が予測可能になる
チーム全体でベストプラクティスを共有できる
新メンバーのオンボーディングに活用できる

レイヤー5: httpx非同期クライアントの活用

Devin APIはRESTだが、セッション作成後の進捗確認などで複数の並列リクエストが発生することが多い。そのため非同期HTTPクライアント`httpx.AsyncClient`を使うのが推奨される。

renueの実装パターン

async with httpx.AsyncClient(timeout=self.timeout) as client:
    try:
        response = await client.post(url, headers=self._get_headers(), json=payload)
        response.raise_for_status()
        return response.json()
    except httpx.TimeoutException as e:
        logger.error(f"Devin API timeout: {str(e)}")
        raise DevinAPIError(f"Devin API request timed out after {self.timeout}s") from e
    except httpx.HTTPStatusError as e:
        logger.error(f"Devin API error: {e.response.status_code} - {e.response.text}")
        raise DevinAPIError(f"Devin API returned error: {e.response.status_code}", status_code=e.response.status_code) from e
    except httpx.RequestError as e:
        logger.error(f"Devin API request error: {str(e)}")
        raise DevinAPIError(f"Failed to connect to Devin API: {str(e)}") from e

3種類の例外を区別する意義

TimeoutException: ネットワーク遅延またはサーバー過負荷。リトライ有効
HTTPStatusError: 4xx(クライアントエラー)/5xx(サーバーエラー)。status_codeで分岐
RequestError: ネットワーク接続失敗。リトライまたは代替手段

それぞれを個別にcatchすることで、呼び出し側は適切な対応ができる。例えばTimeoutは自動リトライ、5xxは短時間で再試行、4xxはユーザー通知、といった使い分けが可能になる。

APIキー管理のベストプラクティス

Devin APIキーは高度な権限(コード改変・PR作成)を持つため、管理が特に重要である。

設定時のチェック

def __init__(self, api_key=None, timeout=DEFAULT_TIMEOUT):
    self.api_key = api_key or env_setting.DEVIN_API_KEY
    self.base_url = "https://api.devin.ai/v1"
    self.timeout = timeout

    if not self.api_key:
        raise DevinConfigurationError("DEVIN_API_KEY is not configured. Please set the DEVIN_API_KEY environment variable.")

APIキー管理の原則

環境変数で管理: コードに直書き禁止
起動時チェック: `DevinConfigurationError`で早期検出
Secret Manager連携: AWS Secrets Manager/Azure Key Vault等で管理
ログに出さない: エラーメッセージにAPIキーを含めない
ローテーション: 定期的にAPIキーを更新
権限分離: 開発/ステージング/本番で別々のAPIキー

メルカリ流のSecret管理(2026年1月〜)

2026年1月、Devinは**Secret管理機能のv3 API**を追加した。これにより、APIキー等の機密情報をDevinに安全に渡せるようになった。大規模運用では以下のパターンが推奨される。

Secretの登録: Devinに事前にSecretを登録しておく
セッションへの注入: セッション作成時にSecretをスコープ指定して注入
監査ログ: どのセッションがどのSecretにアクセスしたか記録
自動ローテーション: CI/CDパイプラインでSecretを定期更新

セッションの進捗監視

Devinセッションは非同期で進行する。開始後の進捗を監視するには`get_session`エンドポイントを定期的に呼ぶ。

進捗ステータス

pending: キューで待機中
running: 実行中(Devinがコーディング中)
blocked: 人間の確認を待っている(エスカレーション)
completed: タスク完了
failed: エラーで停止
expired: ACU上限に達して停止

ポーリング戦略

本番運用では以下のポーリング間隔が推奨される。

開始直後5分: 30秒間隔(初期エラー早期検出)
5〜30分: 1分間隔(通常実行中)
30分〜: 5分間隔(長時間タスク)
blocked状態: 通知を送信して人間の介入を待つ

Slackボット統合のパターン

Devin API統合の典型的なユースケースが「Slackからの起動」である。以下のフローが標準的である。

ユーザーがSlackで`/devin`コマンドを実行
Slackボットがプロンプトを取得
`DevinClient.create_session`でセッション作成
セッションURLをSlackに返信
バックグラウンドタスクでステータスをポーリング
`completed`/`failed`/`blocked`になったらSlackに通知
ユーザーはSlackから結果を確認

この仕組みにより、非エンジニアでも日常業務からDevinを起動できる環境が整う。

Claude × Devin のハイブリッド運用

2026年現在、Claude CodeとDevinを使い分けるハイブリッド運用が注目されている。両者の特性を活かした役割分担が効果的である。

役割分担の指針

タスク	推奨ツール	理由
探索的コーディング	Claude Code	対話型で素早く試行錯誤
定型タスクの自動化	Devin	プレイブックで品質安定
長時間のリファクタリング	Devin	非同期で進行、人間は並行作業
緊急バグ修正	Claude Code	対話型で即応答
並列タスク処理	Devin	複数セッション同時起動
設計の壁打ち	Claude Code	対話の質が高い

renueの実装特徴

renueは「Self-DX First」の方針のもと、Devin API統合を自社プロダクトとして実装している。社内12業務を553のAIツールで自動化済み(2026年1月時点)であり、DevinもClaude Codeと並んで社内開発で活用されている(全て公開情報)。

技術スタック

言語: Python 3.11
HTTPクライアント: httpx(非同期対応)
エラー階層: DevinClientError → Configuration/API の2分岐
設定管理: 環境変数(`DEVIN_API_KEY`)
デフォルトタイムアウト: 30秒

導入時のよくある失敗パターン

max_acu_limit を設定しない: ACU消費が予期せず爆発する
APIキーを環境変数以外で管理: セキュリティリスク
同期HTTPクライアントを使う: 並列処理で詰まる
例外をキャッチしすぎる: 適切な対応ができない(`except Exception`の乱用)
プレイブックを使わない: タスクごとに品質がブレる
ポーリング間隔が一定: 早すぎるとレート制限、遅すぎるとUX悪化
blocked状態を検知しない: Devinが人間の介入を待ったまま放置される

業界別の活用パターン

業界	典型的なタスク
SaaS開発	バグ修正、機能追加、リファクタリング
受託開発	要件定義書から実装への変換、レビュー
DevOps	インフラコード生成、CI/CD設定
Web制作	LP実装、デザインからコード化
データ分析	SQL/Pythonスクリプト生成、レポート作成

よくある質問

Devinの料金はどれくらい?

コアプランで月額500ドル程度から。ACU追加購入は別料金。1 ACU ≒ 約15分の作業時間なので、月間200ACU使うなら実質約50時間のAIエンジニア工数として考えられる。月額契約にACU数が含まれるため、公式サイトで最新の料金プランを確認すること。

Claude Codeと比べた強みは?

Devinは「バックグラウンドで長時間走らせる」ことに特化している。Claude Codeは対話型で即応答が強み。長時間のリファクタリングや大量PR作成にはDevin、日常的なコーディングにはClaude Codeが適している。

プロンプトはどう書くべき?

具体的かつ明確に。「このコードをリファクタリングして」ではなく「以下のファイルの関数Aを単一責任の原則に従って分割し、テストを追加してPRを作成してください」のように、成果物まで明示する。プレイブックでテンプレート化すると品質が安定する。

blocked状態になったらどうする?

Devinが「人間の判断が必要」と判定した場合、blocked状態になる。Slack通知等で即座に人間に知らせる仕組みが必須。通知を見た人間がDevinのUIで指示を出すと再開する。通知がないと長時間放置されACUが無駄になる。

導入後に最も改善するKPIは?

「定型タスクの処理時間」と「エンジニアの付加価値業務への集中度」が最も顕著に改善する。renueのようなSelf-DX企業では、定型タスクをAIに任せ、人間は戦略的な開発・設計に集中する運用に移行している。