プロジェクト

全般

プロフィール

機能 #954

未完了

formauto.call2arm.com システム障害: API 500エラー & コンテナ停止問題

Redmine Admin さんが22日前に追加. 13日前に更新.

ステータス:
解決
優先度:
通常
担当者:
-
開始日:
2025-07-31
期日:
進捗率:

0%

予定工数:

説明

障害概要

formauto.call2arm.com システムにおいて、以下の重大な障害が発生中

障害内容

  1. API 500 Internal Server Error

    • GET /api/v1/tasks/{id} → 500エラー
    • Task CRUD操作の大部分が機能停止
    • E2E テストで 4/6 が失敗
  2. Docker コンテナ停止

    • formauto-backend コンテナ: 停止状態
    • formauto-frontend コンテナ: 停止状態
    • formauto-postgres, formauto-redis: 正常稼働中
  3. Nginx 502 Bad Gateway

    • システムレベルnginx → バックエンドへのプロキシ失敗
    • /etc/nginx/sites-available/formauto.call2arm.com.conf 設定問題

環境特性 (VPS-root)

  • 複数サービス同居: 33コンテナ稼働中の本番環境
  • システムレベルnginx: Docker nginxではなくホストnginx使用
  • ネットワーク: proxy-network外部ネットワーク利用
  • ドメイン: *.call2arm.com ワイルドカード証明書

影響範囲

  • フォーム自動化機能: 全面停止
  • API エンドポイント: 部分的利用不可
  • フロントエンド: アクセス不可
  • 既存サービス: 影響なし (独立動作)

原因分析

  1. Docker Build問題: backend Dockerfileビルド時間過長
  2. データベース接続: コンテナ再起動時の接続文字列問題
  3. JSON シリアライゼーション: SQLAlchemy → JSON変換エラー
  4. ポート競合: localhost:8000 プロセス重複

対応計画

Phase 1: インフラ修復 (緊急)

  • データベース接続修正
  • バックエンドコンテナ再構築
  • nginx設定検証

Phase 2: API修正 (高優先度)

  • TaskService GET操作修正
  • JSON serialization修正
  • エラーハンドリング改善

Phase 3: 統合テスト (中優先度)

  • E2E テスト実行
  • 性能検証
  • 監視設定

緊急度: 高

推定作業時間: 2-3時間

担当: Claude Code

他の形式にエクスポート: Atom PDF