プロジェクト

全般

プロフィール

バグ #880

未完了

シェアラボサーバ稼働状況調査 - ロードアベレージ・ディスクI/O確認

Redmine Admin さんが約2ヶ月前に追加. 約2ヶ月前に更新.

ステータス:
新規
優先度:
通常
担当者:
-
開始日:
2025-07-07
期日:
進捗率:

0%

予定工数:

説明

シェアラボサーバ稼働状況調査

目的

  • サーバの現在の稼働状況を包括的に調査
  • ロードアベレージ、ディスクI/O、メモリ使用量の確認
  • パフォーマンスボトルネックの特定

調査項目

  1. システム全体の稼働状況

    • ロードアベレージ(1分、5分、15分)
    • CPU使用率
    • メモリ使用状況
  2. ディスクI/O状況

    • ディスク使用量
    • I/O統計情報
    • 読み書き速度
  3. プロセス状況

    • 実行中プロセス一覧
    • リソース消費上位プロセス
  4. サーバリソース詳細

    • 大容量ストレージ(35TB)使用状況
    • メモリ(1TB)使用状況

実行予定コマンド

  • uptime, top, htop
  • iostat, iotop
  • df, du
  • free, vmstat
  • ps aux

期待する結果

サーバの健全性確認とパフォーマンス最適化の提案

Redmine Admin さんが約2ヶ月前に更新

シェアラボサーバ稼働状況調査結果

📊 システム全体サマリー

  • 稼働時間: 12日4時間51分(安定稼働中)
  • ホスト: sv722.xbiz.ne.jp ()
  • OS: Rocky Linux 8.10 (Green Obsidian)
  • プロセス総数: 214プロセス

⚠️ 重要な発見事項

🔴 高ロードアベレージ

ロードアベレージ: 32.81, 36.50, 31.12
  • 状況: 128CPU環境で30台超は高負荷状態
  • 原因: PHP-FCGIプロセスが高CPU使用(12.2%, 11.0%)
  • 影響: パフォーマンス低下の可能性

🟢 メモリ状況(良好)

総メモリ: 1.0Ti
使用量: 17Gi (約1.7%)
利用可能: 989Gi
  • 評価: メモリリソースは十分に余裕あり

🟡 ディスクI/O(中程度)

ディスク使用量: 14T/35T (40%)
RAID構成: RAID10 (10台のNVMe SSD)
  • RAID状態: [UUUUUUUUUU] - 全ディスク正常稼働
  • I/O利用率: 平均20-30%程度

🔍 プロセス分析

CPU使用率上位

  1. PHP-FCGI: nihonhoeipro系 (12.2%, 11.0%)
  2. MySQL: 4.4% (安定稼働)
  3. Apache httpd: 1.7%
  4. Nginx worker: 0.9%

メモリ使用量上位

  1. MySQL: 9.0GB (0.8%)
  2. Nginx master/workers: 約800MB台

🌐 サービス稼働状況

Webサーバー

  • Nginx: Active (1週間5日稼働) - メモリ1.9G, 662タスク
  • Apache: Active (1週間5日稼働) - メモリ3.6G, 535タスク

ネットワークポート

  • HTTP: 80, HTTPS: 443 ✅
  • SSH: 22, 10022 ✅
  • MySQL: 3306 ✅
  • メール: 25, 587, 110, 143, 993, 995 ✅

📈 ストレージ構成詳細

RAID10構成

10台のNVMe SSD (各7TB)
総容量: 35TB
使用量: 14TB (40%)
残容量: 22TB

ディスクパフォーマンス

  • 平均読取: 8-13MB/s
  • 平均書込: 6-30MB/s
  • レスポンス時間: 0.1-0.3ms (良好)

🎯 推奨対策

🔴 緊急対応(高ロードアベレージ)

  1. PHP-FCGI最適化

    • nihonhoeiproサイトのPHPプロセス数調整
    • PHP-FPMの設定見直し(pm.max_children等)
    • 不要なPHPプロセスの停止
  2. プロセス監視強化

    • CPU使用率アラート設定
    • プロセス自動再起動機能

🟡 中期改善

  1. パフォーマンス最適化

    • MySQL クエリ最適化
    • Nginxキャッシュ設定強化
    • 不要サービス停止
  2. 監視体制強化

    • ロードアベレージ閾値アラート
    • ディスクI/O監視
    • 定期ヘルスチェック

🟢 長期管理

  1. 容量管理
    • ログローテーション設定
    • 古いファイル自動削除
    • バックアップ戦略見直し

📋 結論

サーバは基本的に健全だが、PHP処理による高負荷状態が継続している。メモリ・ディスクは十分な余裕があるため、PHP設定とプロセス管理の最適化が急務。

他の形式にエクスポート: Atom PDF