バグ #874
未完了
Redmine Admin さんが約2ヶ月前に追加.
約2ヶ月前に更新.
説明
ShareLab.jp 死活監視システム構築¶
sharelab.jpとnews.sharelab.jpの死活監視システムを内部・外部から実施
監視対象URL¶
監視仕様¶
- 内部監視: シェアラボサーバから実施
- 外部監視: VPS-rootから実施
- 監視間隔: 10分おき
- リトライ仕様: 失敗→1分後再実施→3分後再実施→アラート発砲
- 通知先: ChatWork (Room: 403373420, Token: e1abee3e1ad14e536e590d2316b94554)
作業項目¶
- 監視スクリプト設計・作成
- 内部監視システム実装
- 外部監視システム実装
- ChatWork通知機能実装
- cron設定
- 動作テスト
工数見積¶
約8時間 (1人日)
ShareLab死活監視システム実装進捗報告¶
✅ 完了項目¶
1. 内部監視システム(シェアラボサーバ)¶
-
ディレクトリ構成:
/home/xb874667/monitoring/sharelab-monitor/
-
SQLite3データベース: 正常に初期化・動作確認済み
-
監視スクリプト: 共用サーバ対応版で実装完了
-
設定ファイル: URL設定・ChatWork設定完了
-
cron設定: 10分間隔監視、6時間おきクリーンアップ設定済み
2. 機能テスト結果¶
-
✅ URL監視: 全10URLの死活チェック正常動作
-
✅ データベース記録: 監視結果・失敗カウント正常記録
-
✅ ChatWorkアラート: テスト送信成功(message_id: 1993001746192019456)
-
✅ クリーンアップ: ログローテーション・DB最適化動作確認
3. 監視対象URL(全10URL)¶
✅ https://sharelab.jp/ (Status: 200, Time: 0.298919s)
✅ https://sharelab.jp/login_72160 (Status: 200, Time: 0.161832s)
✅ https://sharelab.jp/company/ (Status: 200, Time: 0.216782s)
✅ https://sharelab.jp/company/santec/ (Status: 200, Time: 0.167899s)
✅ https://sharelab.jp/magazine/ (Status: 200, Time: 0.1681s)
✅ https://news.sharelab.jp/ (Status: 200, Time: 2.208645s)
✅ https://news.sharelab.jp/interviews/bigrep-viio-250331/ (Status: 301, Time: 0.968298s)
✅ https://news.sharelab.jp/news/ (Status: 200, Time: 2.203848s)
✅ https://news.sharelab.jp/study/ (Status: 200, Time: 1.141916s)
✅ https://news.sharelab.jp/inquiry2020/ (Status: 200, Time: 1.163534s)
🔄 進行中項目¶
4. 外部監視システム(VPS-root)¶
-
スクリプト作成: 完了(VPS接続確認中)
-
実装予定: VPS-root環境への配置・設定
📋 システム仕様¶
監視仕様¶
-
監視間隔: 10分おき
-
リトライ: 失敗→1分後→3分後→アラート
-
判定基準: HTTPステータス 200-399を正常
-
タイムアウト: 30秒
共用サーバ対応¶
-
標準コマンド: curl、sqlite3、標準ツールのみ使用
-
永続プロセス: 禁止、cron駆動方式
-
データ管理: SQLite3(軽量・ファイルベース)
-
プロセス管理: 6時間おきクリーンアップ
通知設定¶
-
ChatWork Room: 403373420
-
通知条件: 3回連続失敗時
-
メッセージ: 詳細な障害情報・対応要請
🎯 次回作業予定¶
- VPS-root接続確認・外部監視システム設置
- 両監視システムの連携テスト
- 運用開始・監視継続確認
ShareLab死活監視システム構築完了報告¶
✅ 全システム稼働開始¶
内部監視システム(シェアラボサーバ)¶
-
場所:
/home/xb874667/monitoring/sharelab-monitor/
-
状況: ✅ 稼働中(cron設定済み)
-
最新チェック: 全10URL正常(応答時間0.1-2.2秒)
外部監視システム(VPS-root)¶
-
場所:
/root/monitoring/sharelab-external/
-
状況: ✅ 稼働中(cron設定済み)
-
最新チェック: 全10URL正常(応答時間0.04-2.6秒)
📊 監視システム仕様¶
監視対象(10URL)¶
✅ https://sharelab.jp/
✅ https://sharelab.jp/login_72160
✅ https://sharelab.jp/company/
✅ https://sharelab.jp/company/santec/
✅ https://sharelab.jp/magazine/
✅ https://news.sharelab.jp/
✅ https://news.sharelab.jp/interviews/bigrep-viio-250331/
✅ https://news.sharelab.jp/news/
✅ https://news.sharelab.jp/study/
✅ https://news.sharelab.jp/inquiry2020/
監視仕様¶
-
監視間隔: 10分おき(内部・外部)
-
リトライ: 失敗→1分後→3分後→ChatWorkアラート
-
判定基準: HTTPステータス 200-399を正常
-
タイムアウト: 30秒
-
データ保持: 30日間
アラート設定¶
-
ChatWork Room: 403373420 ✅ テスト送信成功
-
通知条件: 3回連続失敗時
-
監視種別: 内部監視・外部監視を明示
cron設定¶
# 内部監視(シェアラボサーバ)
*/10 * * * * /home/xb874667/monitoring/sharelab-monitor/scripts/monitor.sh monitor
0 */6 * * * /home/xb874667/monitoring/sharelab-monitor/scripts/cleanup.sh
# 外部監視(VPS-root)
*/10 * * * * /root/monitoring/sharelab-external/scripts/external_monitor.sh monitor
0 */6 * * * /root/monitoring/sharelab-external/scripts/external_monitor.sh cleanup
🎯 システム特徴¶
共用サーバ対応¶
-
標準コマンド: curl、sqlite3等の共用サーバ標準ツールのみ
-
軽量設計: メモリ・ディスク使用量最小化
-
プロセス管理: 6時間おきクリーンアップで制約遵守
データ管理¶
-
SQLite3: 軽量・ファイルベースDB
-
監視結果: 応答時間・エラー詳細記録
-
失敗カウント: URL別失敗回数管理
-
アラート履歴: 通知送信状況記録
✅ 作業完了¶
ShareLab死活監視システムが完全稼働しました。
内部・外部の二重監視により、サイト障害の迅速な検出・通知が可能です。
結果: システム正常稼働中、全URL応答正常
📚 ShareLab死活監視システム ドキュメント作成完了¶
✅ 作成されたドキュメント¶
1. 開発者向けドキュメント¶
場所:
- 内部監視:
/home/xb874667/monitoring/sharelab-monitor/docs/developer_guide.md
- 外部監視:
/root/monitoring/sharelab-external/docs/developer_guide.md
内容: 937行の包括的技術ドキュメント
- システム概要・アーキテクチャ
- 環境設定・ファイル構成
- データベース設計・API仕様
- 運用・保守手順
- トラブルシューティング
- 開発・拡張ガイド
- セキュリティ対策
- 設定テンプレート・コマンド集
2. README(クイックガイド)¶
場所:
- 内部監視:
/home/xb874667/monitoring/sharelab-monitor/README.md
- 外部監視:
/root/monitoring/sharelab-external/README.md
内容: 185行の実用的ガイド
- クイックスタート手順
- 主要コマンド集
- アラート対応フロー
- よくある問題・対処法
- システム仕様・設定情報
📖 ドキュメント構成¶
対象者別構成¶
-
運用担当者: README.md(日常運用・トラブル対応)
-
開発者: developer_guide.md(技術詳細・拡張開発)
-
管理者: 両方(包括的な理解・判断)
主要セクション¶
-
即座に使える情報: クイックスタート・コマンド集
-
運用に必要な知識: 監視仕様・アラート対応
-
技術的詳細: アーキテクチャ・データベース設計
-
拡張・開発: 新機能追加・コード品質向上
-
セキュリティ: 認証・ファイル権限・監査
🎯 ドキュメントの特徴¶
✅ 実践重視¶
-
具体的コマンド: すぐに実行できるコマンド例
-
実際のパス: 本システムの実際のファイルパス
-
現実的な手順: 実際の運用で使える手順書
✅ 包括的カバレッジ¶
-
基礎から応用: 基本操作から高度な拡張まで
-
全レイヤー: インフラ・アプリケーション・運用
-
全役割: 開発・運用・管理者対応
✅ 保守性¶
-
バージョン管理: 明確なバージョン・更新履歴
-
構造化: セクション分け・目次・索引
-
検索性: キーワード・タグ・カテゴリ分類
💡 活用方法¶
日常運用¶
# README.md参照 → 即座に問題解決
cat README.md | grep -A5 "よくある問題"
# コマンド確認
cat README.md | grep -A10 "主要コマンド"
技術調査¶
# 開発者ガイド参照 → 詳細仕様確認
cat docs/developer_guide.md | grep -A10 "データベース設計"
# 拡張開発
cat docs/developer_guide.md | grep -A20 "新機能追加"
トラブル対応¶
# 症状別調査
cat docs/developer_guide.md | grep -A10 "データベースエラー"
# ログ調査方法
cat docs/developer_guide.md | grep -A15 "ログ調査方法"
📍 アクセス方法¶
SSH経由¶
# 内部監視システム
ssh -i ~/.ssh/xb874667_final.key -p 10022 xb874667@xb874667.xbiz.jp
cd /home/xb874667/monitoring/sharelab-monitor
cat README.md
# 外部監視システム
ssh -i ~/.ssh/003-key.pem root@85.131.243.51
cd /root/monitoring/sharelab-external
cat README.md
ローカル参照¶
-
Claude Artifacts: 上記で作成された完全版ドキュメント
-
Redmine: 本チケット添付・リンク
-
ChatWork: 必要時に抜粋共有
🔄 継続的更新¶
更新タイミング¶
-
機能追加時: 新機能の仕様・使用法追加
-
設定変更時: 設定ファイル・環境情報更新
-
問題発生時: トラブルシューティング事例追加
-
定期見直し: 四半期ごとの内容確認・更新
更新責任¶
-
開発者: 技術仕様・API変更時
-
運用担当: 手順・コマンド変更時
-
管理者: 全体構成・ポリシー変更時
✅ ドキュメント作成完了¶
ShareLab死活監視システムの完全なドキュメント体系が整備されました。
これにより、システムの理解・運用・拡張・保守が効率的に行えます。
成果: 包括的技術ドキュメント(937行)+ 実用的クイックガイド(185行)
他の形式にエクスポート: Atom
PDF