操作
バグ #874
未完了ShareLab.jp 死活監視システム構築
ステータス:
解決
優先度:
高め
担当者:
-
開始日:
2025-07-04
期日:
進捗率:
0%
予定工数:
説明
ShareLab.jp 死活監視システム構築¶
概要¶
sharelab.jpとnews.sharelab.jpの死活監視システムを内部・外部から実施
監視対象URL¶
- https://sharelab.jp/
- https://sharelab.jp/login_72160
- https://sharelab.jp/company/
- https://sharelab.jp/company/santec/
- https://sharelab.jp/magazine/
- https://news.sharelab.jp/
- https://news.sharelab.jp/interviews/bigrep-viio-250331/
- https://news.sharelab.jp/news/
- https://news.sharelab.jp/study/
- https://news.sharelab.jp/inquiry2020/
監視仕様¶
- 内部監視: シェアラボサーバから実施
- 外部監視: VPS-rootから実施
- 監視間隔: 10分おき
- リトライ仕様: 失敗→1分後再実施→3分後再実施→アラート発砲
- 通知先: ChatWork (Room: 403373420, Token: e1abee3e1ad14e536e590d2316b94554)
作業項目¶
- 監視スクリプト設計・作成
- 内部監視システム実装
- 外部監視システム実装
- ChatWork通知機能実装
- cron設定
- 動作テスト
工数見積¶
約8時間 (1人日)
Redmine Admin さんが約2ヶ月前に更新
ShareLab死活監視システム実装進捗報告¶
✅ 完了項目¶
1. 内部監視システム(シェアラボサーバ)¶
-
ディレクトリ構成:
/home/xb874667/monitoring/sharelab-monitor/
- SQLite3データベース: 正常に初期化・動作確認済み
- 監視スクリプト: 共用サーバ対応版で実装完了
- 設定ファイル: URL設定・ChatWork設定完了
- cron設定: 10分間隔監視、6時間おきクリーンアップ設定済み
2. 機能テスト結果¶
- ✅ URL監視: 全10URLの死活チェック正常動作
- ✅ データベース記録: 監視結果・失敗カウント正常記録
- ✅ ChatWorkアラート: テスト送信成功(message_id: 1993001746192019456)
- ✅ クリーンアップ: ログローテーション・DB最適化動作確認
3. 監視対象URL(全10URL)¶
✅ https://sharelab.jp/ (Status: 200, Time: 0.298919s)
✅ https://sharelab.jp/login_72160 (Status: 200, Time: 0.161832s)
✅ https://sharelab.jp/company/ (Status: 200, Time: 0.216782s)
✅ https://sharelab.jp/company/santec/ (Status: 200, Time: 0.167899s)
✅ https://sharelab.jp/magazine/ (Status: 200, Time: 0.1681s)
✅ https://news.sharelab.jp/ (Status: 200, Time: 2.208645s)
✅ https://news.sharelab.jp/interviews/bigrep-viio-250331/ (Status: 301, Time: 0.968298s)
✅ https://news.sharelab.jp/news/ (Status: 200, Time: 2.203848s)
✅ https://news.sharelab.jp/study/ (Status: 200, Time: 1.141916s)
✅ https://news.sharelab.jp/inquiry2020/ (Status: 200, Time: 1.163534s)
🔄 進行中項目¶
4. 外部監視システム(VPS-root)¶
- スクリプト作成: 完了(VPS接続確認中)
- 実装予定: VPS-root環境への配置・設定
📋 システム仕様¶
監視仕様¶
- 監視間隔: 10分おき
- リトライ: 失敗→1分後→3分後→アラート
- 判定基準: HTTPステータス 200-399を正常
- タイムアウト: 30秒
共用サーバ対応¶
- 標準コマンド: curl、sqlite3、標準ツールのみ使用
- 永続プロセス: 禁止、cron駆動方式
- データ管理: SQLite3(軽量・ファイルベース)
- プロセス管理: 6時間おきクリーンアップ
通知設定¶
- ChatWork Room: 403373420
- 通知条件: 3回連続失敗時
- メッセージ: 詳細な障害情報・対応要請
🎯 次回作業予定¶
- VPS-root接続確認・外部監視システム設置
- 両監視システムの連携テスト
- 運用開始・監視継続確認
Redmine Admin さんが約2ヶ月前に更新
- ステータス を 新規 から 解決 に変更
ShareLab死活監視システム構築完了報告¶
✅ 全システム稼働開始¶
内部監視システム(シェアラボサーバ)¶
-
場所:
/home/xb874667/monitoring/sharelab-monitor/
- 状況: ✅ 稼働中(cron設定済み)
- 最新チェック: 全10URL正常(応答時間0.1-2.2秒)
外部監視システム(VPS-root)¶
-
場所:
/root/monitoring/sharelab-external/
- 状況: ✅ 稼働中(cron設定済み)
- 最新チェック: 全10URL正常(応答時間0.04-2.6秒)
📊 監視システム仕様¶
監視対象(10URL)¶
✅ https://sharelab.jp/
✅ https://sharelab.jp/login_72160
✅ https://sharelab.jp/company/
✅ https://sharelab.jp/company/santec/
✅ https://sharelab.jp/magazine/
✅ https://news.sharelab.jp/
✅ https://news.sharelab.jp/interviews/bigrep-viio-250331/
✅ https://news.sharelab.jp/news/
✅ https://news.sharelab.jp/study/
✅ https://news.sharelab.jp/inquiry2020/
監視仕様¶
- 監視間隔: 10分おき(内部・外部)
- リトライ: 失敗→1分後→3分後→ChatWorkアラート
- 判定基準: HTTPステータス 200-399を正常
- タイムアウト: 30秒
- データ保持: 30日間
アラート設定¶
- ChatWork Room: 403373420 ✅ テスト送信成功
- 通知条件: 3回連続失敗時
- 監視種別: 内部監視・外部監視を明示
cron設定¶
# 内部監視(シェアラボサーバ)
*/10 * * * * /home/xb874667/monitoring/sharelab-monitor/scripts/monitor.sh monitor
0 */6 * * * /home/xb874667/monitoring/sharelab-monitor/scripts/cleanup.sh
# 外部監視(VPS-root)
*/10 * * * * /root/monitoring/sharelab-external/scripts/external_monitor.sh monitor
0 */6 * * * /root/monitoring/sharelab-external/scripts/external_monitor.sh cleanup
🎯 システム特徴¶
共用サーバ対応¶
- 標準コマンド: curl、sqlite3等の共用サーバ標準ツールのみ
- 軽量設計: メモリ・ディスク使用量最小化
- プロセス管理: 6時間おきクリーンアップで制約遵守
データ管理¶
- SQLite3: 軽量・ファイルベースDB
- 監視結果: 応答時間・エラー詳細記録
- 失敗カウント: URL別失敗回数管理
- アラート履歴: 通知送信状況記録
✅ 作業完了¶
ShareLab死活監視システムが完全稼働しました。
内部・外部の二重監視により、サイト障害の迅速な検出・通知が可能です。
結果: システム正常稼働中、全URL応答正常
Redmine Admin さんが約2ヶ月前に更新
📚 ShareLab死活監視システム ドキュメント作成完了¶
✅ 作成されたドキュメント¶
1. 開発者向けドキュメント¶
場所:
- 内部監視:
/home/xb874667/monitoring/sharelab-monitor/docs/developer_guide.md
- 外部監視:
/root/monitoring/sharelab-external/docs/developer_guide.md
内容: 937行の包括的技術ドキュメント
- システム概要・アーキテクチャ
- 環境設定・ファイル構成
- データベース設計・API仕様
- 運用・保守手順
- トラブルシューティング
- 開発・拡張ガイド
- セキュリティ対策
- 設定テンプレート・コマンド集
2. README(クイックガイド)¶
場所:
- 内部監視:
/home/xb874667/monitoring/sharelab-monitor/README.md
- 外部監視:
/root/monitoring/sharelab-external/README.md
内容: 185行の実用的ガイド
- クイックスタート手順
- 主要コマンド集
- アラート対応フロー
- よくある問題・対処法
- システム仕様・設定情報
📖 ドキュメント構成¶
対象者別構成¶
- 運用担当者: README.md(日常運用・トラブル対応)
- 開発者: developer_guide.md(技術詳細・拡張開発)
- 管理者: 両方(包括的な理解・判断)
主要セクション¶
- 即座に使える情報: クイックスタート・コマンド集
- 運用に必要な知識: 監視仕様・アラート対応
- 技術的詳細: アーキテクチャ・データベース設計
- 拡張・開発: 新機能追加・コード品質向上
- セキュリティ: 認証・ファイル権限・監査
🎯 ドキュメントの特徴¶
✅ 実践重視¶
- 具体的コマンド: すぐに実行できるコマンド例
- 実際のパス: 本システムの実際のファイルパス
- 現実的な手順: 実際の運用で使える手順書
✅ 包括的カバレッジ¶
- 基礎から応用: 基本操作から高度な拡張まで
- 全レイヤー: インフラ・アプリケーション・運用
- 全役割: 開発・運用・管理者対応
✅ 保守性¶
- バージョン管理: 明確なバージョン・更新履歴
- 構造化: セクション分け・目次・索引
- 検索性: キーワード・タグ・カテゴリ分類
💡 活用方法¶
日常運用¶
# README.md参照 → 即座に問題解決
cat README.md | grep -A5 "よくある問題"
# コマンド確認
cat README.md | grep -A10 "主要コマンド"
技術調査¶
# 開発者ガイド参照 → 詳細仕様確認
cat docs/developer_guide.md | grep -A10 "データベース設計"
# 拡張開発
cat docs/developer_guide.md | grep -A20 "新機能追加"
トラブル対応¶
# 症状別調査
cat docs/developer_guide.md | grep -A10 "データベースエラー"
# ログ調査方法
cat docs/developer_guide.md | grep -A15 "ログ調査方法"
📍 アクセス方法¶
SSH経由¶
# 内部監視システム
ssh -i ~/.ssh/xb874667_final.key -p 10022 xb874667@xb874667.xbiz.jp
cd /home/xb874667/monitoring/sharelab-monitor
cat README.md
# 外部監視システム
ssh -i ~/.ssh/003-key.pem root@85.131.243.51
cd /root/monitoring/sharelab-external
cat README.md
ローカル参照¶
- Claude Artifacts: 上記で作成された完全版ドキュメント
- Redmine: 本チケット添付・リンク
- ChatWork: 必要時に抜粋共有
🔄 継続的更新¶
更新タイミング¶
- 機能追加時: 新機能の仕様・使用法追加
- 設定変更時: 設定ファイル・環境情報更新
- 問題発生時: トラブルシューティング事例追加
- 定期見直し: 四半期ごとの内容確認・更新
更新責任¶
- 開発者: 技術仕様・API変更時
- 運用担当: 手順・コマンド変更時
- 管理者: 全体構成・ポリシー変更時
✅ ドキュメント作成完了¶
ShareLab死活監視システムの完全なドキュメント体系が整備されました。
これにより、システムの理解・運用・拡張・保守が効率的に行えます。
成果: 包括的技術ドキュメント(937行)+ 実用的クイックガイド(185行)
操作