Slack の #mobile-lambda-alert にアラームが届いたとき、または日次レポートでエラーを発見したときの初動手順です。
Slack メッセージに含まれる Lambda 名 と エラー件数 を確認します。
Lambda 名から「何の機能が影響を受けているか」を判断します(→ セクション 2 の重要度表を参照)。
セクション 3 の判定基準表で重要度(Critical / High / Medium)を確認します。
Critical(打刻・ログイン不能)→ 直ちにセクション 5 の対処手順へ。
High / Medium → 業務時間内に調査開始。
Critical → 営業時間内であれば即時連絡。時間外は翌朝 9:00 に連絡。
High → 当日営業時間内に連絡。
Medium/Low → 障害管理台帳に記録し、次回定例ミーティングで共有。
ledgers/障害管理台帳.xlsx を開き、発生日時・Lambda 名・重要度・状況を記録します。
マリンスフィアに連絡した場合はチケット番号(または対応者名)も記入します。
マリンスフィアから「修正完了」の連絡を受けたら、セクション 7 のチェックリストで復旧を確認します。
台帳の「解決日時」「解決策」を記入し、クローズします。
#mobile-daily-monitor) で前日の Lambda エラー合計が確認できます。
障害の性質に応じて連絡先が異なります。3rd-party 障害の場合は各システムの担当者へエスカレーションします。
| 重要度 | 定義 | 初動応答 | 典型的な症状例 |
|---|---|---|---|
| Critical | 全機能停止、または打刻・ログインが全ユーザーで不可能 | 1 時間以内(営業時間内) 翌 9:00(時間外) |
全員ログイン不可、全員打刻不可、AppSync 完全停止 |
| High | 主要機能の一部停止、複数ユーザーが影響を受ける | 4 時間以内(営業時間内) | 特定ユーザーが打刻できない、タスク一覧が空白(一部のみ) |
| Medium | 機能低下だが回避策あり、1 名または稀に発生 | 翌営業日 | タスクステータスが反映されるまで遅延、OT 集計がずれる(1名) |
| Low | UI の表示問題・操作性の改善要望・質問 | 3 営業日 | ボタンの表示位置がずれる、日本語が文字化けする |
A. アラートで発覚: Slack #mobile-lambda-alert に CloudWatch アラームが届く。
B. ユーザー報告で発覚: EJEC 作業員から「打刻できない」などの連絡が来る。
C. 日次レポートで発覚: 翌朝の #mobile-daily-monitor で前日エラーを確認。
→ いずれの場合も障害管理台帳に「受付日時」「報告者(またはアラーム名)」を記録。
マリンスフィアが CloudWatch Logs を確認し、根本原因(AWS / BTP / ServiceNow / Microsoft のどれか)を特定します。
切り分け完了後、EJEC IT に「X が原因です」と報告。3rd-party 起因の場合は担当部署へのエスカレーションを要請。
AWS 基盤の障害: マリンスフィアが Lambda 修正 → OTA アップデート(軽微)または新規ビルド(重大)で対応。
3rd-party 障害: 各ベンダーが復旧次第、アプリも自動的に回復することが多い。マリンスフィアが動作確認。
環境変数不整合(例: IAS_CLIENT_SECRET): マリンスフィアが Lambda に再設定。
マリンスフィアが EJEC IT に「修正完了・反映時刻」を通知。
EJEC IT が台帳に「解決日時」「解決策の概要」を記録してクローズ。
Critical / High の場合、翌営業日中に簡易インシデントレポートをメールで送付。
タイトルをクリックすると詳細が開きます。
ServiceNowSSOLoginLambda エラー#mobile-lambda-alert に直近アラームがあるか確認#mobile-lambda-alert に BTPSSOLambda または SSORefreshToken のアラームがあるか確認ServiceNowLambda タイムアウト#mobile-lambda-alert に ServiceNowLambda の Duration アラームがあるか確認OTupdaterLambda エラー、または DynamoDB への書き込み失敗URL: https://activity-dashboard-1ef.pages.dev
| 確認したい内容 | どこを見るか | 更新頻度 |
|---|---|---|
| 現在誰が稼働中か | 「ライブ状況」タブ — アクティブ作業員一覧 | 60 秒自動更新 |
| 昨日何名が利用したか | 「アクティビティ」タブ — 日次集計 | 日次 |
| 特定ユーザーの作業時間 | 「アクティビティ」→ ユーザー名でフィルター | 日次 |
| 長期間未使用者を確認 | 「欠勤レポート」タブ — 連続未使用日数 | 日次 |
| CSV でデータをダウンロード | 各タブの「CSV エクスポート」ボタン | 随時 |
マリンスフィアから「修正完了」の連絡を受けた後、以下を確認してからクローズしてください。
| # | 確認項目 | 確認方法 | OK? |
|---|---|---|---|
| 1 | Slack #mobile-lambda-alert に新規アラームが来ていないか | Slack を確認 | ☐ |
| 2 | 業務ダッシュボードに正常なアクティビティが表示されているか | ダッシュボードを開く | ☐ |
| 3 | 翌日の日次 Slack レポートでエラー件数が 0 になっているか | 翌朝 08:00 JST のレポートを確認 | ☐ |
| 4 | 影響を受けたユーザーが通常通り利用できているか | テスト端末またはユーザーへの確認 | ☐ |
| 5 | 障害管理台帳に解決日時・解決策を記入したか | 台帳を更新 | ☐ |
| 6 | Critical / High の場合、インシデントレポートを受領したか | メールを確認(翌営業日中) | ☐ |