SLO違反検出
ReflexはPrometheusのSLOを監視し、しきい値を超えた瞬間に検出します。
キュレーションされた修復パターン
再起動、スケーリング、ロールバックなど、一般的な違反タイプ向けのビルド済みパターンを搭載しており、カスタムプレイブックを作成する必要はありません。
信頼ラダー(観測→ドライラン→自動)
観測モード(実行予定のアクションをログに記録)から開始し、ドライラン(各アクションにSlack承認が必要)に進み、最後に自動モードに昇格します。自動モードではReflexがアクションを実行し、事後通知します。
Slack承認ボタン
違反が検出されると、Reflexは正確な修復内容をSlackに投稿し、承認/拒否ボタンで手動確認を求めます。
クールダウンと前提条件のセーフガード
各Reflexにはデフォルトで10分間のクールダウンが設定され、ループを防止します。また、システムが異常な状態(例:最大レプリカ数に達している、直近のアクションが失敗した)の場合にアクションをブロックする前提条件も備えています。
グローバルレート制限
自動モードではグローバルレート制限が適用され、カスケード障害を防止します。
AIによる根本原因分析(Pro版)
キュレーションされたパターンが一致しない場合、ReflexはAI推論エンジン(BYOK OpenAI/Anthropic)を実行し、JSON検証と500トークンの上限を設けて、アクション実行前に人間に結果を表示します。
セルフホスト型コントローラー
Reflex Runtimeは単一のセルフホスト型コントローラーで、クラスター内で動作し、データが外部に流出することはありません。
無制限のクラスター
無料版とPro版の両方で無制限のクラスターをサポートします。
AI無効化オプション
`--set ai.enabled=false`を使用してAIを完全に無効化できます。
helm install)。ReflexSLOのReflexは、SLOとインテリジェントな信頼ラダーを使用してKubernetesの修復を自動化し、問題を早期に検出して手動介入なしに解決します。
分類:自動化
アクセスリンク:https://reflexslo.io/
タグ:Kubernetes修復、SLO自動化、AIOps、自己修復インフラ、DevOpsツール