ホワイトペーパー紹介|時系列データに特化した異常検知モジュール
こんにちは!インサイトテクノロジーマーケティング本部です。
現在、世の中にはデータがあふれています。そのデータとAI・機械学習の技術によって、今まで人間では困難もしくは不可能だった業務を自動化または省力化し、有効な課題解決へとつなげていくことが、あらゆる企業の喫緊の課題となっています。機械学習技術によって解決できる課題の代表的な例として、「異常検知」が挙げられます。しかし、異常検知の課題でも、どのような「異常」を検知するかによりアプローチは無数にあり、適切な手法を選択することは簡単ではありません。
今回ご紹介するホワイトペーパーでは、弊社の「Insight Anomaly Detector」を使ったPoC実施を経て、実際の現場で利活用いただいている異常検知アルゴリズムのうち、「変化点検知アルゴリズム」「疎構造学習による異常検知アルゴリズム」をご紹介します。
変化点検知アルゴリズム
「変化点」とは、時系列データの振る舞いが変わる境目の時点を意味します。
この図版のような時系列の振る舞いが変わった時点を「異常」として検知したい場合、変化点検知アルゴリズムによる異常検知が有効となります。また、このアルゴリズムはいわゆる「教師なし学習」であり、異常のデータが無いケースでも適用することが可能です。
変化点検知アルゴリズムは、時系列データの瞬間的な変動はノイズとして検知対象にせず、時系列データの振る舞いが急激に変わった時点だけ検知します。この特徴により、ノイズ的な振る舞いが多々あるために固定の閾値だと大量の誤検知が出てしまうような時系列データから、本質的な変動のみを検出することが可能です。
実運用で用いるために
「Insight Anomaly Detector」では、前述の変化点検知の統計モデルに更に以下の手法を取り入れており、よりさまざまな課題に対応することが可能です。
- 周期的パターンの学習:「昼間には値が上昇して、夜間は下がる」といったような、周期的変動を学習する手法です。
- 平日 / 休日や曜日の効果の学習:「カレンダーの休日や特定の曜日では値が下がる」といったような、その日の状況を考慮して学習する手法です。
- オンライン忘却型学習:過去のデータの影響を徐々に忘れながらデータを逐次的に学習する手法です。
- リアルタイム検知:データが入力される度に判定を行って即座に異常を検知する手法です。
これらの異常検知手法について詳しく知りたい方はこちらより資料をダウンロードください。
疎構造学習による異常検知アルゴリズム
変数同士の「関係」の構造を学習し、変数同士の関係の崩れを「異常」と結び付けるという考え方に基づく異常検知アルゴリズムは、疎構造学習による異常検知アルゴリズムと呼ばれます。
疎構造学習による異常検知は、変数間の本質的な関係の構造を考慮した上で多変量データの異常を検知します。本質的でない変数間の関係が学習時に適切に落とされているので、ノイズのあるデータに対しても安定して異常検知を行えることが期待可能です。また、学習の結果得られた変数間の関係についての情報は、検知された異常について詳しく分析や診断をしたいときにも役立ちます。
実運用で用いるために
ここまでに述べたアルゴリズムのままですと、曜日や時間帯に依ってシステムの動作が異なるなど、正常な「モード」が複数あるような場合に対応できません。そこで、「混合モデル」という考え方に基づいてモデルを拡張することで、複数の正常なモードがあるようなケースにも対応することが可能です。また、学習の際にモードの数も含めて推定することが可能ですので、事前にモードの数(混合数)をいくつにするのがよいか決められないような場合であっても適用が可能です。
ここまで「変化点検知アルゴリズム」と「疎構造学習による異常検知アルゴリズム」について紹介してきましたが、本資料では「Insight Anomaly Detector」の活用によってそれぞれのアルゴリズムに適用したユーザーケースも紹介しております。「Insight Anomaly Detector」が実際に実現できることや利用際のイメージに興味がある方は、ぜひ下記ボタンより資料をダウンロードしてご一読ください!