Skip to content

入門 機械学習による異常検知―Rによる実践ガイド をPythonで実装

Notifications You must be signed in to change notification settings

gibachan/anomaly-detection

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

anomaly-detection

入門 機械学習による異常検知―Rによる実践ガイド をPythonで実装

2 正規分布に従うデータからの異常検知

ホテリング理論に基づく外れ値検知。

2.2 1変数正規分布のに基づく異常検知

観測データが単一の正規分布に従うと仮定した場合の、確率分布のパラメータを最尤推定法で推定する。

2.4 多変量正規分布に基づく異常検知

複数の変数が独立に正規分布に従うと仮定した場合。

2.6 マハラノビス=タグチ法

変数毎の異常度への影響度をSN値で表す。

3.非正規データからの異常検知

正規分布以外の分布に従うデータに対する外れ値検知。

3.1 分布が左右対称でない場合

データをガンマ分布に当てはめて考える。ガンマ分布の確率密度関数のパラメータ(k,s)をモーメント法で推定する。

3.2 訓練データに異常表本が混ざっている場合

正常標本と異常標本の混合正規分布から、期待値-最大化法(EM法)によりそれぞれの正規分布のパラメータを推測する。

3.3 分布がひと山にならない場合:近距離に基づく方法

データ間の距離に基づく外れ値検知。

3.3.2 局所外れ値度

データ間の距離の比によって異常度を定義することにより、データの分布が一様でない場合にも対応できるようにする。

3.3.3 カーネル密度推定

k近傍法に確率密度関数を導入した外れ値検知。

3.4 分布がひと山にならない場合:クラスタリングに基づく方法

混合正規分布モデルによるクラスタリングによる外れ値検知。

3.5 支持ベクトルデータ記述法に基づく異常判定

サポートベクターマシーンを利用した外れ値検知。

5 不要な次元を含むデータからの異常検知

主成分分析による異常検知

主成分分析により、正常部分空間におけるデータの異常度を求めて外れ値検知を行う。

7 時系列データの異常検知

7.1 近傍法による異常部位検出

スライド窓により部分時系列ベクトルを生成し、部分時系列ベクトル間の距離により異常度を定義する。(最近傍法)

About

入門 機械学習による異常検知―Rによる実践ガイド をPythonで実装

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages