濵砂 幸裕 (ハマスナ ユキヒロ)
|
時系列データとは,時間変化する現象の情報を持つデータであり,その応用範囲は多岐にわたる.大規模複雑な時系列データを分析し,その特徴を抽出するデータ解析手法の1つにクラスタリングがある.時系列データのクラスタリングにおける重要な課題は,適切な非類似度の選択とデータに適したクラスタリングアルゴリズムの選択である.本論文では,時系列データに対するクラスタリング手法にサイズコントロールの考え方を導入することで,不均衡な時系列データを適切に処理する新たなクラスタリング手法を提案する.提案手法は,時系列データに対する代表的な手法である,Dynamic Time Warping(DTW)を非類似度に用いたk-medoids,Shape-based Distance(SBD)を非類似度に用いたk-medoidsおよびk-Shapeのそれぞれを拡張することで構築される.さらに,UCR Time Series Classification Archiveで公開されている12種類のデータセットを用いた数値実験を行い,提案手法の性能を検証した.数値実験から,Dynamic Time Warpingを非類似度に用いたサイズコントロール付きk-medoidsが,提案手法の中で最も良好なクラスタ分割を得ることを確認した.