논문검색

pISSN : 2384-4450

한국범죄정보연구, Vol.9 no.1 (2023)
pp.77~92

DOI : 10.33563/KSCIA.2023.9.1.4

차원감소기법을 적용한 연속형 시계열자료의 예외적 부정탐지 예측모델 연구

전진호

(가톨릭관동대학교 경영학과 교수)

우리 사회 많은 영역들이 IT 기반의 환경으로 변화함에 따라 업무처리 및 의사결정 과정에서 실시간으 로 연속적인 형태의 방대한 자료들이 생산되고 있는 반면 이러한 기술 발전을 악용하여 다양한 형태의 사기・부정행위가 증가해 피해 규모가 수십억 달러에 달하자 이를 탐지는 부정 탐지(fraud detection)는 지속적으로 연구되는 주요 관심 분야 중 하나이다. 본 연구에서는 연속형 시계열 자료 중 대표적인 주가지수 데이터를 활용하여 계산 비용을 축소 시킨 후의 부정 탐지 예측 유효성을 확인하고자 한다. 대용량의 자료를 바탕으로 한 부정탐지 예측 모델 결정은 수집된 자료 전체의 정보를 살펴보는 것보다 특정 시퀀스 그룹으로 군집화하여 각 군집에 따라 모델을 결정해 전체적인 자료의 의미를 이해하는 것이 더욱 효과적일 수 있으므로 베이지안 군집 방법을 통해 계산 비용을 축소 시킨 후 시계열 또는 시퀀스 데이터 모델링에 적합한 은닉 마르코프 모델(Hidden Markov Model)을 활용하여 유효성을 확인 하였다. 분석 결과, 차원을 축소 시킨 후 은닉 마르코프 모델을 적용한 모델이 성능평가 지표에서 모두 우수한 결과를 보여 유용성을 확인하였다.

A Study on Anomaly Crisis Detection Prediction Model of Continuous Time Series Data using Dimensions Decrease Techniques

Jeon, Jin-Ho

As various sectors of our society transition to IT-based environments, there has been a continuous production of large amounts of real-time and sequential data in the process of conducting business operations and making decisions. However, along with these technological advancements, there has been an increase in fraudulent and dishonest activities, resulting in damages amounting to billions of dollars. Detecting such fraud is an ongoing area of significant interest. In this study, we aim to validate the effectiveness of fraud detection prediction by utilizing representative time series data, specifically stock market index data, after reducing the computational cost. Rather than examining the information of the entire collected data, determining fraud detection prediction models based on specific sequence groups and understanding the overall meaning of the data through Bayesian clustering methods can be more effective. We employed a Hidden Markov Model, suitable for time series or sequence data modeling, after reducing the computational cost through Bayesian clustering methods to validate its effectiveness. The analysis results demonstrated the usefulness of applying the reduced-dimensionality Hidden Markov Model, showing superior performance in performance evaluation.

Download PDF list