Detecção de fraudes na distribuição de energia elétrica utilizando support vector machine
Vinícius Dornela Silva
Instituto Tecnológico de Aeronáutica/IEMB
Rodrigo Arnaldo Scarpel
Instituto Tecnológico de Aeronáutica/IEMB
Abstract: Several economics sectors are exposed to fraud made by their own customers. At the Electrician Distribution segment is not different. Several techniques in statistical fields were developed to detect illegal activities, relied in observation classification. The empiric events modeling always become a challenge to get solution in engineering projects. The solution is achieved using a induction process to built a system able to bring up the answer of a previously observed event. The Linear Discriminate Analysis is the quantitative method most used. Recently, an alternative approach arises: The Support Vector Machine (SVM). This paper objectives is train and test a model built using SVM to point out the customers that are performing frauds given the customers company (an Electrician Distribution) data base, doing a efficiency and quality confrontation vis-à-vis the Linear Discriminate Analysis.
Resumo: Os mais variados setores da economia estão sujeitos às fraudes cometidas pelos seus próprios clientes. No setor de distribuição de energia elétrica não é diferente. Muitas técnicas no campo estatístico foram desenvolvidas para detectar atividades fraudulentas, baseando-se em classificações das observações. A solução é obtida utilizando um processo de indução para se construir um sistema capaz de deduzir respostas de fenômenos que já tenham sido observados anteriormente. O método quantitativo mais empregado na classificação de observações é a Análise Discriminante Linear. Recentemente, como alternativa a essa técnica, surgiu o Support Vector Machine (SVM). O objetivo do presente trabalho foi treinar e testar um modelo utilizando o SVM para a classificação de clientes de uma distribuidora de energia elétrica, fazendo uma comparação de eficiência e qualidade vis-à-vis a Análise Discriminante Linear.
Keywords: fraud detection, support vector machine, classification models.