Um Modelo de Classificação com Solução Aproximada por Técnica de Otimização
Henry Rossi de Almeida
ITA – Instituto Tecnológico da Aeronáutica
Abstract: In this work we consider the problem about classification of objects (products, individuals, companies) in two or more groups. The traditional approach is based mainly on models like Logit or Discriminant Analysis. It results in this way, either a cutting score or a measure of distance from the center of each group, defined with the simultaneous use of all the sample. In this model we consider that the classification variables are limited, inferiorly or superiorly. Through this hypothesis, it results a border for each group, that is the limit of the group. We intend to determine the border for the group and, also, a value of probabilistic nature for the measure (score) of each unit, relatively to the boundary of the group that it belongs. After that, we do the classification of a new unit, in the group where it presents the greater measure.
Resumo: Neste trabalho consideramos o problema de classificação de objetos (indivíduos, empresas, produtos) em dois ou mais grupos. A abordagem tradicional se fundamenta principalmente em modelos como Logit ou Análise Discriminante. Resulta deste modo, uma medida estatística – ponto de corte (escore) ou uma medida de distância padronizada ao centro do agrupamento ou uma hipersuperfície de separação – definido com a utilização simultânea de toda a amostra. No modelo proposto consideramos que as variáveis de classificação são limitadas, inferior ou superiormente. Desta hipótese resulta uma fronteira, limite da região domínio de cada grupo em observação. Objetivamos determinar as fronteiras dos grupos analisados e, também, um valor de natureza probabilística para a medida de cada unidade observada, que especifique quanto a mesma está inserida em seu respectivo grupo, relativamente à fronteira deste. Em seguida efetuamos o teste para classificar nova unidade, no grupo em que a mesma apresente a maior medida de inserção.
Keywords: Discriminant Analysis, Score Classification, Linear Programming, Data Envelopment Analysis (DEA)