Comparando a Capacidade Preditora dos Algoritmos CART e CTREE
Palavras-chave:
algoritmos, mineração de dados, avaliação em larga escala, avaliação de desempenho, Exame Nacional do Ensino Médio.Resumo
Mesmo que o algoritmo CART tenha sido aplicado de forma extensiva em estudos preditivos educacionais, pesquisadores argumentam que o CART apresenta sério viés seletivo. Este viés é representado na preferência aos preditores com mais categorias. Este artigo considera este problema e compara os algoritmos CART e CTREE, este considerado não-viesado, tomando como resultado suas capacidades preditoras. Os algoritmos foram aplicados a um grande banco de dados educacional (N = 3670089), no qual estão incluídos vários preditores nominais e ordinais com muitas categorias, um cenário no qual existe alta possibilidade de produzir viés seletivo. Foram geradas uma árvore do CTREE e outra do CART, ambas com 16 folhas, provenientes de um modelo com 53 variáveis preditoras e a nota da redação final, como desfecho. A árvore do algoritmo CART apresentou uma predição muito melhor. Para grandes bancos de dados, possivelmente o algoritmo CART é mais indicado do que o algoritmo CTREE.
Publicado
Como Citar
Edição
Seção
Licença
A Revista Avaliação Psicológica possui os direitos autorais de todos os artigos publicados por ela. A reprodução total dos artigos da Revista em outras publicações, ou para qualquer outro fim, por quaisquer meios, requer autorização por escrito do Editor. Reproduções parciais de artigos (resumo, abstract, resumen, mais de 500 palavras de texto, Tabelas, Figuras e outras ilustrações) deverão ter permissão por escrito do Editor e dos autores. Os autores concordam com a divulgação do resumo, abstract ou resumen por serviços de indexação e similares, a critério da Revista. Os direitos obtidos secundariamente não serão repassados em nenhuma circunstância.