Geração de dados sintéticos para classificação de disléxicos por meio de aprendizado de máquina
Journal of health informatics(2021)
摘要
Objetivo: Este estudo pretende aplicar a tecnica de geracao de dados sinteticos com auxilio de tecnicas de limpeza de dados para a classificacao de dislexicos e nao - dislexicos. Metodo: Os outliers foram selecionados por especialista. Foi feito uma geracao sintetica de dados. para cada um de cinco algoritmos foram selecionados caracteristicas com busca exaustiva. Cada algoritmo foi executado com as caracteristicas selecionadas e entao suas curvas de calibracao foram comparadas. Resultados: A regressao logistica se destacou como o melhor algoritmo, apresentando o resultado de 99% de acuracia e area sob a curva ROC de 0,999, alem de ter obtido a melhor curva de calibracao Conclusao: O uso da geracao sintetica de dados e selecao de caracteristicas foram capazes de fazer todos os algoritmos avaliados obterem otimos resultados na classificacao de dislexicos e nao dislexicos. A regressao logistica foi selecionado como melhor algoritmo para classificacao de dislexicos.
更多查看译文
AI 理解论文
溯源树
样例
![](https://originalfileserver.aminer.cn/sys/aminer/pubs/mrt_preview.jpeg)
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要