Evaluación, análisis y selección de técnicas de machine learning para clasificación dentro del proceso de minería de datos que permita la identificación de perfiles característicos asociados a la deserción universitaria en el programa de ingeniería de sistemas de la universidad de Cundinamarca extensión Facatativá
2019-09-13
Show full item record
Abstract
Resumen En el presente proyecto (Fase I) se establece el diseño y desarrollo de un marco procedimental para obtener un prototipo de modelo predictivo que sirva como base para el desarrollo de una posterior herramienta web que apoye el proceso de admisión de aspirantes al programa de Ingeniería de Sistemas, haciendo uso de la metodología de proceso KDD, enlazando las variables a estudiar, en las cuatro dimensiones propuestas por el MEN (institucionales, académicas, socioeconómicas e individuales) a dos algoritmos de machine learning que pertenecen a la tarea de clasificación la cual permite extraer conocimiento (perfiles característicos) y realizar predicciones sobre la deserción en el programa de ingeniería de sistemas. Como tecnología de desarrollo, se emplea el lenguaje interpretado Python y se usan las librerías, Pandas para el tratamiento de datos y Scikit-Learn que provee todos los algoritmos necesarios para el proceso además de ser complemento para el análisis estadístico. El mecanismo de KDD se estableció en cinco fases genéricas. Las dos primeras fases hacen referencia a la obtención y selección de datos de cada variable seleccionada del problema, posteriormente, se realizó una limpieza y transformación de los datos que alimentan al algoritmo y se ajustaron los parámetros a dos técnicas predictivas elegidas luego de un riguroso y sistemático proceso de evaluación y selección, que luego ejecutarán una operación de minado de datos con el fin de obtener una predicción sobre deserción con su respectiva explicación a través de reglas para cualquier aspirante a la carrera para así poder proporcionar una posterior evaluación e interpretación de los resultados. Finalmente, como metodología de desarrollo de software se opta por “SCRUM”, gracias a que este presenta buenas practicas colaborativas y agilidad en el desarrollo de aplicaciones. Abstract The current investigation project (Phase 1) establishes the design and development of a procedural framework to obtain a prototype of a predictive model that serves as a basis for the development of a subsequent web tool that supports the admission process of applicants to the Systems Engineering program, using the KDD process methodology, linking the variables to be studied, in the four dimensions proposed by the Ministry of National Education MEN (institutional, academic, socio-economic and individual) to two machine learning algorithms that belong to the classification task which allows to extract knowledge (characteristic profiles) and to make predictions about the desertion in the systems engineering program. As development technology, the Python interpreted language is used, and the libraries, Pandas for data processing and ScikitLearn are used, which provides all the necessary algorithms for the process as well as being a complement to the statistical analysis. The KDD mechanism was established in five generic phases. The first two phases refer to the data collection and selection for each selected variable from the problem. Afterwards, a cleaning and transformation of the data that fed the algorithm was performed and the parameters were adjusted to two selected predictive techniques after a rigorous and systematic evaluation and selection process, which will then execute a data mining operation in order to obtain a prediction about desertion with its respective explanation through rules for any career candidate in order to be able to provide a posterior evaluation and interpretation of the results. Finally, as a software development methodology, SCRUM was chosen because it presents good collaborative practices and agility in the development of applications.The following license files are associated with this item:
Línea gratuita: 018000180414 | e-mail: formacion.biblioteca@ucundinamarca.edu.co
Seccional Girardot: Carrera 19 No. 24-209 | (+571) 8335071
Seccional Ubaté: Calle 6 No. 9-80 | (+571) 8553055
Extensión Chía: Autopista Chía - Cajicá | Sector “El Cuarenta” | (+571) 8281483 Ext. 418
Extensión Chocontá: Carrera 3 No. 5-71 | (+571) 8562520
Extensión Facatativá: Calle 14 con Avenida 15 | (+571) 8920706
Extensión Soacha: Diagonal 9 No. 4 B-85 | (+571) 7219220
Extensión Zipaquirá: Carrera 7 No. 1-31 | (+571) 8515792
Oficinas Bogotá D.C.: Carrera 20 No. 39-32 Teusaquillo | (+571)7448180
Notificaciones judiciales:
Dirección Jurídica (+571) 8281483 Ext. 115 | e-mail oficinajuridicaudec@ucundinamarca.edu.coPolíticas de Tratamiento de Datos Personales
© 2018 UCUNDINAMARCA Generación Siglo 21
Vigilada Mineducación
Reconocida por resolución No. 19530, de Diciembre 30 de 1992 (MEN)
Oficina Asesora de Comunicaciones
Derechos reservados