Viracacha Viracacha, Corin Jazmin2021-05-242021-05-242021-05-24http://hdl.handle.net/20.500.12558/3549Resumen El presente proyecto está enfocado a determinar qué factores influyen en las brechas de genero de la educación básica primaria y secundaria, para ello se tuvieron en cuanto los resultados académicos y socioeconómicos de las pruebas saber 3°, 5° y 9°; con esta información se realizó por medio de técnicas de minería de datos en la educación, un análisis en el cual se identifica la incidencia de cada variable sobre el comportamiento de los estudiantes. Para el análisis descriptivo se implementó el algoritmo K-Means, el cual se encarga de agrupar la información según sus características, de esta manera se identificaron los grupos con mayor concentración de datos; una vez obtenidos los resultados del algoritmo se demostró la relación de dichos resultados por año y tipo de prueba. Asimismo se realizó un análisis predictivo, para determinar los posibles puntajes a obtener en matemáticas y lenguaje. Con la información socioeconómica de los estudiantes, se realizó un análisis por medio del algoritmo J48, el cual da como resultado un árbol de decisión; de este se extrajeron las reglas predictivas de los puntajes a obtener de acuerdo a cada una de las variables analizadas. Con la información obtenida de los análisis descriptivos y predictivos se procedió a realizar un aplicativo, en el cual se muestra gráficamente los resultados y la relación de estos frente a cada año y tipo de prueba. Abstract This project is focused on determining which factors influence the gender gaps in primary education, for this purpose, the academic and socio-economic results of the tests were taken into account 3rd, 5th and 9th; with this information was done through data mining techniques in education, an analysis identifying the impact of each variable on student behavior. For descriptive analysis, the K-Means algorithm was implemented, which is responsible for grouping the information according to its characteristics, in this way the groups with the highest concentration of data were identified; once the results of the algorithm have been obtained, it seeks to demonstrate the relationship of these results by year and type of test. A predictive analysis was also conducted to determine the possible scores to be obtained in mathematics and language. With students' socioeconomic information, an analysis was performed using the J48 algorithm, which results in a decision tree, from this were extracted the predictive rules of the scores to be obtained according to each of the variables analyzed. With the information obtained from the descriptive and predictive analyses, an application was carried out, which graphically shows the results and their relationship to each year and type of test.spaAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Minería de datosBrechas de géneroPruebas saberEducación básicaClusterizaciónPredicciónData miningGender gapsKnowledge testsBasic educationClusteringPredictionAplicativo Web Para La Construcción De Indicadores De Brecha De Género En La Educación Básica Primaria Y Media Del País.Trabajo de grado