Araujo Zarate, PedroMartínez Lobo, DannyContreras Chávez, John2024-10-152025-05-232024-10-152025-05-232024-10-152215-7840https://hdl.handle.net/11227/19530Introducción: La mortalidad fetal continúa siendo un problema de salud pública en Colombia, que afecta significativamente el bienestar familiar y social. Es fundamental identificar los factores asociados y predecir el riesgo para implementar intervenciones efectivas. Objetivo: Desarrollar un modelo estadístico para clasificar a las gestantes en riesgo de mortalidad fetal en Colombia durante el año 2022. Métodos: Se realizó un estudio de casos y controles utilizando datos de nacidos vivos y defunciones fetales reportados por el Departamento Administrativo Nacional de Estadística. Se aplicaron técnicas de imputación de datos faltantes y balanceo de clases mediante el método SMOTE. Se evaluaron cuatro modelos de clasificación: regresión logística, K-Nearest Neighbors (KNN), árbol de decisión y máquina de soporte vectorial. El rendimiento de los modelos se comparó utilizando métricas de exactitud, sensibilidad, especificidad, puntaje F1 y precisión. Resultados: El conjunto de datos final incluyó 566.806 registros, con 562.828 nacidos vivos y 3.978 muertes fetales. El modelo KNN presentó el mejor rendimiento, con una exactitud de 0,988, sensibilidad de 0,989, especificidad de 0,986 y puntaje F1 de 0,988. Los factores asociados significativamente con la probabilidad de nacer vivo incluyeron el número de hijos, el sexo, el área de residencia, el régimen de afiliación, las semanas de gestación, el peso al nacer, la edad y el nivel educativo de la madre. Conclusión: El modelo KNN demostró ser efectivo en la predicción del riesgo de mortalidad fetal. Los resultados resaltan la importancia de factores socioeconómicos y clínicos en la supervivencia neonatal, sugiriendo la necesidad de intervenciones focalizadas para reducir las muertes fetales en Colombia.Introduction: Fetal mortality continues to be a public health problem in Colombia, significantly affecting family and social well-being. It is essential to identify associated factors and predict risk in order to implement effective interventions. Objective: Develop a statistical model to classify pregnant women at risk of fetal mortality in Colombia during 2022. Methods: A case-control study was conducted using data on live births and fetal deaths reported by the National Administrative Department of Statistics. Data imputation and class balancing techniques were applied using the smote method. Four classification models were evaluated: logistic regression, K-Nearest Neighbors (KNN), decision tree, and support vector machine. Model performance was compared using accuracy, sensitivity, specificity, F1 score, and precision metrics. Results: The final dataset included 566,806 records, with 562,828 live births and 3,978 fetal deaths. The KNN model showed the best performance, with an accuracy of 0.988, sensitivity of 0.989, specificity of 0.986, and F1 score of 0.988. Factors significantly associated with the probability of live birth included the number of children, sex, area of residence, affiliation regime, gestational weeks, birth weight, and mother's age and educational level. Conclusions: The KNN model proved effective in predicting the risk of fetal mortality. The results highlight the importance of socioeconomic and clinical factors in neonatal survival, suggesting the need for targeted interventions to reduce fetal deaths in Colombia.application/pdfspaPedro Araujo Zarate, Danny Martínez, John Jairo Contreras Chávez - 2024https://creativecommons.org/licenses/by-nc-nd/4.0Mortalidad fetalModelos estadísticosSalud públicaMachine learningFetal DeathStatistical ModelsPublic HealthMachine LearningModelos predictivos en la clasificación de nacidos vivos y mortinatos: un estudio comparativo entre técnicas de machine learning y regresión logística en función de variables sociodemográficas y clínicasArtículo de revistaPredictive models in the classification of live births and stillbirths: a comparative study between machine learning and logistic regression techniques as a function of sociodemographic and clinical variables10.32997/rcb-2024-4940http://purl.org/coar/access_right/c_abf22389-7252https://doi.org/10.32997/rcb-2024-4940info:eu-repo/semantics/openAccessEsta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.