Predição de mortalidade hospitalar em pacientes com lesões traumáticas: comparando diferentes SMOTE
BMC Medical Research Methodology volume 23, número do artigo: 101 (2023) Citar este artigo
1026 acessos
1 Citações
1 Altmétrico
Detalhes das métricas
O trauma é um dos problemas de saúde pública mais críticos em todo o mundo, levando à morte e à incapacidade e influenciando todas as faixas etárias. Portanto, há grande interesse em modelos de predição de mortalidade em pacientes traumatizados internados em UTI. O principal objetivo do presente estudo é desenvolver e avaliar ferramentas de aprendizado de máquina baseadas em SMOTE para prever mortalidade hospitalar em pacientes traumatizados com dados desequilibrados.
Este estudo de coorte retrospectivo foi realizado em 126 pacientes traumatizados internados em uma unidade de terapia intensiva do hospital Besat, na província de Hamadan, oeste do Irã, de março de 2020 a março de 2021. Os dados foram extraídos dos registros de informações médicas dos pacientes. De acordo com a propriedade desequilibrada dos dados, técnicas SMOTE, nomeadamente SMOTE, Borderline-SMOTE1, Borderline-SMOTE2, SMOTE-NC e SVM-SMOTE, foram utilizadas para pré-processamento primário. Em seguida, foram utilizados os métodos Decision Tree (DT), Random Forest (RF), Naive Bayes (NB), Artificial Neural Network (ANN), Support Vector Machine (SVM) e Extreme Gradient Boosting (XGBoost) para prever o comportamento hospitalar dos pacientes. mortalidade com lesões traumáticas. O desempenho dos métodos utilizados foi avaliado por sensibilidade, especificidade, Valor Preditivo Positivo (VPP), Valor Preditivo Negativo (VPN), acurácia, Área Sob a Curva (AUC), Média Geométrica (G-média), pontuação F1 e P -valor do teste de McNemar.
Dos 126 pacientes internados em UTI, 117 (92,9%) sobreviveram e 9 (7,1%) faleceram. O tempo médio de seguimento desde a data do trauma até a data do desfecho foi de 3,98 ± 4,65 dias. O desempenho dos algoritmos de ML não é bom com dados desequilibrados, enquanto o desempenho dos algoritmos de ML baseados em SMOTE é significativamente melhorado. A área média sob a curva ROC (AUC) de todos os modelos baseados em SMOTE foi superior a 91%. A pontuação F1 e as médias G antes do balanceamento do conjunto de dados estavam abaixo de 70% para todos os modelos de ML, exceto ANN. Em contraste, a pontuação F1 e as médias G para os conjuntos de dados balanceados atingiram mais de 90% para todos os modelos baseados em SMOTE. Entre todos os métodos de ML baseados em SMOTE, RF e RNA baseados em SMOTE e XGBoost baseados em SMOTE-NC alcançaram o valor mais alto para todos os critérios de avaliação.
Este estudo mostrou que os algoritmos de ML baseados em SMOTE predizem melhor os resultados em lesões traumáticas do que os algoritmos de ML. Eles têm o potencial de auxiliar os médicos da UTI na tomada de decisões clínicas.
Relatórios de revisão por pares
O trauma é um dos problemas de saúde pública mais críticos do mundo, levando à morte e à incapacidade e influenciando todas as faixas etárias [1]. Lesões traumáticas são a principal causa de mortalidade nas primeiras quatro décadas de vida [2]. O trauma causa 4,4 milhões de mortes anualmente e é responsável por quase 8% de todas as mortes em todo o mundo [1, 3]. Neste sentido, é importante encontrar soluções para reduzir o impacto das lesões traumáticas e o número de mortes resultantes de traumas. Por exemplo, melhorar a capacidade de prever o resultado de um paciente traumatizado com um alto grau de precisão e identificar fatores importantes que influenciam o resultado do paciente pode ajudar as equipes médicas de trauma em seus esforços rápidos para tratar pacientes traumatizados.
Muitos estudos anteriores utilizaram métodos tradicionais, como os modelos logísticos e de regressão de Poisson, para identificar fatores que influenciam as lesões traumáticas [4,5,6]. Numerosos estudos também utilizaram o Trauma and Injury Severity Score (TRISS) como um dos modelos mais comuns, que se baseia na regressão logística (LR) e utiliza uma pequena coorte de um único centro para prever a probabilidade de sobrevivência de pacientes com lesões traumáticas. lesões [7]. No entanto, o TRISS e suas diversas modificações são ferramentas baseadas em evidências, e os resultados de alguns estudos indicam que podem enganar os médicos ao classificar erroneamente a condição do paciente [8]. No entanto, ambas as categorias de modelos tiveram um desempenho ruim quando colinearidade, heterocedasticidade, interações de ordem superior e relações não lineares entre variáveis estavam presentes [9,10,11]. Portanto, são necessárias ferramentas prognósticas mais valiosas e precisas, que não se limitem a essas suposições, para alcançar melhores resultados para os pacientes e fazer o melhor uso dos recursos.