Uma segunda máquina kernel para mineração de dados clínicos para informar a tomada de decisões médicas

Scientific Reports volume 13, Artigo número: 10459 (2023) Citar este artigo

432 Acessos

6 Altmétrico

Detalhes das métricas

A tomada de decisões médicas auxiliada por aprendizado de máquina apresenta três desafios principais: alcançar a parcimônia do modelo, garantir previsões confiáveis e fornecer recomendações em tempo real com alta eficiência computacional. Neste artigo, formulamos a tomada de decisão médica como um problema de classificação e desenvolvemos uma máquina de kernel de momento (MKM) para enfrentar esses desafios. A ideia principal da nossa abordagem é tratar os dados clínicos de cada paciente como uma distribuição de probabilidade e aproveitar as representações de momento dessas distribuições para construir o MKM, que transforma os dados clínicos de alta dimensão em representações de baixa dimensão, mantendo informações essenciais. Em seguida, aplicamos esta máquina a vários conjuntos de dados clínicos pré-cirúrgicos para prever resultados cirúrgicos e informar a tomada de decisões médicas, o que requer significativamente menos poder computacional e tempo para classificação, ao mesmo tempo que produz um desempenho favorável em comparação com os métodos existentes. Além disso, utilizamos conjuntos de dados sintéticos para demonstrar que a estrutura de mineração de dados baseada em momentos desenvolvida é robusta ao ruído e à falta de dados, e alcança a parcimônia do modelo, proporcionando uma maneira eficiente de gerar previsões satisfatórias para auxiliar na tomada de decisões médicas personalizadas.

A cirurgia, como uma intervenção médica importante, é geralmente considerada quando outros tratamentos resultam em resultados insatisfatórios. A previsão de eventos adversos após a cirurgia com base nos dados clínicos pré-cirúrgicos dos pacientes, como dados do registro eletrônico de saúde (EHR), é de importância crucial para informar médicos e pacientes para a tomada de decisões1,2. Nos últimos anos, o aumento da disponibilidade de dados clínicos e do poder computacional estimulou enormemente o desenvolvimento de técnicas de aprendizado de máquina (ML) para extrair informações de dados clínicos. Em particular, os algoritmos de ML fizeram avanços significativos em procedimentos médicos assistidos por IA para previsão pré-operatória de resultados pós-cirúrgicos por meio de EHRs3,4. O problema geral de ML se concentra em encontrar uma função apropriada para mapear cada ponto de dados de entrada \({\textbf{X}}\) para a saída desejada \({\textbf{y}}\), ou seja,

Esta tarefa é particularmente desafiadora para conjuntos de dados contendo registros clínicos de grande tamanho e tipos mistos de dados, incluindo diagnósticos, tratamentos, sinais vitais e valores laboratoriais5.

Na última década, vários métodos auxiliados por ML foram propostos para auxiliar a tomada de decisões médicas através da previsão de eventos pós-cirúrgicos. Por exemplo, para cirurgia para perda de peso, contribuições notáveis incluem a aplicação de regressão logística (LR) e regressão de Poisson (PR) para estimar a taxa de readmissão6, a utilização de redes neurais (NNs) e máquinas de aumento de gradiente (GBMs) para prever vazamento gastrointestinal e tromboembolismo venoso7,8, e o desenvolvimento do algoritmo super learner para prever o risco de readmissão em 30 dias após cirurgia bariátrica9,10. Além de avaliar possíveis eventos pós-cirúrgicos, os métodos de ML têm sido amplamente aplicados para identificar anormalidades em imagens médicas, como lesões pré-cancerosas ou pré-malignas11,12,13,14. Os exemplos primários vão desde uma abordagem de aprendizagem profunda para a previsão de mortalidade para pacientes com doença coronariana e insuficiência cardíaca15 até métodos quantitativos de extração de características de imagem para o prognóstico de revascularização precoce em pacientes com suspeita de doença arterial coronariana16. Algoritmicamente, as redes neurais profundas têm sido atraentes para pesquisadores e profissionais médicos, devido à sua capacidade de descobrir estruturas ocultas em grandes conjuntos de dados, levando a uma alta probabilidade de alcançar resultados satisfatórios em condições adequadas17. Entre esses trabalhos, a integração de técnicas de ML na pesquisa médica, embora bem-sucedida em muitos aspectos, geralmente sofre de baixa eficiência computacional devido à estrutura heterogênea, por exemplo, devido à esparsidade e irregularidade, e ao grande tamanho dos dados clínicos18. Em geral, a complexidade dos algoritmos de ML cresce exponencialmente em tempo e uso de memória em função do tamanho dos dados. Além disso, para produzir melhor desempenho, as redes neurais profundas sacrificam ainda mais a robustez ao ruído e a parcimônia do modelo, além da eficiência computacional .

0\) is a constant controlling the sparsity of the solution. Moreover, \(\bar{{\textbf{K}}}^{(j)} = \Gamma {\textbf{K}}^{(j)} \Gamma\) and \(\bar{{\textbf{L}}} = \Gamma {\textbf{L}} \Gamma\) are centered Gram matrices with the entries \({\textbf{K}}_{m,n}^{(j)} = k(p_{j,m},p_{j,n})\) and \({\textbf{L}}_{m,n} = l(y_m,y_n)\) defined by using some kernel functions k and l, where \(y_i\) denotes the class label of the \(i^{\textrm{th}}\) patient and \(\Gamma = {\textbf{I}}_N - \frac{1}{N} {\textbf{1}}_N {\textbf{1}}^{\top }_N\) is the centering matrix. Moreover, for memory and computational efficiency, we use Block HSIC Lasso24 in our experiments./p>