Classificação automática de arritmias cardíacas através de redes neurais convolucionais multimodais com mecanismo de atenção

OrientadorCastro, Adriana Rosa Garcez
Orcid do Orientador0000-0001-5884-4511
Lattes do Orientador5273686389382860
AutorFlexa Di Paolo, Ítalo
Orcid do Autor0000-0001-6968-6571
Lattes do Autor7195767161641034
Membro da bancaAraujo, Jasmine Priscyla Leite de
Membro da bancaOliveira, Roberto Célio Limão de
Membro da bancaPonte, Márcio José Moutinho da
Membro da bancaOhashi Junior, Orlando Shigueo
Orcid Membro da banca0000-0003-3514-0401
Orcid Membro da banca0000-0002-6640-3182
Orcid Membro da banca0000-0002-0724-3721
Lattes membro da banca4001747699670004
Lattes membro da banca4497607460894318
Lattes membro da banca4760076685971693
Lattes membro da banca8905793797626608
Data de Acesso2025-11-19T13:40:03Z
Data disponível2025-11-19T13:40:03Z
Ano de publicação2025-02-19
AbstractThe electrocardiogram (ECG) is a non-invasive technology capable of recording heartbeats and is the most widely used technique for diagnosing heart diseases. Among the conditions that can be diagnosed, cardiac arrhythmia is one of the most common heart disorders, characterized by irregular heartbeats. However, interpreting long ECG signal recordings is a tiring and challenging task when performed visually, which can be time-consuming for medical specialists. Advances in technology and artificial intelligence have enabled progress in the study and development of automatic systems to support medical diagnosis. In this context, this thesis aims to propose a framework for the classification of cardiac arrhythmias based on a multimodal Convolutional Neural Network (CNN) with an attention mechanism. The framework takes as input ECG signal segments transformed into images using the Hilbert Space Filling Curve (HSFC) and Recurrence Plot (RP) techniques. It was developed and evaluated using the public MIT-BIH and PTB databases, following the AAMI (ANSI/AAMI EC57) guidelines and considering both inter-patient and intra-patient paradigms. Due to the high class imbalance in the databases, complementary data augmentation techniques were evaluated during the experimental phase, with two techniques standing out: SMOTE and WGAN-GP. The results achieved, considering variations in the input structure related to the number of ECG leads (MLII lead and V + MLII leads), can be considered competitive with state-of-the-art works. Particularly noteworthy are the results of the structure for two ECG leads, which achieved, for the MIT-BIH database in the intra-patient paradigm, 99.72%, 98.19%, 97.26%, 99.34%, and 97.72% for overall accuracy, precision, sensitivity, specificity, and F1-Score, respectively. In the inter-patient paradigm, the results obtained were 98.48%, 94.15%, 80.23%, 96.34%, and 81.91%, respectively.
ProveniênciaSubmitted by Ítalo Flexa Di Paolo (itflexa@uepa.br) on 2025-11-14T14:26:01Z workflow start=Step: editstep - action:claimaction No. of bitstreams: 1 Tese UFPA-PPGEE - Italo Flexa Di Paolo.pdf: 4151987 bytes, checksum: 8c808d93c741eae282f96592390b14f9 (MD5)en
ProveniênciaStep: editstep - action:editaction Approved for entry into archive by Cássio Morais (cassiomorais@ibict.br) on 2025-11-19T13:40:03Z (GMT)en
ProveniênciaMade available in DSpace on 2025-11-19T13:40:03Z (GMT). No. of bitstreams: 1 Tese UFPA-PPGEE - Italo Flexa Di Paolo.pdf: 4151987 bytes, checksum: 8c808d93c741eae282f96592390b14f9 (MD5) Previous issue date: 2025-02-19en
Referência bibliográficaDi Paolo, Ítalo Flexa. Classificação automática de arritmias cardíacas através de redes neurais convolucionais multimodais com mecanismo de atenção. Tese (Doutorado) – Universidade Federal do Pará, Instituto de Tecnologia, Programa de Pós-Graduação em Engenharia Elétrica, Belém, 2025.
ResumoO eletrocardiograma (ECG) é uma tecnologia não invasiva capaz de registrar os batimentos cardíacos, sendo a técnica mais utilizada para o diagnóstico de doenças do coração. Dentre as doenças que podem ser diagnosticadas, a arritmia cardíaca é uma das cardiopatias mais comuns, sendo caracterizada pela ocorrência de batimentos cardíacos irregulares. Entretanto, a interpretação de longos registros de sinais de ECG é uma tarefa cansativa e desafiadora, quando feita de forma visual, que pode demandar tempo por parte dos médicos especialistas. A evolução da tecnologia e da inteligência artificial tem permitido avanços para o estudo e desenvolvimento de sistemas automáticos para auxílio ao diagnóstico médico. Dentro desse contexto, esta tese visa apresentar a proposta de uma estrutura para classificação de arritmias cardíacas baseada em uma Rede Neural Convolucional (CNN) multimodal com mecanismo de atenção. A estrutura recebe como entrada segmentos de sinal ECG transformados em imagens a partir das técnicas Hilbert Space Filling Curve (HSFC) e Recurrence Plot (RP) e foi desenvolvida e avaliada a partir do banco de dados público MIT-BIH e PTB, seguindo as diretrizes da AAMI (ANSI/AAMI EC57) e considerando os paradigmas interpaciente e intrapaciente. Devido ao alto desbalanceamento de classes nos bancos de dados, técnicas complementares de aumento de dados foram avaliadas durante a fase de experimentos, destacando-se duas: SMOTE e WGAN-GP. Os resultados alcançados, considerando variações na entrada da estrutura relacionadas ao número de derivações do ECG (derivação MLII e V + MLII), podem ser considerados competitivos com trabalhos apresentados no estado da arte, com destaque para os resultados da estrutura para duas derivações do ECG, tendo obtido, para a base MIT-BIH, no paradigma intrapaciente, 99,72%, 98,19%, 97,26%, 99,34% e 97,72% de acurácia global, precisão, sensibilidade, especificidade e F1-Score, respectivamente. No paradigma interpaciente, os resultados atingidos foram de 98,48%, 94,15%, 80,23%, 96,34% e 81,91%, respectivamente.
Agência de financiamentoUniversidade do Estado do Pará
Agência de financiamentoGoverno do Estado do Pará
Identificador Capes15001016004D9
CitaçãoDi Paolo (2025)
Identificador CNPq004405003008
URL da página Cursohttps://ppgee.propesp.ufpa.br
Identificador ISNI0000000121715249
URL da página do programahttps://ppgee.propesp.ufpa.br/index.php/br/
URL da página da instituiçãohttps://ufpa.br
Identificador ROR03q9sr818
URIhttps://deposita.ibict.br/handle/deposita/825
Identificador WikidataQ4558480
Área de avaliação CapesEngenharias IV
Área de conhecimento CNPqEngenharias
IdiomaPortuguês
InstituiçãoUniversidade Federal do Pará
PaísBrasil
Grau do cursoDoutorado
Departamento do cursoInstituto de Tecnologia
Nome do cursoDoutorado em Engenharia Elétrica - Computação Aplicada
Tipo do cursoAcadêmico
Natureza jurídica da instituiçãoInstituição pública
Nome do programa de pós-graduaçãoPrograma de Pós-Graduação em Engenharia Elétrica
Tipo da instituiçãoUniversidade
Tipo de acessoAcesso aberto
Palavra ChaveClassificação de arritmias
Palavra ChaveEletrocardiograma
Palavra ChaveRedes Neurais Convolucionais
Palavra ChaveSinais temporais como imagens
Palavra ChaveMecanismo de atenção
Palavra chave em outro idiomaClassification of arrhythmias
Palavra chave em outro idiomaElectrocardiogram
Palavra chave em outro idiomaConvolutional Neural Networks
Palavra chave em outro idiomaTime series as images
Palavra chave em outro idiomaSynthetic images
Palavra chave em outro idiomaAttention mechanism
TítuloClassificação automática de arritmias cardíacas através de redes neurais convolucionais multimodais com mecanismo de atenção
Titúlo AlternativoAutomatic classification of cardiac arrhythmias using multimodal convolutional neural networks with an attention mechanism
TipodoctoralThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tese UFPA-PPGEE - Italo Flexa Di Paolo.pdf
Tamanho:
3.96 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.41 KB
Formato:
Item-specific license agreed upon to submission
Descrição:

Coleções