Inteligência artificial e algoritmos

261 Diego Pinheiro da Silva, Blanda Helena de Mello, Marta Rosecler Bez e Sandro José Rigo Figura 1 – Pipeline construído para exportação dos dados Fonte: Elaborado pelo autor (SILVA, 2023). Na primeira etapa, um script SQL definido (consultas e procedimentos) foi executado no banco de dados para identificar suas informações, sem especificar pacientes, mas focando nos registros de atendimento realizados. Esse processo foi aplicado para evitar a identificação exclusiva de pacientes e profissionais antes que essas informações fossem processadas e exportadas. Foi implementada uma aplicação que se conecta ao banco de dados do sistema EHR para consultar os registros com os campos relevantes. Enquanto os registros são extraídos, as etapas de anotação do dataset e enriquecimento com informações clínicas estruturadas são aplicadas. A primeira etapa, necessária para gerar o dataset e utilizar a abordagem proposta no futuro, consiste em anonimizar e exportar os registros do banco de dados. Frequentemente, os pesquisadores precisam trabalhar com dados extraídos de bancos de dados para usar o histórico clínico do paciente. No entanto, é necessário aplicar técnicas de agregação sem a divulgação de dados pessoais do paciente para manter sua privacidade. Isso pode ser conseguido com o uso da pseudo-anonimização (Pereira et al., 2021). A anonimização é o processo que remove a associação entre o conjunto de dados de identificação e o titular dos dados. A pseudo- -anonimização é um tipo específico de anonimato que remove a associação com um titular dos dados e adiciona uma associação entre um determinado conjunto de características relacionadas ao titular dos dados e umoumais pseudônimos, de forma a inviabilizar a identificação de um indivíduo. A pseudo-anonimização pode ser recuperável ou irrecuperável, ou seja, com ou sem a possibilidade de identificar o titular dos dados. Um esquema recuperável pode ser uma

RkJQdWJsaXNoZXIy MjEzNzYz