Qual o valor monetário do registro clínico de um paciente? Se um hospital, por exemplo, responder que é baixo porque seus ‘dados não estão estruturados’, ele provavelmente desconhece que há um ou mais “Rembrandts no fundo do seu porão” (parafraseando David Kline e Kevin Rivette em seu livro ‘Rembrandts in the Attic’). Nos últimos anos, a Saúde relevou a um segundo plano o chamado unstructured-data, tratando-o como uma carga tóxica com menor valor do que os registros estruturados que consagram, por exemplo, um Big Data. Ainda assim, os dados não-estruturados aumentam em 55 a 65% a cada ano, fazendo com que as organizações de Saúde corram para encontrar maneiras de gerenciá-los e analisá-los de forma minimamente produtiva. Por meio de análises descritivas, preditivas e prescritivas os modelos de Health Analytics passaram a incorporar cada vez mais as plataformas de aprendizado de máquina e inteligência artificial. Entre outras funcionalidades, elas satisfazem um legítimo desejo da cadeia de saúde: fazer bom uso do chamado repositório não-estruturado. A fase de rejeição a essa colossal gleba de informações clínicas está no fim. Inúmeras healthtechs (startups & incumbents) estão despejando no mercado uma fabulosa gama de ferramentas que extraem automaticamente informações estruturadas de volumes de dados não-estruturados. O Hadoop é um bom exemplo. Esse conjunto de programas e procedimentos em código aberto pode processar, extrair, integrar, armazenar, rastrear, indexar e relatar insights a partir de dados brutos não-estruturados. Utilizado por quase todos os grandes players, como Amazon e Google, o Haddop é empregado como uma ‘espinha dorsal’ das operações de big data. Como esse, inúmeros outros modelos estão reinventando e revitalizando o uso, por exemplo, do prontuário do paciente (em papel ou eletrônico), que por décadas vem sendo explorado infimamente pelos ambientes de Data Analytics.
Inscreva-se no webinar Health Analytics: Abordagens práticas para o uso de dados assistenciais agora.
Em 2019, o valor monetário dos 55 milhões de registros longitudinais da atenção primária do NHS (Reino Unido) girava ao redor US$ 12 bilhões ao ano, segundo estudo da Ernst & Young (EY). Desnecessário dizer que o valor se refere a dados estruturados, mas principalmente a não-estruturados. A consultoria estimou ainda que um EHR utilizado no NHS tem valor médio ao redor de US$ 120 por paciente, sendo que o valor monetário de uma informação genômica está por volta de US$ 1800 por amostra de DNA (quando combinada com dados fenotípicos esse valor pode chegar a US$ 6000 por registro/paciente). Um hospital de 200 leitos no Brasil, com mais de 20 anos de funcionamento, não possui menos do que 10 a 20 mil prontuários em papel, ou digitalizados de forma semiestruturada. Essa massa de dados, em geral entulhada e empoeirada nos SAMEs, pode agora ser um ativo de grande valor monetário, principalmente com a chegada dos motores de machine learning para revitalização de dados não-estruturados. Health Analytics não é tecnologia, é ciência, e Inteligência Artificial (IA) é hoje o mais poderoso instrumento para ‘liquidificar dados’ e transformá-los em discernimento e cognição clínica.
Data Analytics é o primeiro passo para fazer parte do ‘clube das instituições de excelência em serviços médicos’. Mas se esperarmos que todos os dados estejam devidamente clean, ou seja, uniformemente estruturados, hierarquizados e codificados segundo parâmetros eletrônicos, vamos perder mais uma década no universo de Data Science. Mecanismos de IA permitem hoje que provedores de serviços sejam dezenas de vezes mais eficientes do que aqueles que esperam pela liturgia do papel-prontuário. Enquanto o mundo assiste perplexo o avanço do coronavírus, novas aplicações de big data, data analytics, deep learning e AI anunciam reais oportunidades de rastrear, ilustrar, informar e produzir valor sanitário com Health Analytics. Essa cosmologia passou a representar a diferença entre estar no mercado e ser o mercado: enquanto éramos engolidos pelas primeiras informações da covid-19, que nem nome oficial tinha, o Center for Systems Science and Engineering (CSSE) da Johns Hopkins University (JHU) espantou o mundo disponibilizando o seu mapa analítico epidemiológico. O dashboard coronavidiano da CSSE, sediada em Baltimore, mostrava em tempo real os casos da covid-19 relatados pela OMS, CDC, Centro Europeu de Prevenção de Doenças e pela Comissão Nacional de Saúde da China. O painel online, compartilhado pela primeira vez em 22 de janeiro, é uma obra-prima da engenharia de Data Analytics. Nada de muito original para a CSSE, que já havia identificado em 2019 mais de 25 municípios dos EUA com maior probabilidade de sofrer surtos de sarampo. Suas ferramentas de Health Analytics propeliram a Johns Hopkins ao panteão global de informações pandêmicas, reforçando o seu já consagrado brand no meio acadêmico e médico.
Ainda estamos embrionários na Economia do Conhecimento, que antecedeu a Economia Compartilhada, que foi precedida pela Economia Pandêmica e que deve nos levar a uma Economia de Revitalização. Podemos chamar o que vem pela frente de qualquer nome, mas há uma certeza nuclear: o novo ‘rembrandt’ é o dado clínico utilizável analiticamente. Identificar blocos de dados não-estruturados, imersos em milhões de registros clínicos, textos e imagens, sem qualquer regra hermenêutica, está além da capacidade do cérebro humano. Com essa impraticabilidade, os algoritmos de ML ‘saltaram para dentro do jogo’ reconhecendo, identificando e provendo a devida correspondência com os padrões exigidos em Data Analytics. Instrumentos como o Processamento de Linguagem Natural (PNL) passaram a apoiar as organizações de saúde na ‘vasculhação’ e mineração dos prontuários médicos. O modelo cNPL (Clinical Natural Language Processing), por exemplo, automatiza o processo de revisão de dados não-estruturados dos EHRs, separando e extraindo o que é relevante, sem deixar de codificar o resultado obtido com terminologias padronizadas e interoperáveis. Outra vertente são os aplicativos com Padrão de Reconhecimento, que utilizam ML e Tecnologia Cognitiva para analisar, viabilizar e decodificar dados não-estruturados. Sem falar no tradicional Reconhecimento Ótico de Caracteres (OCR), onde manuscritos e textos são mapeados e separados em blocos semiestruturados. Junte ao valor monetário dos dados não-estruturados, o seu valor social, denominado “social welfare value” pelo Bennett Institute for Public Policy em seu relatório “The Value of Data”, publicado em 2020. Sistemas Privados de saúde podem se dar ao luxo de minimizar a questão social, Sistemas Públicos não. O valor social passou a estar umbilicalmente ligado as máquinas de Health Analytics e seus instrumentos de suporte as decisões clínicas, epidemiológicas e socioculturais. A interação homem-máquina (HMI) mudará drasticamente após a pandemia, com o Social Big Data tendo um papel definitivo para responder perguntas como: o que acontecerá com os ‘consumidores imunocomprometidos’ que transformaram o e-commerce no epicentro do social-welfare-2020?
Ao contrário dos ativos físicos, dados não são rivais entre si, não são tangíveis, podem ser compartilhados sem privar seus titulares dos benefícios originais e, acima de tudo, podem ser reutilizados (ou “vendidos”) milhares de vezes para diferentes utilizações. Dados não-estruturados representam cerca de 80% de tudo o que é gerado pelos provedores de assistência médica. São ‘patinhos-feios’ que não se encaixam em formatos específicos e nem observam regras semânticas determinísticas, o que torna mais difícil ‘encaixotá-los’ nas práticas de Health Analytics. Ocorre que a mesma inteligência artificial que se beneficia dos dados estruturados, apoia os processos de estruturação de dados. Soluções de AutoML, por exemplo, permitem a criação de modelos de aprendizado de máquina a partir do zero sem requerer grande conhecimento de codificação. Ferramentas de Vertical-specific AI Automation, por outro lado, são mais dispendiosas, mas fornecem automação inteligente e altamente especializada para verticais específicas, permitindo manipular processos complexos com dados não-estruturados. Não menos interessantes são as plataformas de Intelligent RPA (robotic process automation), que aumentam as possibilidades do uso de IA no cleanning de dados não-estruturados. O software de PNL emtelliPro, por exemplo, que recebeu endosso da Johnson & Johnson Innovation (Toronto), tem o potencial de transmutar 80% de todos os dados médicos bloqueados em formato não-estruturado para formato estruturado. A empresa MetiStream, sediada na Virginia (EUA), utiliza Big Data, PNL e ML para ‘revelar informações ocultas’ em dados clínicos não-estruturados. Sua solução, Ember Clinical Reviewer (CR), acelera o analytics dos não-estruturados identificando rapidamente pacientes com a Covid-19, além de explorar inúmeras funcionalidades em pesquisa preditiva. Os sistemas de saúde estão gerando descomunais silos de dados pandêmicos que podem servir na pesquisa clínico-farmacêutica ou epidemiológica. Como explica o Dr. John Halamka, da Mayo Clinic: “Em nosso caso, alguns dados são estruturados, como aqueles extraídos do EHR da Epic, mas muitos não são, como os originários de TCs e Ressonâncias Magnéticas. Alguns nunca foram digitalizados, como, por exemplo, 30 milhões de lâminas de patologia. Imagine o poder de um algoritmo em AI que disponibilize todos os slides de patologia que já foram criados na história da Mayo!".
Aplicações e modelos de Health Analytics, principalmente aqueles que se banham cada vez mais no oceano da inteligência artificial, farão a diferença para aqueles que resolverem ‘explorar o seu porão’. Big techs, como IBM, GE Healthcare, McKesson, Philips, etc. se digladiam com centenas de startups que chegam ao mercado com ‘volúpia e voracidade estruturante’. Sempre haverá a tentação de começar tudo de novo, adquirindo os últimos modelos de EHRs ou as novas plataformas de Health Analytics, deixando no esquecimento o legado da ‘saúde-não-estruturada”. Nunca poderemos condenar quem escolher esse caminho, mas será como deixar aos cupins o ‘Rembrandt encostado no fundo do seu porão’.
Guilherme S. Hummel
Coordenador Científico - HIMSS@Hospitalar Forum
EMI - Head Mentor
Participe do Webinar “Health Analytics: Abordagens práticas para o uso de dados assistenciais”, em 18/06 às 17h, e junte-se a nós no debate sobre o tema acima. Inscreva-se pelo link!