Pesquisadores de universidades e instituições de pesquisa de todo o país passam, a partir de hoje (18/06), a ter acesso ao COVID-19 Data Sharing/BR, o primeiro repositório do país com dados demográficos e exames clínicos e laboratoriais anonimizados de pacientes que fizeram testes para COVID-19 em unidades laboratoriais e hospitais do Estado de São Paulo.
O objetivo da plataforma é compartilhar informações clínicas de pacientes anonimizados para subsidiar pesquisas científicas sobre a doença nas diversas áreas do conhecimento.
A base de dados compartilhados é resultado de uma iniciativa da FAPESP, em parceria com a Universidade de São Paulo (USP), e já conta com a adesão de hospitais e unidades laboratoriais de atendimento a pacientes.
A parceria reúne, nesta primeira etapa, o Grupo Fleury e os hospitais Sírio-Libanês e Israelita Albert Einstein, que disponibilizaram informações, infraestrutura, tecnologias e recursos humanos próprios para viabilizar o compartilhamento de dados. A FAPESP está contatando outras instituições de atendimento a pacientes para compartilhar informações no repositório COVID-19 Data Sharing/BR.
“A ideia central da plataforma é subsidiar a pesquisa científica sobre a COVID-19 ao compartilhar dados que não seriam disponibilizados de outra forma, de modo a mobilizar a comunidade de cientistas da computação, matemáticos e analistas de informações, para que possam contribuir com novas ideias para o enfrentamento da atual epidemia da doença”, disse Luiz Eugênio Mello, diretor científico da FAPESP, durante coletiva de imprensa on-line para o lançamento do repositório, realizada pela FAPESP.
O repositório abrigará, inicialmente, dados abertos e anonimizados de 75 mil pacientes, 6.500 dados de desfecho e um total de mais de 1,6 milhão de exames clínicos e laboratoriais realizados em todo o país pelo Grupo Fleury e na cidade de São Paulo pelos hospitais Sírio-Libanês e Israelita Albert Einstein desde novembro de 2019.
Ainda que o primeiro caso da doença no Brasil tenha sido registrado em fevereiro, pelo Hospital Albert Einstein, o período de cobertura dos dados permitirá que as pesquisas analisem o histórico de saúde dos pacientes, bem como busquem evidências de sintomas da COVID-19 em pacientes atendidos anteriormente. Novos dados serão inseridos pelo Grupo Fleury, Hospital Sírio-Libanês e Einstein regularmente.
O repositório disponibilizará três categorias de informação: dados demográficos (gênero, ano de nascimento e região de residência do paciente) e dados de exames clínicos e/ou laboratoriais, além de informações, quando disponíveis, sobre a movimentação do paciente, como internações, por exemplo, e desfecho dos casos, como recuperação ou óbitos. Em uma segunda etapa, o COVID-19 Data Sharing/BR abrigará também dados de imagens, como radiografias e tomografias.
“Em termos de valores, a obtenção desses dados por outros meios representaria um custo da ordem de centenas de milhões de reais. A gratuidade no acesso a essas informações será possível em razão da disponibilidade e generosidade dessas três instituições participantes da iniciativa”, disse Mello.
O lançamento do repositório tem um cronograma de três etapas. Uma versão pequena do conjunto de dados será inicialmente disponibilizada hoje (17/06) para um período-piloto de consultas. Dessa forma, a comunidade de pesquisa poderá baixar os dados e começar a analisá-los e visualizá-los usando técnicas de ciência de dados.
Até o dia 24 de junho, os grupos de pesquisa interessados poderão enviar dúvidas e comentários para os responsáveis pelo repositório COVID-19 Data Sharing/BR pelo e-mail covid19datasharing@fapesp.br. Esse feedback da comunidade durante o período-piloto será usado para melhorar as informações e a documentação do repositório. O conjunto inicial completo dos dados abertos e anonimizados será disponibilizado ao público a partir do dia 1º de julho.
“Neste primeiro momento iremos disponibilizar um conjunto de dados-piloto, para análise exploratória, para à medida que os analistas de dados comecem a usá-los sejam melhorados”, disse João Eduardo Ferreira, professor do Instituto de Matemática e Estatística (IME) da USP, participante do projeto.