Nowcasting Semana 2 de Fevereiro – Problemas nos Dados OPENDATASUS

Nowcasting Covid-19 Analytics

O Nowcasting do grupo Covid-19 Analytics possui uma abordagem estatística que considera 14 classes diferentes de modelos (lineares, não-lineares, paramétricos, não-paramétricos, parâmetros variando no tempo, estáticos, dinâmicos fatoriais, etc.) que tratam as diferentes caracteristicas tanto do fenômeno pandêmico quanto de seu processo de notificação de óbitos e casos. Esses modelos são utilizados para capturar o processo de revisão do número de óbitos e casos, bem como a relação desses números com um amplo conjunto de co-variáveis (Google Trends, Google Mobile, Consumo de Energia Elétrica, temperatura, etc), que considerando suas dinâmicas temporais, faz com que esse conjunto de co-variáveis cresça para um total acima de 180 co-variáveis. Para cada classe de modelo elaboramos as previsões de 30 passos a frente (dados diários), retroagindo até a data mais recente de dados disponíveis (Definição de Nowcasting, previsão do estado atual da pandemia). O peso de cada classe de modelo na previsão final é construída em uma lógica utilizada no algoritmo de LogitBoosting, ou seja, consideramos a performance preditiva do MAPE observado no mês imediatamente anterior, onde já observamos os dados saturados (dados que já não sofrem revisões). Essa metodologia foi submetida a 4 diferentes backtestings com resultados de boa perfomance mesmo na presença de quebras estruturais. O MAPE médio dos modelos foi de 6,5% para o Nowcasting de número de óbitos e de 7,5% para o Nowcasting de número de casos.


NOTA EXPLICATIVA Dados OPENDATASUS

Nos arquivos de registros de casos de SRAG disponibilizados no site opendatasus (https://opendatasus.saude.gov.br/dataset/bd-srag-2020) desde 13/01/2021 não encontramos preenchimento do campo ‘DT_SIN_PRI’ (Data de primeiros sintomas) com data posterior a 03/01/2021. Isto pode representar um erro no preenchimento desta coluna já que em todos os arquivos disponibilizados anteriormente encontramos preenchimento da ‘DT_SIN_PRI’ com data máxima igual a data de disponibilização dos dados ou com apenas 1 (um) dia de diferença dela. Este problema impacta o ajuste e análise dos resultados dos modelos de nowcasting para CASOS. O represamento de casos em uma única data exige um maior fator de correção sobre número de casos notificados e as estimativas geradas pelo modelo de nowcasting podem apontar para um agravo irreal da situação da pandemia no país. Com vista a solução da situação o grupo COVID19ANALYTICS encaminhou dia 19/02/2021 um e-mail para pni@listas.datasus.gov.br informando a situação e alertando ao problema, também foram feitas tentativas de contato telefônico, ambos sem resposta. Desse modo chamamos atenção para os valores de Rt estimados terem sido elaborados utilizando apenas o Nowcasting de Mortes.

 


Brasil

Nowcasting do número de óbitos para Brasil

 

 

Taxas de Reprodução para o Brasil considerando os valores de Nowcasting


São Paulo

Nowcasting do número de óbitos para São Paulo

 

 

Taxas de Reprodução para São Paulo considerando os valores de Nowcasting

 


Rio de Janeiro

Nowcasting do número de óbitos para Rio de Janeiro

 

 

Taxas de Reprodução para Rio de Janeiro considerando os valores de Nowcasting