Conheça os projetos do DaSLab

Observatório Obstétrico Brasileiro

Este projeto consiste em criar um observatório obstétrico por meio de uma plataforma interativa de monitoramento, análise de dados públicos e disseminação de informações da área de Obstetrícia do Brasil. Nele são disponibilizadas as análises exploratórias dos dados, com visualização online, dinâmica e com filtragens escolhidas pela pessoa usuária, além dos resultados de análises e modelos preditivos para os desfechos de interesse.

Veja mais detalhes em OOBr

ensinaR

Esse projeto de extensão visa a divulgação, ensino e treinamento da comunidade sobre a linguagem R https://www.r-project.org/. O R é um software gratuito com linguagem e ambiente para análise de dados. É uma das principais linguagens computacionais da Ciência de Dados, com uma comunidade muito ativa e engajada. Dentre as atividades deste projeto de extensão, destacamos os cursos de extensão em R (R para iniciantes, análise de dados em R, Machine Learning com R, visualização de dados, dashboards com R e web scraping com R), entradas em blog com tutoriais e análises de dados e a continuação do capítulo R-Ladies Vitória https://rladies.org/. R-Ladies é uma organização mundial cuja missão é promover a diversidade de gênero na comunidade R, ao promover meetups (encontros) e mentorias, garantindo espaço amigável e seguro.

Veja mais detalhes em ensinaR

Modelos preditivos em Análise de Sobrevivência

Em estudos de Análise de Sobrevivência, geralmente o objetivo consiste em descrever a relação entre a ocorrência de um evento de interesse e fatores de risco ou prognósticos, ao considerar a presença de censura, onde os dados de alguns indivíduos não fornecem informações completas sobre o tempo até o evento de interesse. Nos últimos anos, tem surgido a demanda de não apenas compreender as relações causais, mas também ser capaz de realizar predições relacionadas ao evento de interesse. Isso é especialmente relevante em cenários da área da saúde, onde predições relacionadas à recorrência de uma doença ou à ocorrência de eventos adversos pode orientar as decisões clínicas e também pautar políticas públicas. Entretanto, realizar predições em Análise de Sobrevivência apresenta desafios únicos, acrescentando uma camada de complexidade inerentes aos dados secundários que motivam esse projeto, como a natureza dinâmica das covariáveis, fração de cura (longa duração), heterogeneidade não observada e observações faltantes. Neste contexto, este projeto de pesquisa tem como objetivo desenvolver modelos preditivos em Análise de Sobrevivência que considerem as características dos dados, visando melhorar a capacidade de previsão dos eventos de interesse. Com o desenvolvimento de abordagens estatísticas, espera-se fornecer informações valiosas, contribuindo para avanços significativos na Análise de Sobrevivência e pautando a tomada de decisões em cenários reais.

Reestruturação e redesenho da rede de atenção materna e perinatal no estado de São Paulo para redução da razão de mortalidade materna, fetal e neonatal (ReMaP)

Valores elevados de razão de mortalidade materna (RMM) e de mortalidade infantil são indicadores de condições socioeconômicas precárias, baixa escolaridade e de dificuldade de acesso a serviços de saúde de qualidade, constituindo metas importantes para se atingir o desenvolvimento sustentável entre os países. Em 2015 consolidou-se a agenda dos Objetivos de Desenvolvimento Sustentável (ODS). Esta agenda tem em seu Objetivo 3 assegurar uma vida saudável e promover o bem-estar para todos, em todas as idades. Para adequar os indicadores globais da Agenda 2030 à realidade brasileira, o Governo Federal, em parceria como Instituto de Pesquisa Econômica Aplicada (Ipea), propôs para a meta 3.1, reduzir a RMM para no máximo 30 mortes por 100 mil nascidos vivos e como meta 3.2. reduzir a mortalidade neonatal para no máximo 5 por mil nascidos vivos até 2030. Para alcançar estas metas é necessário esforço político, científico e estratégico. Uma das estratégias é permitir acesso a dados públicos de maneira estruturada e com responsabilidade para que a sociedade tenha acesso à informação, que gestores públicos possam tomar decisões baseadas em evidências e que as discussões sobre políticas públicas sejam embasadas em dados confiáveis, uma necessidade que na Obstetrícia se torna evidente pela dificuldade que temos enfrentado na redução da mortalidade nesta população. O objetivo principal deste projeto é alcançar redução da mortalidade materna, fetal e neonatal, por meio de análise, redesenho e monitoramento da rede de atenção materna e perinatal (contribuição científica para a gestão de políticas públicas) realizados por pesquisadores especializados na área de ciência de dados, epidemiologia e de atenção materno-infantil em trabalho conjunto com gestores da secretaria estadual de saúde. Este projeto tem como característica predominante do processo de gestão pública, as políticas públicas em execução (PEX) no âmbito da rede de atenção materna e perinatal do Estado de São Paulo, um programa de governo estabelecido pelo Ministério da Saúde e pela Secretaria de Estado da Saúde de São Paulo.

Painel hospitalar de vigilância da saúde materna e perinatal: instrumento para a gestão e melhoria da atenção obstétrica e neonatal

A mortalidade materna e perinatal são dois indicadores de saúde com valores elevados no Brasil. A persistência desses desfechos negativos, apesar da cobertura praticamente universal de assistência pré-natal e ao parto, sugere problemas na qualidade da assistência. A assistência hospitalar é fundamental para a redução desses óbitos, considerando que a maior parte dos óbitos maternos ocorrem durante o puerpério e que mais de 50 dos óbitos infantis ocorrem na primeira semana de vida. Entretanto, apesar da mortalidade materna e perinatal ser elevada, óbitos maternos e infantis têm uma frequência baixa no âmbitos dos serviços, podendo haver grande flutuação desses indicadores ou mesmo a não ocorrência de óbitos durante um longo período, o que dificulta a implantação de estratégias de melhoria de cuidado baseadas apenas nesses indicadores. Este projeto tem por objetivo desenvolver um painel de indicadores da saúde materna e perinatal integrando informações disponíveis em vários sistemas de informação brasileiros (SIM, SINASC, SINAN, SIH, CNES), tendo por menor unidade de análise os serviços públicos de atenção ao parto. A proposta é que o painel seja de fácil utilização,alimentado automaticamente e disponibilizado online, para que possa ser usado de forma oportuna pelos gestores do sistema de saúde para identificação e intervenção em locais de maior vulnerabilidade para o óbito materno e perinatal. O painel também poderá ser utilizado pelos usuários dos serviços, para ampliar o conhecimento sobre saúde materna e o desempenho dos serviços. Será desenvolvido ainda um algoritmo preditivo do óbito materno e perinatal empregando técnicas de aprendizado de máquina, visando a identificação dos principais preditores desses desfechos e o cálculo da mortalidade esperada, considerando o perfil de cada unidade hospitalar.

Identificação da vulnerabilidade ao óbito materno para a implantação de políticas públicas

A mortalidade materna no Brasil é elevada, mas óbitos maternos são raros, dificultando a elaboração de estratégias de melhoria da atenção baseadas apenas na investigação desses óbitos. O objetivo deste estudo é desenvolver uma classificação da vulnerabilidade dos municípios ao óbito materno. Utilizando dados disponíveis nos sistemas de informação, será desenvolvido e validado um índice de vulnerabilidade ao óbito materno, com posterior classificação dos municípios brasileiros. Espera-se que os resultados auxiliem na redução das desigualdades regionais, sociais e raciais da mortalidade materna, ao identificar locais que devem ser alvo prioritário de políticas públicas interseccionais.

Impacto da variação atmosférica e do período da pandemia de COVID-19 na saúde da mulher e das crianças de São Tomé e Príncipe

No presente estudo pretende-se fazer um levantamento de número de mulheres de idade fértil e crianças do Distrito de Água Grande, o maior distrito urbano de São Tomé e da Região Autônoma de Príncipe. Os serviços a serem previstos para visita incluem postos de saúde, maternidade, pediatria, laboratório e saúde reprodutiva. A ideia é recolher dados estatísticos agregados mensalmente com associação dos dados demográficos, situação socioeconômica, ausência ou presença de doenças respiratórias e possíveis correlações com variações climáticas entre os dois períodos de estudos. O propósito do estudo é saber quantas mulheres em idade fértil contraíram covid-19, se tiveram acesso ao serviço de planeamento familiar, quantas deram à luz e que não seguiram a consulta de saúde pré-natal. Números de bebês que nasceram nos períodos em estudo, quantos tiveram acesso a todas as doses de vacinas e presença de nascidos mortos. Também pretende-se fazer correlação dos números de mulheres em idade fértil e crianças que tiveram acesso ao serviço de saúde para seguimento dos dois primeiros anos antes da pandemia covid-19 comparativamente aos dois anos durante a pandemia Covid-19 em São Tomé e Príncipe.

Métodos de aprendizado de máquinas aplicados ao desenvolvimento de curvas de crescimento fetal personalizadas para a população brasileira

O crescimento intrauterino é determinado pela combinação de fatores maternos e fetoplacentários que afetam a oferta de nutrientes e oxigênio para o feto. Outros motivos inerentes ao feto podem afetar o crescimento, como infecção fetal, malformações congênitas, anomalias cromossômicas e exposição a substâncias teratogênicas. A restrição de crescimento fetal está associada a um risco maior de atraso no desenvolvimento cognitivo, morbidades e mortalidade perinatais. Assim, é importante o acompanhamento do crescimento fetal, uma vez que alerta o obstetra para a necessidade de cuidados assistenciais adequados. É possı́vel avaliar o crescimento fetal ao medir múltiplas medidas biométricas por meio de exame ultrassonográfico obstétrico. Hadlock et al. (1982) realizam estudos transversais em pacientes com gestação única, sem patologias feto maternas, e descrevem a correlação entre a idade gestacional e as medidas biométricas: diâmetro biparietal, circunferência cefálica, circunferência abdominal e comprimento do fêmur. Ao considerar como ponto fraco em seu estudo o fato de ser transversal, eles discutem que as curvas derivadas de estudos longitudinais são mais apropriadas para avaliar o crescimento individual e representam melhor o crescimento médio de uma população.

Atualmente no Brasil, as curvas de crescimento das medidas biométricas de Hadlock são usadas como referência. Ainda, o peso fetal é estimado como função das medidas biométricas: diâmetro biparietal, circunferência cefálica, circunferência abdominal e o comprimento do fêmur. Assim, um feto com peso estimado abaixo do percentil 10 é classificado como pequeno para idade gestacional, enquanto um feto com peso estimado acima do percentil 90 é classificado como grande para a idade gestacional.

Algumas crı́ticas podem ser consideradas ao avaliar as curvas de Hadlock na população brasileira. A primeira consiste em utilizar uma curva baseada na população americana, que apresenta caracterı́sticas diferentes da população brasileira. Nesse sentido, talvez os pesos das medidas biométricas não sejam os mesmos quando o interesse consiste em estimar o peso fetal na população brasileira. Ainda, um tamanho de diâmetro biparietal, por exemplo, considerado pequeno na população americana pode ser normal quando considerado na população brasileira.

Vale ressaltar que as curvas de Hadlock são funções apenas da idade gestacional. No entanto, é esperado que um feto de uma gestante de estatura alta seja maior que o feto de uma gestante com baixa estatura, ambas na mesma idade gestacional. Assim, pode ser interessante considerar curvas de crescimento fetal para medidas biométricas que, além da idade gestacional, levem em conta caracterı́sticas maternas e da gestação, como altura, peso, IMC, sexo fetal e paridade. Essas curvas são chamadas de curvas personalizadas.

Com os avanços de métodos computacionais e pesquisas em modelagem de dados, modelos para construção de curvas de crescimento fetal personalizadas podem ser ajustados, ao também levar em conta a dependência entre medidas da mesma gestante ao longo do pré-natal. A qualidade de desempenho do modelo, assim como a proporção de acerto podem ser melhoradas com a assistência de algoritmos de aprendizado de máquina (do inglês, Machine Learning - ML) ao considerar, inclusive, penalizações como de Lasso e de Ridge. Além dos modelos de regressão à média, também podem ser considerados os modelos de regressão quantı́lica para dados longitudinais com o intuito de estimar os percentis de interesse.

Devido ao bom desempenho dos algoritmos de ML em diversas áreas, principalmente em áreas financeiras e econômicas, seu uso na aplicação para problemas da área da saúde é de crescente interesse.

Como objetivo geral, esse projeto tem como intuito utilizar e desenvolver métodos de machine learning para a construção de curvas de crescimento fetal personalizadas para a população brasileira, modeladas em função de variáveis maternas e gestacionais (variáveis input).

Modelos de Regressão Quantı́lica Bayesianos para Variáveis Resposta Multidimensionais

Modelos de regressão são ferramentas estatı́sticas utilizadas para entender a relação entre variável resposta e covariáveis, considerando diferentes distribuições de probabilidade e usualmente descrevendo efeitos no valor médio dessa variável resposta.

Modelos de regressão quantı́lica se diferem dos modelos usuais de regressão ao estudar a relação entre covariáveis e quantis condicionais da variável resposta. Em especial, esses modelos de regressão quantı́lica podem ser estimados considerando a perspectiva da inferência bayesiana, em que algoritmos de Monte Carlo via Cadeias de Markov (MCMC, da sigla em inglês) permitem maior flexibilidade na definição da estrutura de regressão. Uma nova área de pesquisa tem crescido nos últimos anos, em que a variável resposta é definida com dimensão maior que um. Isso traz novos desafios tanto com relação a possı́veis distribuições de probabilidade multidimensionais que podem ser utilizadas nessa modelagem, quanto maneiras de interpretação e visualização dos resultados. Nesse sentido, modelos de regressão quantı́lica para variáveis resposta multidimensionais podem ser interessantes pois permitem a análise dos dados sem a suposição de uma distribuição de probabilidade para a variável resposta. Por outro lado, a definição de quantis multidimensionais também pode trazer dificuldades. Para esse problema, uma possı́vel solução é utilizar a definição de quantis direcionais nesse espaço. Dessa maneira, esses modelos de regressão quantı́lica poderão ser utilizados para estudar o efeito das variáveis preditoras em diferentes quantis nesse espaço multidimensional. Por exemplo, considerando as notas de estudantes no Exame Nacional do Ensino Médio (ENEM), com esses modelos seria possı́vel estimar a diferença entre escolas privadas e públicas, tanto entre as maiores notas quanto nas piores notas, considerando simultaneamente as notas de diferentes disciplinas, tendo em vista a correlação entre esses valores

Classificação de Perfis de Violência contra adolescentes no Espı́rito Santo

De acordo com o Relatório Mundial da Saúde, considera-se como violência, para fins de notificação, “o uso intencional de força fı́sica ou do poder, real ou em ameaça, contra si próprio, contra outra pessoa, ou contra um grupo ou uma comunidade que resulte ou tenha possibilidade de resultar em lesão, morte, dano psicológico, deficiência de desenvolvimento ou privação” (Krug, 2002). Ou seja, é qualquer conduta – ação ou omissão – de caráter intencional que cause ou venha a causar dano, morte, constrangimento, limitação, sofrimento fı́sico, sexual, moral, psicológico, social, polı́tico, econômico ou patrimonial.

O setor da saúde tem um papel fundamental como identificador de casos de violência. No Brasil, o Ministério da Saúde (MS) publicou a Portaria n o 104 que estabelece a obrigatoriedade da notificação de casos novos de doenças e agravos, incluindo aqui casos de violência (da República Federativa do Brasil, 2011).

Na ficha de notificação das violências, o profissional da saúde deverá indicar o principal tipo de violência associada com o evento relatado pela vı́tima, podendo ser classificado como: fı́sica, psicológica/moral, tortura, violência sexual, tráfico de seres humanos, financeira/econômica, negligência/abandono e outros, em que deverá ser discriminado casos como tentativa de suicı́dio e autoagressão. No instrutivo da ficha de notificação aparece uma descrição detalhada sobre os diferentes tipos de violência e classificação. Além dos tipos de violência, a notificação contém informações como local onde ocorreu a violência, dados pessoais da vı́tima, perfil do possı́vel autor da agressão, entre outros. Espera-se com isso fornecer subsı́dios para o planejamento de ações de prevenção e intervenção.

Uma população considerada de risco é a de jovens e adolescentes, como reconhecida pela lei n o 8.069 de 13 de julho de 1990, chamada por Estatuto da Criança e do Adolescente (ECA), cujo objetivo é trazer proteção integral ás crianças e adolescentes. O Art. 7 o do estatuto diz ”A criança e o adolescente têm direito a proteção à vida e à saúde, mediante a efetivação de polı́ticas sociais públicas que permitam o nascimento e o desenvolvimento sadio e harmonioso, em condições dignas de existência”.

Em 2017, a United Nations Children’s Fund (UNICEF) disponibilizou o relatório técnico ”A Familiar Face: Violence in the lives of children and adolescents” que mostra a situação da violência contra jovens e adolescentes em âmbito familiar no mundo e, em particular, indicam que o Brasil é o quinto paı́s mais violento da América Latina quando se trata de jovens de 10 a 19 anos (UNICEF, 2017). Ainda, o relatório cita as dificuldades de mensurar e os desafios éticos da coleta de dados sobre diversos casos de violência que ocorrem contra essa população ao redor do globo.

Os métodos estatı́sticos tornaram-se ferramentas fundamentais para toda classe de pesquisadores e usuários que estão em contato com as mais diversas fontes de dados. Esses métodos, servem não apenas como apoio cientı́fico a quase todas as áreas do conhecimento, também proporcionam mecanismos para diagnosticar a aperfeiçoar a gestão e operação de diversos sistemas, muitas vezes complexos,subsidiando a tomada de decisões através da criação de modelos que descrevem o comportamento e a relação de diversas variáveis ou fatores.

Particularmente na área das ciências da saúde, encontram-se com frequência variáveis como gênero, etnia, escalas de satisfação, nı́vel de poluição, local de moradia, etc. Estas variáveis são conhecidas como variáveis categóricas. Em outros casos, encontram-se variáveis discretas, caracterizadas por descrever a frequência de eventos de interesse tais como: número de internações hospitalares, número de sinistros em acidentes de trânsito, número de alunos com transtorno de ansiedade,número de notificações de agravos de violência, etc.

Os modelos estatı́sticos usados na análise de variáveis contı́nuas, tais como o modelo de regressão linear, não são aplicáveis às variáveis anteriormente descritas. Dessa forma, faz-se necessário o tratamento adequado desse tipo de dados para aprimorar as análises e a veracidade das conclusões derivadas dos modelos ajustados.

Especificamente nessa pesquisa analisaremos dados provenientes da Ficha de Notificação de Violência Interpessoal/Autoprovocada, registrados no Sistema de Informação de Agravos de Notificações (SINAN) no sistema de serviços de saúde. Temos por objetivo principal fazer uma análise adequada desses dados e promover uma modelagem correta a fim de identificar o perfil dos adolescentes que se encontravam em situação de violência no Espı́rito Santo entre 2011 e 2018.

Além da análise descritiva, será considerada neste trabalho modelagem via técnicas de regressão, especificamente, modelos de regressão logı́stico e multinomial com o objetivo de determinar quais fatores estão associados com a ocorrência de cada um dos tipo de violência contra os adolescentes no Espı́rito Santo.

Estudos envolvendo dados de criminalidade fazendo uso de técnicas de machine learning já foram reportados em Berk (2012) e Berk (2013). Dessa forma, pretendemos desenvolver um algoritmo de classificação que permita a partir do perfil da vı́tima e de sua proximidade com o autor da violência identificar qual tipo de violência um adolescente está mais propenso a sofrer a partir de seu perfil.