Processing math: 0%


Este é o projeto Garu Estatística.

Aqui você pode encontrar várias funcionalidades, como os principais conceitos da estatística descritiva e inferencial, além de exercícios.

Garu Estatística é um aplicativo gratuito, desenvolvido em R/Shiny por alunos de graduação e pós-graduação da Unifesp.

O app não é autossuficiente no ensino de estatística. A equipe se esforça para manter a correção e integridade das informações, mas reconhecemos que podem ocorrer falhas. Estamos sempre abertos a críticas construtivas.

A equipe está aberta a sugestões da comunidade para a abordagem de problemas sugeridos pelos usuários, dentro dos limites da equipe.

Interessados em participar do projeto, incluindo alunos de outras instituições, podem entrar em contato com a coordenação por meio do endereço de e-mail garuestatistica@unifesp.br.

Equipe

Alessandra A. S. Menezes
Epidemiologia e Bioestatística
Medicina Preventiva
UNIFESP
Camila Bertini Martins
Epidemiologia e Bioestatística
Medicina Preventiva
UNIFESP
Flávia Cristina Martins Queiroz Mariano
Instituto de Ciência e Tecnologia
ICT-UNIFESP
Gabriel Graciano Dias
Graduação em Biomedicina
UNIFESP
Joao Henrique de Araujo Morais
Graduação em Ciência e Tecnologia
Graduação em Ciência da Computação
ICT-UNIFESP
Paulo Bandiera Paiva
Informática em Saúde
UNIFESP

Contato

Críticas, correções, sugestões ou interesse em participar do projeto devem ser enviadas para:

garuestatistica@unifesp.br


Garu Estatística, 2024. Versão 1.0.8

Última atualização: 01/08/2024

Conjuntos de Dados

Alimentação

'dados_saude_alimentação.csv' é uma versão didática do 'Food choices', banco de dados de domínio público disponível em Kaggle. A base inclui informações de preferências gastronômicas, nutrição e de saúde de estudantes. A variável 'altura' e os dados relacionados aos exames laboratoriais (HDL, LDL etc.) não existiam na base de dados original e foram acrescentados, de modo fictício, por questões didáticas. Esta base será utilizada na apresentação de alguns conceitos estatísticos.

Paralisia Cerebral

Para fins didáticos, algumas informações fornecidas pelas Diretrizes de Atenção à Pessoa com Paralisia Cerebral do Ministério da Saúde (2014) e achados de Aurélio et al. (2002) na comparação do padrão de deglutição de alimentos entre crianças com paralisia cerebral (PC) e crianças sem acometimentos neurológicos (SAN), em Curitiba/PR, foram simulados e inseridos na planilha 'dados_paralisia.csv' aqui fornecida. Este banco de dados será utilizado em alguns exercícios.

Tipos de Variáveis

Em um determinado estudo ou pesquisa, temos observações relacionadas a algum tipo de característica, o que chamamos de variáveis. Algumas variáveis representam um atributo ou caracteristica do indivíduo, como seu gênero, a região onde mora, seu estado civil, etc. Estas são chamadas de variáveis qualitativas. Já outras variáveis são representadas por números provindos de uma contagem ou mensuração. Estas são as variáveis quantitativas.

Variáveis Qualitativas

As variáveis qualitativas representam um atributo ou característica do indivíduo. Ainda é possível realizar uma distinção dentro desse grupo: as variáveis qualitativas nominais, para quais não há nenhuma possível hierarquia ou ordenação entre suas possíveis realizações, e as variáveis qualitativas ordinais, para quais existe uma ordenação entre suas categorias. Para exemplificar, a variável sexo é uma variável qualitativa nominal, pois não há uma ordem entre os valores 'feminino' e 'masculino', e a variável grau de instrução é um exemplo de variável qualitativa ordinal, pois há uma ordem entre seus possíveis valores: ensino primário, ensino fundamental, ensino médio, etc.

Variáveis Quantitativas

Como indicado pelo nome, as variáveis quantitativas representam uma quantidade. Essas também podem ser classificadas em dois tipos: as variáveis quantitativas discretas, geralmente provenientes de uma contagem e cujos possíveis valores podem ser listados em um conjunto finito de números; e as variáveis quantitativas contínuas, provenientes de uma mensuração, e que podem assumir qualquer valor real dentro de um intervalo. Um exemplo da primeira é o número de filhos que uma pessoa tem (0, 1, 2, 3, ...), e exemplos clássicos da segunda são altura e peso.

Tabela com variáveis exemplo

Fonte: Morettin, P. and Bussab, W. (2000). Estatística Básica (7a. ed.). Editora Saraiva.

Tabela com a variável 'Relacionamento'

Variável Qualitativa Nominal

Medidas Resumo

Gerador de amostra de números

Gere uma amostra de números através dos botões 'Valores entre' e 'Quantidade de elementos'. Depois, clique em 'Gerar amostra de números' e acompanhe como as medidas resumo são calculadas para a amostra gerada.

1250750
450

Amostra gerada

Medidas resumo da amostra gerada

Mostrar mais Mostrar menos

Observação de menor valor.

Exemplo com os elementos gerados:

                    
Mostrar mais Mostrar menos

Observação de maior valor.

Exemplo com os elementos gerados:

                    
Mostrar mais Mostrar menos

A média aritmética é a soma dos valores das observações dividido pela quantidade de observações.

Exemplo com os elementos gerados:

                    
Mostrar mais Mostrar menos

Os quartis dividem o conjunto de observações em quatro partes iguais. A observação que deixa 25% dos dados abaixo dela é chamada de primeiro quartil.

Exemplo com os elementos gerados:

                    
Mostrar mais Mostrar menos

Os quartis dividem o conjunto de observações em quatro partes iguais. A mediana (ou 2º quartil) representa a observação que ocupa a posição central da lista de observações, quando essa está ordenada. Quando o conjunto de observações possui um número ímpar de observações, então a mediana é o valor central dessa lista ordenada. Caso contrário, um modo de obtê-la é pela média dos dois valores centrais.

Exemplo com os elementos gerados:

                    
Mostrar mais Mostrar menos

Os quartis dividem o conjunto de observações em quatro partes iguais. A observação que deixa 75% dos dados abaixo dela é chamada de terceiro quartil.

Exemplo com os elementos gerados:

                    
Mostrar mais Mostrar menos

Como os quartis são divididos em quatro partes iguais, a distância entre qualquer quartil e seu sucessor ou antecessor terá o mesmo valor absoluto. Por exemplo: q2 - q1 = q3 - q2 (a distância entre o segundo quartil e o primeiro é a mesma que entre o terceiro quartil e o segundo.

Exemplo com os elementos gerados:

                    
Mostrar mais Mostrar menos

Medidas como média e mediana podem não nos trazer informações suficientes sobre o conjunto de observações, pois são medidas de posição. Nestes casos, é interessente analisarmos medidas de dispersão, como a variância. Esta representa o quão distantes os dados estão de sua média. Para isso, precisamos calcular a distância de cada elemento da média, somar o quadrado dessas distâncias e dividir pelo número de observações.

Exemplo com os elementos gerados:

                    
Mostrar mais Mostrar menos

O desvio padrão também é uma medida clássica de dispersão. Em termos de cálculo, ele se dá pela raiz quadrada da variância do conjunto. A vantagem que ele apresenta sobre a variância é a possibilidade de uma interpretação direta, uma vez que ele está na mesma unidade que a variável (kg, m, cm, etc.).

Exemplo com os elementos gerados:

                    

Gráfico das medidas resumo da amostra gerada

Distribuições de Probabilidade

Distribuições de Probabilidade são vistas como medida de comportamento de uma variável aleatória, discreta ou contínua.

Normal

A distribuição normal para variáveis contínuas é uma das mais importantes, visto que diversos fenômenos do mundo podem ser representados por uma distribuição normal. Nela, vê-se há uma distribuição em forma de sino, unimodal e simétrica em relação à sua média. Nessa distribuição, consta que 68,26% dos valores estão distribuídos em até 1 desvio padrão da média. 95,44% em até 2 desvios e 99,73% em até 3.

Sua função densidade de probabilidade é definida por:

f(x, \mu, \sigma) = \frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\frac{(x - \mu)^2}{\sigma^{2}}}

Observe essa distribuição ao lado, com os seguintes parâmetros:

Probabilidade de:


                

              

Teste Qui-quadrado de independência

O teste Qui-quadrado de independência é utilizado para verificar a associação entre 2 variáveis categóricas.

Matriz de entrada
0.10.050.010.050.09

Tabela de frequências observadas

Tabela de frequências esperadas




                  

Testes de Correlação

Spearman

Testes de Normalidade


                

              

Calculadora de Qui-Quadrado

Tabela Observada

Após selecionar número de colunas e linhas, clique nas células da tabela observada para incluir os valores.

Tabela Esperada

Resultado do Teste Qui-Quadrado


                

Exercícios Teóricos

Exercícios Práticos - Banco de Dados Paralisia Cerebral

Segundo as Diretrizes de Atenção à Pessoa com Paralisia Cerebral do Ministério da Saúde (2014) , a paralisia cerebral (PC) descreve um grupo de desordens da desenvolução do movimento e postura atribuído à distúrbio não progressivo durante o desenvolvimento do cérebro fetal ou infantil.

Estima-se que nos países em desenvolvimento, 7 a cada 1000 nascidos vivos sejam acometidos por PC, em diferentes graus de comprometimento dos movimentos e postura.

Algumas informações fornecidas nas diretrizes do Ministério da Saúde e achados de Aurélio et al. (2002) na comparação do padrão de deglutição de alimentos entre crianças com PC e crianças sem acometimentos neurológicos (SAN), encontram-se simulados no banco de dados que será utilizado nos exercícios abaixo.


Existem nove variáveis nesse banco de dados, sendo elas:


Sexo: menino ou menina

Idade: idade em anos completos

Grupo: grupo das crianças por condição de saúde (SAN ou PC)

Perda auditiva: existência ou não de perda auditiva (Não ou Sim)

Distúrbio de Comunicação: existência ou não de distúrbio de comunicação (Não ou Sim)

DMO: grau de Disfunção Motora Oral (DMO), em quatro categorias (Normal, Leve, Moderada ou Severa)

Tempo líquido: tempo, em segundos, para deglutição de 100 ml de suco de laranja

Tempo pastoso: tempo, em segundos, para deglutição de 140 g de iogurte de morango homogêneo e sem pedaços de fruta

Tempo sólido: tempo, em segundos, para deglutição de 12 g de bolacha recheada de chocolate

Referências

S. R. Aurélio, K. F. Genaro, and E. D. Macedo Filho. “Análise comparativa dos padrões de deglutição de crianças com paralisia cerebral e crianças normais”. Pt. In: Revista Brasileira de Otorrinolaringologia 68 (mar. 2002). Publisher: ABORL-CCF Associação Brasileira de Otorrinolaringologia e Cirurgia Cérvico-Facial, pp. 167-173. ISSN: 0034-7299. DOI: 10/fk7ccn. https://www.scielo.br/j/rboto/a/hvQv9C6JY9h7MbrrSY98WpB/abstract/?lang=pt (visited on 07/26/2024).

Brasil. Diretrizes de atenção à pessoa com paralisia cerebral. Tech. rep. Brasília: Ministério da Saúde, 2013. https://bvsms.saude.gov.br/bvs/publicacoes/diretrizes_atencao_paralisia_cerebral.pdf.

M. Fernandes and T. C. Morata. “Estudo dos efeitos auditivos e extra-auditivos da exposição ocupacional a ruído e vibração”. Pt. In: Revista Brasileira de Otorrinolaringologia 68 (out. 2002). Publisher: ABORL-CCF Associação Brasileira de Otorrinolaringologia e Cirurgia Cérvico-Facial, pp. 705-713. ISSN: 0034-7299. DOI: 10/cxqmh6. https://www.scielo.br/j/rboto/a/xwtrdfpnFfGDKvsnKVXFHVF/ (visited on 07/26/2024).

J. M. Marques. Bioestatística: ênfase em fonoaudiologia: introdução ao uso do computador. Pt. 1st ed. https://www.jurua.com.br/shop_item.asp?id=12491. Curitiba: Juruá, 2008. ISBN: 85-362-0287-4.

P. A. Morettin and W. d. O. Bussab. Estatística básica. 9th ed. São Paulo: Saraiva, 2017. ISBN: 978-85-472-2022-8.

D. Team and S. Batistia. 1. 001 Problemas de Estatística para Leigos. Pt-br. Trans. by D. Team and S. Batistia. Rio de Janeiro: Alta Books, 2016. ISBN: 85-508-0011-2. (Visited on 07/29/2024).