
Este é o projeto Garu Estatística.
Aqui você pode encontrar várias funcionalidades, como os principais conceitos da estatística descritiva e inferencial, além de exercícios.
Garu Estatística é um aplicativo gratuito, desenvolvido em R/Shiny por alunos de graduação e pós-graduação da Unifesp.
O app não é autossuficiente no ensino de estatística. A equipe se esforça para manter a correção e integridade das informações, mas reconhecemos que podem ocorrer falhas. Estamos sempre abertos a críticas construtivas.
A equipe está aberta a sugestões da comunidade para a abordagem de problemas sugeridos pelos usuários, dentro dos limites da equipe.
Interessados em participar do projeto, incluindo alunos de outras instituições, podem entrar em contato com a coordenação por meio do endereço de e-mail garuestatistica@unifesp.br.
Equipe

Epidemiologia e Bioestatística
Medicina Preventiva
UNIFESP

Epidemiologia e Bioestatística
Medicina Preventiva
UNIFESP

Instituto de Ciência e Tecnologia
ICT-UNIFESP

Graduação em Biomedicina
UNIFESP

Graduação em Ciência e Tecnologia
Graduação em Ciência da Computação
ICT-UNIFESP

Informática em Saúde
UNIFESP
Contato
Críticas, correções, sugestões ou interesse em participar do projeto devem ser enviadas para:
garuestatistica@unifesp.br
Garu Estatística, 2024. Versão 1.0.8
Última atualização: 01/08/2024
Conjuntos de Dados
Alimentação
'dados_saude_alimentação.csv' é uma versão didática do 'Food choices', banco de dados de domínio público disponível em Kaggle. A base inclui informações de preferências gastronômicas, nutrição e de saúde de estudantes. A variável 'altura' e os dados relacionados aos exames laboratoriais (HDL, LDL etc.) não existiam na base de dados original e foram acrescentados, de modo fictício, por questões didáticas. Esta base será utilizada na apresentação de alguns conceitos estatísticos.
Paralisia Cerebral
Para fins didáticos, algumas informações fornecidas pelas
Diretrizes de Atenção à
Pessoa com Paralisia Cerebral do Ministério da Saúde (2014)
e achados de
Aurélio et al. (2002)
na comparação do padrão de deglutição de alimentos entre
crianças com paralisia cerebral (PC) e crianças sem acometimentos
neurológicos (SAN), em Curitiba/PR, foram simulados e inseridos
na planilha 'dados_paralisia.csv' aqui fornecida. Este banco de dados será
utilizado em alguns exercícios.
Tipos de Variáveis
Em um determinado estudo ou pesquisa, temos observações relacionadas a algum tipo de característica, o que chamamos de variáveis. Algumas variáveis representam um atributo ou caracteristica do indivíduo, como seu gênero, a região onde mora, seu estado civil, etc. Estas são chamadas de variáveis qualitativas. Já outras variáveis são representadas por números provindos de uma contagem ou mensuração. Estas são as variáveis quantitativas.
Variáveis Qualitativas
As variáveis qualitativas representam um atributo ou característica do indivíduo. Ainda é possível realizar uma distinção dentro desse grupo: as variáveis qualitativas nominais, para quais não há nenhuma possível hierarquia ou ordenação entre suas possíveis realizações, e as variáveis qualitativas ordinais, para quais existe uma ordenação entre suas categorias. Para exemplificar, a variável sexo é uma variável qualitativa nominal, pois não há uma ordem entre os valores 'feminino' e 'masculino', e a variável grau de instrução é um exemplo de variável qualitativa ordinal, pois há uma ordem entre seus possíveis valores: ensino primário, ensino fundamental, ensino médio, etc.
Variáveis Quantitativas
Como indicado pelo nome, as variáveis quantitativas representam uma quantidade. Essas também podem ser classificadas em dois tipos: as variáveis quantitativas discretas, geralmente provenientes de uma contagem e cujos possíveis valores podem ser listados em um conjunto finito de números; e as variáveis quantitativas contínuas, provenientes de uma mensuração, e que podem assumir qualquer valor real dentro de um intervalo. Um exemplo da primeira é o número de filhos que uma pessoa tem (0, 1, 2, 3, ...), e exemplos clássicos da segunda são altura e peso.
Tabela com variáveis exemplo
Tabela com a variável 'Relacionamento'
Variável Qualitativa NominalMedidas Resumo
Gerador de amostra de números
Gere uma amostra de números através dos botões 'Valores entre' e 'Quantidade de elementos'. Depois, clique em 'Gerar amostra de números' e acompanhe como as medidas resumo são calculadas para a amostra gerada.
Amostra gerada
Medidas resumo da amostra gerada
A média aritmética é a soma dos valores das observações dividido pela quantidade de observações.
Exemplo com os elementos gerados:Os quartis dividem o conjunto de observações em quatro partes iguais. A observação que deixa 25% dos dados abaixo dela é chamada de primeiro quartil.
Exemplo com os elementos gerados:Os quartis dividem o conjunto de observações em quatro partes iguais. A mediana (ou 2º quartil) representa a observação que ocupa a posição central da lista de observações, quando essa está ordenada. Quando o conjunto de observações possui um número ímpar de observações, então a mediana é o valor central dessa lista ordenada. Caso contrário, um modo de obtê-la é pela média dos dois valores centrais.
Exemplo com os elementos gerados:Os quartis dividem o conjunto de observações em quatro partes iguais. A observação que deixa 75% dos dados abaixo dela é chamada de terceiro quartil.
Exemplo com os elementos gerados:Como os quartis são divididos em quatro partes iguais, a distância entre qualquer quartil e seu sucessor ou antecessor terá o mesmo valor absoluto. Por exemplo: q2 - q1 = q3 - q2 (a distância entre o segundo quartil e o primeiro é a mesma que entre o terceiro quartil e o segundo.
Exemplo com os elementos gerados:Medidas como média e mediana podem não nos trazer informações suficientes sobre o conjunto de observações, pois são medidas de posição. Nestes casos, é interessente analisarmos medidas de dispersão, como a variância. Esta representa o quão distantes os dados estão de sua média. Para isso, precisamos calcular a distância de cada elemento da média, somar o quadrado dessas distâncias e dividir pelo número de observações.
Exemplo com os elementos gerados:O desvio padrão também é uma medida clássica de dispersão. Em termos de cálculo, ele se dá pela raiz quadrada da variância do conjunto. A vantagem que ele apresenta sobre a variância é a possibilidade de uma interpretação direta, uma vez que ele está na mesma unidade que a variável (kg, m, cm, etc.).
Exemplo com os elementos gerados:Gráfico das medidas resumo da amostra gerada
Distribuições de Probabilidade
Distribuições de Probabilidade são vistas como medida de comportamento de uma variável aleatória, discreta ou contínua.
A distribuição normal para variáveis contínuas é uma das mais importantes, visto que diversos fenômenos do mundo podem ser representados por uma distribuição normal. Nela, vê-se há uma distribuição em forma de sino, unimodal e simétrica em relação à sua média. Nessa distribuição, consta que 68,26% dos valores estão distribuídos em até 1 desvio padrão da média. 95,44% em até 2 desvios e 99,73% em até 3.
Sua função densidade de probabilidade é definida por:
f(x, \mu, \sigma) = \frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\frac{(x - \mu)^2}{\sigma^{2}}}Observe essa distribuição ao lado, com os seguintes parâmetros:
Probabilidade de:
Teste Qui-quadrado de independência
O teste Qui-quadrado de independência é utilizado para verificar a associação entre 2 variáveis categóricas.
Matriz de entradaTabela de frequências observadas
Tabela de frequências esperadas
Testes de Correlação
Testes de Normalidade
Calculadora de Qui-Quadrado
Tabela Observada
Após selecionar número de colunas e linhas, clique nas células da tabela observada para incluir os valores.
Tabela Esperada
Resultado do Teste Qui-Quadrado
Exercícios Teóricos
Exercícios Práticos - Banco de Dados Paralisia Cerebral
Segundo as
Diretrizes de Atenção à
Pessoa com Paralisia Cerebral do Ministério da Saúde (2014) ,
a paralisia cerebral (PC) descreve um grupo de desordens da
desenvolução do movimento e postura atribuído
à distúrbio não progressivo durante o desenvolvimento do
cérebro fetal ou infantil.
Estima-se que nos países em desenvolvimento, 7 a cada 1000
nascidos vivos
sejam acometidos por PC, em diferentes graus de comprometimento
dos movimentos e postura.
Algumas informações fornecidas nas diretrizes do Ministério da Saúde e achados de Aurélio et al. (2002) na comparação do padrão de deglutição de alimentos entre crianças com PC e crianças sem acometimentos neurológicos (SAN), encontram-se simulados no banco de dados que será utilizado nos exercícios abaixo.
Existem nove variáveis nesse banco de dados, sendo elas:
Sexo: menino ou menina
Idade: idade em anos completos
Grupo: grupo das crianças por condição de saúde (SAN ou PC)
Perda auditiva: existência ou não de perda auditiva (Não ou Sim)
Distúrbio de Comunicação: existência ou não de distúrbio de comunicação (Não ou Sim)
DMO: grau de Disfunção Motora Oral (DMO), em quatro categorias (Normal, Leve, Moderada ou Severa)
Tempo líquido: tempo, em segundos, para deglutição de 100 ml de suco de laranja
Tempo pastoso: tempo, em segundos, para deglutição de 140 g de iogurte de morango homogêneo e sem pedaços de fruta
Tempo sólido: tempo, em segundos, para deglutição de 12 g de bolacha recheada de chocolate
Referências
S. R. Aurélio, K. F. Genaro, and E. D. Macedo Filho. “Análise comparativa dos padrões de deglutição de crianças com paralisia cerebral e crianças normais”. Pt. In: Revista Brasileira de Otorrinolaringologia 68 (mar. 2002). Publisher: ABORL-CCF Associação Brasileira de Otorrinolaringologia e Cirurgia Cérvico-Facial, pp. 167-173. ISSN: 0034-7299. DOI: 10/fk7ccn. https://www.scielo.br/j/rboto/a/hvQv9C6JY9h7MbrrSY98WpB/abstract/?lang=pt (visited on 07/26/2024).
Brasil. Diretrizes de atenção à pessoa com paralisia cerebral. Tech. rep. Brasília: Ministério da Saúde, 2013. https://bvsms.saude.gov.br/bvs/publicacoes/diretrizes_atencao_paralisia_cerebral.pdf.
M. Fernandes and T. C. Morata. “Estudo dos efeitos auditivos e extra-auditivos da exposição ocupacional a ruído e vibração”. Pt. In: Revista Brasileira de Otorrinolaringologia 68 (out. 2002). Publisher: ABORL-CCF Associação Brasileira de Otorrinolaringologia e Cirurgia Cérvico-Facial, pp. 705-713. ISSN: 0034-7299. DOI: 10/cxqmh6. https://www.scielo.br/j/rboto/a/xwtrdfpnFfGDKvsnKVXFHVF/ (visited on 07/26/2024).
J. M. Marques. Bioestatística: ênfase em fonoaudiologia: introdução ao uso do computador. Pt. 1st ed. https://www.jurua.com.br/shop_item.asp?id=12491. Curitiba: Juruá, 2008. ISBN: 85-362-0287-4.
P. A. Morettin and W. d. O. Bussab. Estatística básica. 9th ed. São Paulo: Saraiva, 2017. ISBN: 978-85-472-2022-8.
D. Team and S. Batistia. 1. 001 Problemas de Estatística para Leigos. Pt-br. Trans. by D. Team and S. Batistia. Rio de Janeiro: Alta Books, 2016. ISBN: 85-508-0011-2. (Visited on 07/29/2024).