storopoli / Estatistica-Bayesiana

Disciplina de Estatística Bayesiana da UNINOVE

Home Page:https://storopoli.github.io/Estatistica-Bayesiana

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Estatística Bayesiana Bayesiana com R e Stan

CC BY-SA 4.0

A disciplina toda foi gravada e disponibilizada no YouTube na playlist abaixo:

Ciência de Dados com R e tidyverse

Bayesian for Everyone!

Bayesian for Everyone!

Disciplina de Estatística Bayesiana para alunos de Mestrado e Doutorado. A disciplina toda está disponível no site storopoli.github.io/Estatistica-Bayesiana.

A Estatística Bayesiana é uma abordagem de Estatística inferencial que não usa hipóteses nulas (H0) e p-valores. Se você não sabe o que é um p-valor, recomendo olhar O que é Estatística Bayesiana. Muitos cientistas e pesquisadores acreditam que sabe o que é um p-valor, mas sua compreensão é falha e imperfeita, por isso, mesmo que você acredite que saiba o que é um p-valor, eu ainda recomendo que veja O que é Estatística Bayesiana.

RStudio: Binder

Stan

Stan (Carpenter et al., 2017) é uma plataforma para modelagem e computação estatística de alto desempenho. Milhares de usuários contam com Stan para modelagem estatística, análise de dados e previsão nas ciências sociais, biológicas e físicas, engenharia e negócios. Stan tem o suporte financeiro da NumFOCUS, uma fundação sem fins lucrativos que dá apoio financeiro à projetos de softwares opensource. Dentre os patrocinadores da NumFOCUS podemos citar AWS Amazon, Bloomberg, Microsoft, IBM, RStudio, Facebook, NVIDIA, Netflix, entre outras.

Os modelos em Stan são especificados pela sua própria linguagem (similar à C++) e são compilados em um arquivo executável que gera inferências estatísticas Bayesiana com amostragem Monte Carlo de correntes Markov (Markov Chain Monte Carlo – MCMC) de alto desempenho. Stan possui interfaces para as seguintes linguagens de programação (estou riscando as linguagens que não são opensource por uma questão de princípios):

A linguagem Stan possui uma curva de aprendizagem bem desafiadora, por isso Stan possui um ecossistema de pacotes de interfaces que muitas vezes ajudam e simplificam a sua utilização:

  • rstanarm: ajuda o usuário a especificar modelos usando a síntaxe familiar de fórmulas do R.
  • brms: similar ao rstanarm pois usa a síntaxe familiar de fórmulas do R, mas dá maior flexibilidade na especificação de modelos mais complexos (e geralmente a amostragem é um pouco mais rápida que o rstanarm).

Stan (e consequentemente todas suas interfaces com diversas linguagens de programação e todos os pacotes do seu ecossistema) usa um amostrador MCMC que utiliza dinâmica Hamiltoniana (Hamiltonian Monte Carlo – HMC) para guiar as propostas de amostragem de novos parâmetros no sentido do gradiente da densidade de probabilidade da posterior. Isto implica em um amostrador mais eficiente e que consegue explorar todo o espaço amostral da posterior com menos iterações; e também mais eficaz que consegue tolerar diferentes geometrias de espaços amostrais da posterior. Em outras palavras, Stan usa técnicas de amostragem avançadas que permite com que modelos complexos Bayesianos atinjam convergência de maneira rápida. No Stan, raramente deve-se ajustar os parâmetros do algoritmo HMC, pois geralmente os parâmetros padrões (out-of-the-box) funcionam muito bem. Assim, o usuário foca no que é importante: a especificação dos componentes probabilísticos do seu modelo Bayesiano.

Professor

Prof. Dr. José Eduardo Storopoli - Currículo Lattes - ORCID - CV

josees@uni9.pro.br

Como usar esse conteúdo?

Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas. O propósito do conteúdo não é o rigor matemático geralmente adotado em disciplinas e tutoriais de estatística Bayesiana, mas gerar uma forte intuição deixando de lado o rigor matemático e focar no ferramental (primariamente rstanarm e um pouco de brms).

Para configurar um ambiente local:

  1. Clone o repositório do GitHub: git clone https://github.com/storopoli/Estatistica-Bayesiana.git
  2. Acesse o diretório: cd Estatistica-Bayesiana
  3. Instale os pacotes necessários: Rscript .binder/install.R

Aulas

  1. Comandos Básicos de R
  2. Distribuições Estatísticas
  3. rstanarm e brms
  4. Priors
  5. Markov Chain Montecarlo (MCMC)
  6. Regressão Linear Bayesiana
  7. Regressão Logística Bayesiana
  8. Regressão de Poisson Bayesiana
  9. Regressão Robusta Bayesiana
  10. Modelos Multiníveis

Referências

Livros

  • Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., & Rubin, D. B. (2013). Bayesian Data Analysis. Chapman and Hall/CRC.
  • McElreath, R. (2020). Statistical rethinking: A Bayesian course with examples in R and Stan. CRC press.
  • Gelman, A., Hill, J., & Vehtari, A. (2020). Regression and other stories. Cambridge University Press.
  • Brooks, S., Gelman, A., Jones, G., & Meng, X.-L. (2011). Handbook of Markov Chain Monte Carlo. CRC Press. http://books.google.com?id=qfRsAIKZ4rIC
    • Geyer, C. J. (2011). Introduction to markov chain monte carlo. In S. Brooks, A. Gelman, G. L. Jones, & X.-L. Meng (Eds.), Handbook of markov chain monte carlo.

Artigos

Básicos

Complementares

Conteúdos Similares

Existem alguns conteúdos em português similares que eu indico:

  • Marco Inácio — Apostila de Stan

    Um dos desenvolvedores da equipe do Stan. A apostila está um pouco desatualizada (2018). O foco é o rigor matemático e a linguagem Stan. Muito bem escrita e com bons exemplos.

  • Ricardo Ehlers (USP) — Inferência Bayesiana (Notas de Aula)

    Notas de uma disciplina da USP pelo professor Ricardo Ehlers. O foco é o rigor matemática e as ferramentas utilizadas são desatualizadas (BUGS e JAGS). Também muito bem escrita e com bons exemplos.

  • Luís Gustavo Esteves, Rafael Izbicki e Rafael Bassi Stern (UFSCar) — Inferência Bayesiana (Notas de Aula)

    Notas de uma disciplina da UFSCar pelos professores Luís Gustavo Esteves, Rafael Izbicki e Rafael Bassi Stern. O foco é o rigor matemático, mas o conteúdo é um pouco mais acessível com uma forte introdução à lógica Bayesiana. Fala um pouco da linguagem Stan e sua interface do R (rstan) no finalzinho.

Como citar esse conteúdo

Para citar o conteúdo use:

Storopoli (2021). Estatística Bayesiana com R e Stan. Disponível em: https://storopoli.github.io/Estatistica-Bayesiana.

Ou em formato BibTeX para LaTeX:

@misc{storopoli2021estatisticabayesianaR,
  author = {Storopoli, Jose},
  title = {Estatística Bayesiana com R e Stan},
  url = {https://storopoli.github.io/Estatistica-Bayesiana},
  year = {2021}
}

Licença

Este obra está licenciado com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional.

CC BY-SA 4.0

About

Disciplina de Estatística Bayesiana da UNINOVE

https://storopoli.github.io/Estatistica-Bayesiana

License:Creative Commons Attribution Share Alike 4.0 International


Languages

Language:R 76.8%Language:TeX 23.2%