Skip to content

Meus estudos e experimentos para ajudar a consolidar os aprendizados relacionados aos fundamentos de estatística

Notifications You must be signed in to change notification settings

fmafonseca/statistical-thinking-data-science

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

40 Commits
 
 
 
 
 
 

Repository files navigation

Statistical Thinking for Data Science

Este repositório concentra os meus estudos e experimentos de implementação em Python para ajudar a consolidar os aprendizados relacionados aos fundamentos da estatística.

Para acessar as versões em html dos notebooks acesse aqui https://fmafonseca.github.io/statistical-thinking-data-science/.

Abaixo eu listo alguns materiais (palestras, livros, ...) que me inspiraram a criar este repositório (listados na ordem em que tive acesso aos mesmos):

(Palestra) John Rauser keynote: "Statistics Without the Agonizing Pain" -- Strata + Hadoop 2014 (Fonte: https://www.youtube.com/watch?v=5Dnw46eC-0o)

(Palestra) Statistical Thinking for Data Science | SciPy 2015 | Chris Fonnesbeck (Fonte: https://www.youtube.com/watch?v=TGGGDpb04Yc)

(Livro) Efron, B., & Hastie, T. (2016). Computer Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge: Cambridge University Press. (Fonte: https://web.stanford.edu/~hastie/CASI/)

A palestra do John Rauser (no momento da escrita deste texto, cientista de dados e engenheiro de software na Snapchat) me inspirou a, sempre que possível, buscar a explicação intuitiva por trás dos procedimentos estatísticos utilizados.

A palestra do Christopher Fonnesbeck (professor de bioestatística da universidade de Vanderbilt e um dos criadores do PyMC3), por mais óbvio que pareça, me inspirou a querer buscar o entendimento a respeito da estatística e da matemática por trás dos algoritmos que constumamos utilizar como cientista de dados.

Finalmente, o livro do Bradley Efron (professor de estatística de Stanford e criador da técnica de amostragem bootstrap) e do Trevor Hastie (professor de estatística de Stanford e um dos co-autores do famoso livro Elements of Statistical Learning) -- que estou estudando aos poucos -- apresentou-me um ponto de vista interessante sobre a estatística, no qual, a análise estatística, de maneira geral, tem duas componentes operacionais: a componente algorítmica e a componente da inferência ...

Very broadly speaking, algorithms are what statisticians do while inference says why they do them. A particularly energetic brand of the statistical enterprise has flourished in the new century, data science, emphasizing algorithmic thinking rather than its inferential justification. (Fonte: Efron, B., & Hastie, T. (2016). Computer Age Statistical Inference: Algorithms, Evidence, and Data Science. Cambridge: Cambridge University Press.)

sendo que, na minha opinião, o conhecimento sobre a parte "... its inferential justification" é muito importante, melhor dizendo fundamental, para qualquer cientista de dados.

About

Meus estudos e experimentos para ajudar a consolidar os aprendizados relacionados aos fundamentos de estatística

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published