V prezentaci budou představeny základní algoritmy a nástroje na automatizovaný výběr proměnných v regresních modelech. Bude předvedena jejich implementace ve statistickém software R. Budou ukázány některé jejich vlastnosti (z hlediska inference a predikcí) na základě Monte Carlo simulací. Dále bude poukázáno na nebezpečí spojené s některými ne příliš korektními, ale prakticky využívanými postupy, jako je například vícenásobné
testování hypotéz, p hacking, nebo volba testů hypotéz až poté, co jsou známa data.