Statistisk læring utvikler og bruker effektive beregningsalgoritmer for å gjøre estimering av statistiske modellene mer effektive, spesielt når det kommer til store mengder eller høy-dimensjonale datasett. Til dette kombineres metoder fra informatikk med statistiske verktøy med fokus på datainnsamling, gjenfinning, og rapportering. Ulik programvare, inkludert R, Phyton og Matlab, er praktiske verktøy som brukes. Læringsproblemene kan i hovedsak kategoriseres som enten «supervised» eller «unsupervised». Målet med supervised-læring er å forutsi verdien av en output-variabel ut fra en rekke input-variabler, og å minimere prediksjonsfeil. Målet med unsupervised-læring er å beskrive assosiasjoner og mønstre blant et sett variabler. Statistisk læring inkluderer regresjon, klassifisering, tetthetsestimering, hovedkomponentanalyse, sparsom læring, nevrale nettverk, boosting og Bayesian inferens.

Statistisk læring legger også vekt på statistisk inferens, inkludert hypotesetesting,  for å lære om forholdene mellom forskjellige variabler. Ved for eksempel å evaluere betydningen av modell parameterne, er mange statistiske modeller gjennomsiktige og tolkelige. Når det gjelder prediksjon, kan statistisk læring kvantifisere usikkerheten i prediksjonen og dermed kontrollere risikoen for prediksjon.

Medlemmer av statistikkgruppen er aktive i forskning av metodemodifikasjon i statistisk læring. Forskningstemaer inkludert sparse Bayesian learning, Boosting og effektive beregningsalgoritmer.

Gruppen tilbyr også kursene i Statistisk Læring og  Monte Carlo metoder og Bayesiansk statistikk. For mer informasjon, ta gjerne kontakt med Yushu Li.