En korrelation beskriver et gensidigt forhold mellem to uafhængige variable. Korrelationen beskrives som værende enten positiv eller negativ og udtrykkes ofte som en værdi mellem -1 og +1.

Såfremt korrelationen er fra -1 til 0 betyder det at sammenhængen mellem de to variable er negativ. En negativ korrelation betyder at den ene værdi falder hvis den anden værdi stiger. Er korrelationen derimod et tal mellem 0 og +1 er korrelationen positiv, hvilket definere en gensidig stigning eller fald i begge variable. Et eksempel på en positiv korrelation er BMI og vægt. Hvis vægten stiger, stiger BMI også, mens hvis vægten falder, falder BMI også. Jo tættere korrelationen er på 0, des svagere er dette gensidige forhold, og hvis korrelationen er 0, betyder det at der ikke er nogen signifikant sammenhæng mellem de to variable. En korrelation er det vigtigste redskab til at identificere de rette datakilder til et givent problem.

Korrelationer kan være både spuriøse og partiale. En spuriøs korrelation betyder at det gensidige forhold som ses er tilfældigt. En partial korrelaiton betydre at det gensidige forhold er opstået, fordi de to variable er afhængige og korreleret med en tredje variabel.