For at træne og verificere en maskinlæringsmodel bliver datasættet opdelt i trænings, validerings og test data. Størstedelen af datasættet bruges til at træne modellen. Validerings data bruges til at validere resultatet under træningen, mens test datasættet bruges til at evaluere hvorvidt modellen er generaliserbar.