I dette blogindlæg taler vi om, hvordan vi kan bruge en usuperviseret lærings algoritme til at skabe værdi så hurtigt som muligt.

A water pump

Få virksomheder labler som udgangspunkt ikke data fra maskiner som “normal” eller “brudt”, med mindre de har indført en data strategi der peger på at udføre prædiktiv vedligeholdelse i den nærmeste fremtid. Derfor tager det lang tid at få de rigtige data i det rigtige format som skal bruges i kompleks maskinlæringsalgoritmer, som vi gjorde i tidligere blog post . Yderligere, hvis vi kører en periode på et år til indsamling af data, hvor maskinen kører normalt, og når den oplever et nedbrud, vil vi opleve en lang implementeringstid. For at kunne bruge den foregående fremgangsmåde er vi nødt til at opleve mindst tre nedbrud på maskinerne, der er registreret i datasættet samt er labled korrekt.

Når vi har lavet en god maskinlæringsmodel til at forudsige fremtidige nedbrud, er tidligere nedbrud meget vigtige. Jo flere nedbrud desto bedre bliver forudsigelserne ved at have flere nedbrud at lære fra!

Hvad er superviseret og usuperviseret læring?

For at forstå, hvordan disse to maskinlæringsmetoder adskiller sig fra hinanden, vil vi gennemgå dem, før vi fortsætter.

Superviseret læring beskriver en tilgang til hvordan maskinlæringsalgoritmen lærer under træning. I superviseret læring overvåger du træningsfasen ved at fortælle algoritmen, hvad den ægte outputværdi er. Dette gøres ved at lable dine outputværdier. Som et eksempel, hvis vi forsøger at klassificere katte fra hunde og omvendt, vil vi lable alle billeder som enten en kat eller en hund og bruge det til træning, validering og test af nøjagtigheden af ​​vores model. Når modellen skabes, er der ikke yderligere behov for labeling af dataene, medmindre de bruges til gentræning. I forbidnelse med prædiktiv vedligeholdelse vil vi være nødt til at lable alle mulige udfald ud fra hvordan maskinen har det. Disse faser kunne opdeles i 1) i operation, 2) opstart, 3) nedbrud og 4) gensopsart.
Superviseret lærings algoritmer fungerer godt til klassificering - og regressionsproblemer som forudsigelse og klassificering af hvordan maskinen har det, som vi gjorde i forrige blogindlæg med Random Forest.

Usuperviseret læring beskriver en anden indlæringsmetode hvor maskinlæringsalgoritmer selv skal lære, hvornår man skal klassificere noget som enten en kat eller en hund. Usuperviseret læring kan ikke løse alle problemer. De er gode til at løse de problemer som vi selv som mennesker har svært ved at løse. Et eksempel på usuperviseret læring er at klynge dine kunder i forskellige segmenter så de, der ser ens ud på forskellige parametre klynges sammen. Disse oplysninger kan derefter bruges til at målrette markedsføring.

Reducer implementeringstiden med usuperviseret læring

Ved at bruge usuperviseret læring kan vi bruge data fra maskinen når den kører “Normal” drift til at oprette en model. Denne model kan forudsige sandsynligheden for fremtidige nedbrud med næsten lige så stor succesrate som den superviseret lærings algoritme. Ved at bruge denne model kan vi begynde at skabe værdi inden for en meget kort tidsperiode og være i stand til at identificere næsten alle nedbrud, samtidig med at vi får flere data til at oprette den mere avancerede superviseret lærings algoritme der har en større nøjagtighed.

Gennemføre test

Vi bruger de data, hvor vandpumpen kører normalt og skaber en model. Vi gemmer derefter modellen og begynder at forudsige på hele datasættet, inklusive observationer af nedbrud.

Vi ved, at vi havde en nedbrud 12. april 2018 kl. 21.55 og var med vores Long Short-Term Memory (LSTM)-model i stand til at forudsige den fremtidige nedbrud 30 minutter før hændelsen. Imidlertid kan vi med vores nye maskinlæringsmodel forudsige den samme fiasko 10 minutter før nedbrudet.

I det forrige blogindlæg forsøgte vi desuden at opdage nedbrudet 8. juli 2018 kl. 11:00. Med vores LSTM-model var vi i stand til at opdage denne hændelse 38 minutter før fejlen. Med denne model kan vi konstatere denne fejl 61 minutter før nedbrudet!

Hvis vi ser på resten af ​​fejlene kan vi opdage dem fra 12 - 37 minutter før de forekommer, resultatet er ikke så stærkt som med vores LSTM-model, men alligevel stadig markant og korrekt!

Hvordan kommer vi i gang

Det er fantastisk!
I neurospace tror vi på at skabe værdi så hurtigt som muligt, og det er nøjagtigt hvad vi kan gøre med disse to tilgange. Vi er i stand til at forudsige nedbrud fra 9 - 61 minutter før hændelsen med den usuperviserede læringsmetode, der kan implementeres ved kun at bruge data fra maskinen i normal drift. Hvis din virksomhed har en maskine der er kritisk for den samlede operation, som du i dag ikke henter data fra betyder det, med data fra en måned, kan vi begynde at skabe værdi og forudsige fremtidige nedbrud med en høj succesrate.

Selvom vi kan forudsige nedbrud med succes inden de sker med denne tilgang, er de mindre nøjagtige end med vores LSTM-model. Derfor er vores langsigtede mål for bedre forudsigelser at bruge den mere komplekse algoritme og derved have mindre falske positiver.

Hvordan kommer du i gang?

Journey Towards Predictive Maintenance

Det hele starter med data! Vi har brug for data fra maskinerne for at kunne oprette en model, der er skræddersyet til den specifikke maskine. Disse data skal bestå af de parametre, der kan hjælpe med at forudsige en fremtidig nedbrud.
Hvis maskinen begynder at vibrere mere end hvad der er normalt, vil vi sandsynligvis begynde at tro, at der er noget galt. Derfor kan vibrationssensorer bruges til at forudsige nogle fremtidige fejl.
Hvis temperaturen begynder at stige, og maskinen overophedes, vil det også kunne være et tegn på at noget er galt. Derfor kan temperatur også være en vigtig måling
I nogle tilfælde kan vi høre, at maskinen lyder underlig. Med disse maskiner kan lyd muligvis være en vigtig måling.
Endelig har vi måske en maskine, hvis fugtighed kan hjælpe os med at forudsige fremtidige nedbrud. For at hente dataene fra maskiner er vi nødt til at installere sensorer, der kan hente de rigtige data i den rigtige frekvens. Det anbefales stærkt at hente data med en høj frekvens (minutter, sekunder) for bedre forudsigelser. Når data er hentet, kan du begynde at få indsigt i din maskine ved hjælp af beskrivende statistikker. Med denne indsigt kan vi se, om de indsamlede data er tilstrækkelige, og begynde at lave en forudsigelsesmodel til at opdage fremtidige nedbrud.

Konklusion

Hvis din virksomhed har en kritisk maskine hvor i oplever pludslige nedbrud, kan vi oprette en maskinlæringsmodel, der med succes kan forudsige fremtidige fejl - med data fra kun en måned. Ved hjælp af denne model kan vi hjælpe med at forhindre nogle af de fremtidige nedbrud - samtidig med at vi labler dataene med det formål at bruge den mere komplekse og sikre algoritme til maskinlæring i fremtiden.
Med dette datasæt fra en vandpumpe er vi i stand til at forudsige alle fremtidige nedbrud fra 10 til 61 minutter før fejlen. Forudsigelserne er imidlertid ikke med så høj nøjagtighed, som tilfældet er i vores LSTM-model.

// Maria Hvid, Machine Learning Engineer @ neurospace