Semi-veiledet læring

Den semi-overvåket læring er en klasse av teknikker maskinlæring som bruker et sett av merkede og umerkede data. Det faller dermed mellom veiledet læring som bare bruker merkede data og uten tilsyn læring som bare bruker umerkede data. Bruk av umerkede data, i kombinasjon med merkede data, har vist seg å forbedre kvaliteten på læringen betydelig.

En annen interesse oppstår fra det faktum at merking av data ofte krever inngrep fra en menneskelig bruker. Når datasett blir veldig store, kan dette være kjedelig. I dette tilfellet er semi-overvåket læring, som bare krever noen få merkelapper, av åpenbar praktisk interesse.

Et eksempel på semi-overvåket læring er samlæring, der to klassifikatorer lærer et datasett, men hver bruker et sett med forskjellige, ideelt uavhengige egenskaper. Hvis dataene er individer som skal klassifiseres i menn og kvinner, kan man for eksempel bruke høyde og den andre hårveksten.

Referanser

  1. Blum, A., Mitchell, T. Kombinere merkede og umerkede data med co-trening . COLT: Proceedings of the Workshop on Computational Learning Theory, Morgan Kaufmann, 1998, s. 92-100.