3 Soorten machineleren

3 Soorten machineleren - dummies
< Machine learning komt in veel verschillende smaken, afhankelijk van het algoritme en de doelstellingen. U kunt machine learning-algoritmen verdelen in drie hoofdgroepen op basis van hun doel:

Begeleid leren

  • Niet-gesuperviseerd leren
  • Versterking leren
  • Begeleid leren

Begeleid leren

treedt op wanneer een algoritme leert van een voorbeeld gegevens en bijbehorende doelantwoorden die kunnen bestaan ​​uit numerieke waarden of tekenreekslabels, zoals klassen of tags, om later de juiste reactie te voorspellen wanneer deze wordt gesteld met nieuwe voorbeelden. De begeleide aanpak is inderdaad vergelijkbaar met menselijk leren onder supervisie van een leraar. De docent biedt goede voorbeelden voor de student om te onthouden en de student ontleent dan algemene regels aan deze specifieke voorbeelden.

U moet een onderscheid maken tussen regressieproblemen, waarvan het doel een numerieke waarde is, en classificatieproblemen, waarvan het doel een kwalitatieve variabele is, zoals een klasse of een tag. Een regressietaak bepaalt de gemiddelde prijzen van huizen in de omgeving van Boston, en een classificatie-opdracht maakt onderscheid tussen soorten irisbloemen op basis van hun kelkblaadjes en bloembladmetingen.

Niet-gesuperviseerd leren

Niet-gesuperviseerd leren

treedt op wanneer een algoritme leert van eenvoudige voorbeelden zonder enige bijbehorende respons, en aan het algoritme overlaat om zelf de gegevenspatronen te bepalen. Dit type algoritme heeft de neiging de gegevens te herstructureren in iets anders, zoals nieuwe functies die een klasse of een nieuwe reeks niet-gecorreleerde waarden kunnen vertegenwoordigen. Ze zijn heel nuttig om mensen inzichten te geven in de betekenis van gegevens en nieuwe bruikbare inputs voor machinegeleed algoritmen onder toezicht.

Als een soort van leren, lijkt het op de methoden die mensen gebruiken om erachter te komen dat bepaalde objecten of gebeurtenissen van dezelfde klasse zijn, zoals door de mate van overeenkomst tussen objecten te observeren. Sommige aanbevelingssystemen die u op het web vindt in de vorm van marketingautomatisering, zijn gebaseerd op dit soort leren.

Het algoritme voor marketingautomatisering ontleent zijn suggesties aan wat u in het verleden hebt gekocht. De aanbevelingen zijn gebaseerd op een schatting van welke groep klanten u het meest lijkt en leiden vervolgens uw waarschijnlijke voorkeuren af ​​op basis van die groep.

Wapeningsleer

Wapeningsversterking

treedt op wanneer u het algoritme presenteert met voorbeelden die geen labels hebben, zoals bij onbewaakt leren. U kunt een voorbeeld echter vergezeld laten gaan van positieve of negatieve feedback op basis van de oplossing die het algoritme voorstelt.Reinforcement learning is verbonden met applicaties waarvoor het algoritme beslissingen moet nemen (dus het product is prescriptief, niet alleen beschrijvend, zoals bij onbewaakt leren), en de beslissingen hebben consequenties. In de menselijke wereld is het net als met vallen en opstaan ​​leren. Fouten helpen je te leren omdat er een boete aan is toegevoegd (kosten, tijdverlies, spijt, pijn, enzovoort), omdat je wordt geleerd dat een bepaalde manier van werken minder kans van slagen heeft dan andere. Een interessant voorbeeld van versterkingsleren is dat computers leren om zelf videogames te spelen.

In dit geval geeft een toepassing het algoritme voorbeelden van specifieke situaties, zoals de gamer laten vastlopen in een doolhof terwijl een vijand wordt vermeden. De applicatie laat het algoritme de uitkomst kennen van de acties die het uitvoert, en het leren gebeurt terwijl het probeert te vermijden wat het ontdekt als gevaarlijk en om te overleven na te streven. Bekijk hoe het bedrijf Google DeepMind een versterkingsleren-programma heeft gemaakt dat oude videogames van Atari speelt. Let bij het bekijken van de video op hoe onhandig het programma is, maar verbetert gestaag met trainen tot het een kampioen wordt.