De zakelijke gids voor machinaal leren

Machine Learning (ML)-algoritmen zijn ingebed in de structuur van veel van de technologie die we elke dag gebruiken. ML-innovaties die computervisie, deep learning, natuurlijke taalverwerking (NLP) en meer omvatten, maken deel uit van een grotere revolutie rond praktische kunstmatige intelligentie (AI). Geen autonome robots of bewuste wezens, maar een intelligentielaag die in onze apps, software en cloudservices is ingebakken en die AI-algoritmen en Big Data onder de oppervlakte combineert.

De trend is zelfs nog meer uitgesproken in het bedrijfsleven. ML wordt niet langer alleen gebruikt voor gespecialiseerde onderzoeksprojecten die worden uitgevoerd door een team van datawetenschappers. Ondernemingen maken nu gebruik van ML om bruikbare business intelligence (BI) en voorspellende analyses te verkrijgen uit steeds grotere hoeveelheden gegevens. Daarom is het belangrijker dan ooit om je niet alleen bewust te zijn van wat ML is, maar ook van de meest effectieve strategieën om het voor tastbare waarde te gebruiken.



Ted Dunning, Ph.D., is de Chief Application Architect bij Hadoop-leverancier MapR, en co-auteur van twee boeken over wat hij 'Practical Machine Learning' noemt. De veteraan uit Silicon Valley heeft tientallen jaren in het veld gewerkt en heeft gekeken hoe de AI-technieken en de ruimte zich ontwikkelden tot het punt waarop vooruitgang in cognitief computergebruik en de beschikbaarheid van open source-tools ML echt tot de mainstream hebben gebracht. Dunning sprak met PCMag om het jargon te doorbreken en uit te leggen wat ML eigenlijk betekent, en wat wijsheid en best practices te geven over hoe bedrijven het meeste uit hun ML-investering kunnen halen.

Een praktische definitie

De directe definitie van ML is systemen de mogelijkheid geven om te handelen en iteratief te leren en aanpassingen te maken, zonder enige expliciete programmering. Dunning zei dat ML een tak van statistiek is, maar een tak die heel praktisch is. Hij benadrukte dat je in een echte zakelijke context pragmatisch en realistisch moet zijn met hoe je het toepast. De kerntaak van ML is het creëren van een bedrijfsproces dat herhaalbaar, betrouwbaar en uitvoerbaar is.

'Machine learning gaat niet over achteruitkijken naar wetenschappelijke gegevens en proberen te beslissen welke conclusies haalbaar zijn', zegt Dunning. 'Het gaat erom vooruit te kijken, te vragen wat we kunnen voorspellen over de toekomst en wat er in verschillende scenario's gaat gebeuren. Als het gaat om zaken doen met deze data, hebben we het over zeer beperkte situaties waarin je reproduceerbaarheid wilt.'


Afbeelding tegoed: Todd Jaquith op Futurism.com. Klik om de volledige infographic uit te vouwen

Diep leren versus goedkoop leren

Je kunt dat basisidee opsplitsen in een aantal verschillende gebieden binnen ML, maar Dunning wees er twee in het bijzonder aan beide kanten van het spectrum: deep learning en wat hij 'goedkoop leren' noemt. Deep learning is het meer gecompliceerde concept.

'We wilden dat machine learning dieper ging. Dat is de oorsprong van de term,' zei Dunning. 'In de afgelopen 10 of 15 jaar zijn er technieken ontwikkeld die het ook echt doen. [Machine learning] vergde veel engineeringwerk om relaties in de data zichtbaar te maken voor algoritmen, die lange tijd niet zo slim waren als we wilden. Je moest algoritmen deze smakelijke gegevens op een bord overhandigen, dus we codeerden al die functies die systemen nu alleen doen.'

Diep leren is waar veel van de innovatie rond neurale netwerken ligt. Het combineert geavanceerde technieken zoals computervisie en NLP in lagen van 'dieper' leren die hebben geleid tot enorme vooruitgang op gebieden als beeld- en tekstherkenning. Dit is geweldig voor complexe modellering, maar kan overkill zijn voor eenvoudiger, alledaags zakelijk gebruik dat kan vertrouwen op gevestigde ML-frameworks en -technieken met veel minder parameters.

Goedkoop leren, legde Dunning uit, betekent eenvoudige, effectieve, beproefde technieken waarbij bedrijven geen dure middelen hoeven te investeren om het wiel opnieuw uit te vinden.

'In de informatica praten we veel over laaghangend fruit. Door de beschikbaarheid van data en de enorme toename van de rekencapaciteit hebben we de hele boom verlaagd', legt hij uit. 'Simpele machine learning is niet meer alleen voor datawetenschappers.'

Hoe werkt goedkoop leren?

Basis ML-algoritmen kunnen correlaties identificeren en aanbevelingen doen, of ervaringen meer contextueel en persoonlijker maken. Dunning zei dat er in vrijwel elk aspect van de manier waarop we omgaan met computers een kans is om goedkoop te leren om dingen eenvoudigweg beter te laten werken.

Een voorbeeld van goedkoop leren in de praktijk is fraudedetectie. Banken en handelaren hebben te maken met wijdverbreide fraude, maar het is vaak verspreid en betreft waarden die zo laag zijn dat het niet wordt gemeld. Dunning legde uit dat verkopers, door gebruik te maken van een goedkoop leeralgoritme (dat wil zeggen een bestaande ML-test die voor deze specifieke taak is geprogrammeerd), gemakkelijker de gemeenschappelijke compromispunten kunnen identificeren die gebruikers in gevaar brengen, en fraudepatronen kunnen ontdekken die anders niet zouden zichtbaar zijn.

'Stel dat je wilt achterhalen welke handelaren data lijken te lekken die tot fraude leiden. Je kunt een G^2-test gebruiken om eenvoudig te achterhalen welke handelaren oververtegenwoordigd zijn in de transactiegeschiedenis van slachtoffers van fraude versus consumenten zonder fraude', zegt Dunning. 'Dit lijkt te simpel om machine learning te heten, maar het vindt slechteriken in het echte leven. Uitbreidingen van deze techniek kunnen worden gebruikt om wat geavanceerdere technieken aan te vullen, waardoor eenvoudigere leeralgoritmen kunnen slagen waar ze anders zouden falen.'

Goedkoop leren kan op allerlei verschillende manieren worden gebruikt, dus Dunning gaf nog een voorbeeld van hoe een online bedrijf het zou kunnen gebruiken. In dit geval legde hij uit hoe een bestaand ML-algoritme een eenvoudig probleem met het rangschikken van opmerkingen kan oplossen.

Verwant

  • Waarom machine learning de toekomst isWaarom machine learning de toekomst is

'Stel dat je een artikel hebt met een aantal commentaren erop. In welke volgorde moeten ze geplaatst worden? Hoe zit het met het ordenen van de opmerkingen op basis van hoe interessant mensen denken dat ze zijn? Je kunt het aantal keren tellen dat mensen de opmerking lezen en hoe vaak ze een upvoten, maar er is nog steeds een beetje magie nodig', zei Dunning.

'Eén upvote van één lezer is waarschijnlijk niet echt beter dan acht upvotes op 10 lezers', legde hij uit. 'Erger nog, als je vroege winnaars bovenaan zet, zien de andere reacties nooit het daglicht en leer je er dus nooit iets over. Een klein beetje machine learning, Thompson-sampling genaamd, kan dit oplossen op een manier die gegevens verzamelt over nieuwe opmerkingen en waar de rangschikking onzeker is, maar ze over het algemeen ordent op een manier die gebruikers de beste ervaring geeft.'

Dunning heeft ook een reeks best practices uiteengezet voor hoe uw bedrijf het meeste uit ML kan halen. Voor een overzicht van hoe logistiek, data en een arsenaal aan verschillende algoritmen en tools een rol spelen in een succesvolle bedrijfsstrategie, bekijk onze 7 tips voor succes op het gebied van machine learning.

Aanbevolen verhalen

Battle of the Business VoIP: Skype voor Bedrijven versus RingCentral

We leggen precies uit wat u krijgt bij elke VoIP-leverancier op elk prijsniveau en hoe ze het tegen elkaar opnemen. Neem dus geen beslissing over het kopen van VoIP voor uw bedrijf zonder eerst dit artikel te lezen.

De beginnershandleiding voor pc-back-up

Je weet dat je een back-up van je gegevens moet maken. Als u niet zeker weet hoe, zal deze gids u helpen.

Google 'Perspectief' valt trollen aan met machine learning

Uitgevers die Perspective gebruiken, kunnen beslissen hoe ze omgaan met opmerkingen die door het systeem als schadelijk worden aangemerkt.

ZTE leert dat crowdfunding een crowd vereist

Bijna halverwege de campagne heeft het bedrijf minder dan 10 procent van zijn doel van $ 500.000 opgehaald.