De groei van kunstmatige intelligentie (AI) heeft meer software-ingenieurs, datawetenschappers en andere professionals geïnspireerd om de mogelijkheid van een carrière in machine learning te verkennen. Sommige nieuwkomers hebben echter de neiging om zich te veel op de theorie te richten en niet genoeg op de praktische toepassing. Als je succes wilt hebben, moet je eerder vroeger dan later beginnen met het bouwen van machine learning-projecten.’ll need machine learning-projectideeën om je portfolio te verbeteren.
Het kan moeilijk zijn om te weten waar te beginnen, dus het is altijd een goed idee om begeleiding en inspiratie van anderen te zoeken. In deze post delen we voorbeelden uit de praktijk van machine learning-projecten die u zullen helpen begrijpen hoe een voltooid project eruit moet zien. We zullen ook bruikbare tips geven voor het maken van je eigen machine learning-projecten die de aandacht trekken.
Als je op zoek bent naar een uitgebreider inzicht in machine learning-carrièremogelijkheden, bekijk dan onze gidsen over hoe je een data scientist wordt en hoe je een data engineer wordt.
Identificatie van Twits op Twitter met behulp van Natural Language Processing (Beginner)
Social media hate speech en nepnieuws zijn wereldwijde fenomenen geworden in het digitale tijdperk. Hoewel beledigende posts een probleem zijn, is het nog erger wanneer ze onnauwkeurig zijn of ten onrechte worden toegeschreven aan mensen via valse profielen.
(Bron: Towards Data Science)
Projecten op het gebied van machinaal leren kunnen helpen. Een populaire toepassing van natuurlijke taalverwerking (NLP) is sentimentanalyse. Hiermee kunnen duizenden tekstdocumenten binnen enkele seconden worden gescand op bepaalde filters. Twitter kan bijvoorbeeld berichten verwerken op racistische of seksistische opmerkingen en deze tweets scheiden van andere.
Eugene Aiken ondernam een project om de posts van twee personen te analyseren en de waarschijnlijkheid te bepalen dat een specifieke tweet van een bepaalde gebruiker afkomstig was. Om dit te doen, gebruikte hij de tweets van twee bekende politieke rivalen: Donald Trump en Hillary Clinton.
Dit omvatte verschillende stadia:
- Scrape hun tweets
- Loop ze door een natuurlijke taalprocessor
- Classificeer ze met een machine learning algoritme
- Gebruik de predict-proba methode om de waarschijnlijkheid te bepalen
Met de resultaten was Eugene in staat om te identificeren welke tweets de meeste en de minste kans hadden om van Donald Trump te zijn. Ditzelfde proces kan worden gebruikt om tweets van iedereen te analyseren, inclusief je vrienden of familie.
Je kunt hier meer te weten komen over dit machine learning-project, en de dataset hier downloaden.
Finding the Frauds While Tackling Imbalanced Data (Intermediate)
Naarmate de wereld zich ontwikkelt in de richting van een cashloze, cloudgebaseerde realiteit, wordt de banksector meer dan ooit bedreigd. De wereldwijde kosten van creditcardfraude zullen in 2020 naar verwachting zijn opgelopen tot meer dan 32 miljard dollar.
Hoewel het een groot probleem is, maakt fraude slechts een minieme fractie uit van het totale aantal transacties dat dagelijks plaatsvindt. Dit leidt tot een ander probleem: onevenwichtige gegevens.
In machine learning wordt fraude gezien als een classificatieprobleem, en als je te maken hebt met onevenwichtige gegevens, betekent dit dat het te voorspellen probleem in de minderheid is. Als gevolg daarvan zal het voorspellende model vaak moeite hebben om echte zakelijke waarde uit de gegevens te halen, en kan het er soms naast zitten.
(Bron: Towards Data Science)
Rafael Pierre legt uit hoe het Towards Data Science-team een project heeft uitgevoerd om dit probleem aan te pakken. Ze werkten met een zeer onevenwichtige dataset met 492 fraudegevallen op 284.807 transacties en pasten drie verschillende strategieën toe:
- Oversampling
- Undersampling
- Een gecombineerde aanpak
Weliswaar heeft elke techniek zijn verdiensten, maar de combinatieaanpak vond de juiste plek tussen precisie en recall, waardoor een hoge mate van precisie werd bereikt bij onevenwichtige datasets.
U kunt hier meer te weten komen over dit machine learning-project.
Oplichtigen aan de haak slaan met behulp van geo-kartering en cloud computing (gevorderd)
kwetsbaar zeeleven wordt over de hele wereld enorm bedreigd door illegale stropers. Jarenlang was het praktisch onmogelijk om de activiteiten van elke boot op zee in de gaten te houden. Tegenwoordig hebben de ontwikkelingen op het gebied van AI, geo-mapping en cloud computing geleid tot een briljant idee voor een machine learning project: Global Fishing Watch.
(Bron: Unsplash)
Dus, hoe helpt machine learning Global Fishing Watch precies bij het identificeren van illegale visserijactiviteiten in onze oceanen? Dit lopende project omvat drie hoofdfasen:
- Oogsten van gegevens – De meeste grote schepen gebruiken een GPS-achtig apparaat dat bekend staat als het automatische identificatiesysteem (AIS), dat hun positie uitzendt. Hoewel veel vissersboten geen AIS hebben, zijn degenen die dat wel hebben goed voor ongeveer 80 procent van de wereldwijde visserij op volle zee. Door AIS-apparatuur met satellieten te volgen, is het mogelijk scheepsbewegingen te volgen, zelfs in afgelegen gebieden.
- Verwerking – Global Fishing Watch gebruikt neurale netwerken om de informatie te verwerken en patronen te vinden in grote datasets. Dit omvat zo’n 60 miljoen datapunten van meer dan 300.000 schepen-dagelijks! Met de hulp van visserijdeskundigen heeft het algoritme geleerd hoe het deze vaartuigen kan classificeren aan de hand van een aantal factoren, zoals:
- Type – zeil, vracht, vissen
- Vistuig – sleepnet, beuglijn, ringzegen
- Visgedrag – waar het is, wanneer het actief is
- Delen van de resultaten – Deze informatie over het volgen van schepen is publiekelijk beschikbaar. Iedereen kan de website bezoeken om de bewegingen van commerciële vissersboten in realtime te volgen, ze op de interactieve kaart te volgen of de gegevens te downloaden. Mensen kunnen zelfs heat maps maken om patronen van visserijactiviteit te controleren of de sporen van specifieke vaartuigen in beschermde zeegebieden te bekijken.
U kunt hier meer te weten komen over dit machine learning-project.
Uber Helpful Customer Support Using Deep Learning (Advanced)
Als een van de belangrijkste voorbeelden van technologische disruptie, is Uber van plan om rond te blijven hangen. Met miljarden ritten per jaar te verwerken, heeft de ride-sharing-app een fantastisch ondersteuningssysteem nodig om problemen van klanten zo snel mogelijk op te lossen.
(Bron: Uber)
Uber heeft zich ten doel gesteld de effectiviteit van zijn klantenondersteuningsvertegenwoordigers te verbeteren door een “mens-in-de-lus” modelarchitectuur te creëren, die Customer Obsession Ticket Assistant, of COTA, wordt genoemd.
Door twee versies van COTA te split-testen, gebruikte het Uber-team deep learning om de impact op ticketafhandelingstijd, klanttevredenheid en inkomsten te ontdekken. Het is een geweldig model voor deep learning-projecten die slimme technische architectuur combineren met menselijke input, en hopelijk levert het je andere deep learning-projectideeën op.
U kunt hier meer te weten komen over dit machine learning-project.
Barbie met hersenen met behulp van Deep Learning-algoritmen (geavanceerd)
Moderne poppen die kunnen “spreken” spelen een belangrijke rol bij het vormen van de jonge geesten van kinderen. Echter, standaard poppen hebben meestal een beperkte set van zinnen die geen correlatie hebben met wat het kind zegt.
Maar wat als de pop vragen kon begrijpen? Wat als de pop logische antwoorden zou kunnen geven?
(Bron: ToyTalk)
Hello Barbie is een opwindende demonstratie van de kracht van machine learning en kunstmatige intelligentie. Door middel van NLP en enkele geavanceerde audio-analyses kan Barbie een logische conversatie voeren. De microfoon aan haar halsketting neemt op wat er gezegd wordt en stuurt het door naar de ToyTalk servers, waar het geanalyseerd wordt.
Er zijn meer dan 8.000 dialoogregels beschikbaar, en de servers sturen het meest geschikte antwoord binnen een seconde terug, zodat Barbie kan reageren. Beschouw het als een andere architectuur die toevoegt aan uw trove van deep learning project ideeën.
Je kunt hier meer te weten komen over dit machine learning-project.
Netflix Artwork Personalization Using AI (Advanced)
Netflix is nu de dominante kracht in entertainment, en het bedrijf begrijpt dat verschillende mensen verschillende smaken hebben. Soms zijn mensen schuldig aan het beoordelen van shows of films door hun beelden en dus zullen ze misschien nooit check out bepaalde programma’s. Om zich niet te laten verslaan, wil Netflix meer mensen overhalen om naar hun shows te kijken.
(Bron: Unsplash)
Wanneer je Netflix bezoekt, zie je soms verschillende artwork voor dezelfde shows. Dit is machine learning aan het werk. Netflix maakt gebruik van een convolutioneel neuraal netwerk dat visueel beeldmateriaal analyseert. Het bedrijf legt uit dat ze ook vertrouwen op “contextuele bandieten,” die voortdurend werken om te bepalen welk kunstwerk betere betrokkenheid krijgt.
Na verloop van tijd, als je Netflix meer gebruikt, begint het niet alleen te begrijpen welke programma’s je leuk vindt, maar ook wat voor soort kunstwerk! Als u bijvoorbeeld verschillende films met Uma Thurman in de hoofdrol hebt bekeken, zult u waarschijnlijk Pulp Fiction-kunst zien met de actrice in plaats van mede-sterren John Travolta of Samuel L. Jackson.
U kunt hier meer te weten komen over dit machine learning-project.
Gerelateerd: 6 Complete Data Science-projecten
Hoe genereer je je eigen ideeën voor machine learning-projecten
Als je al leert om een machine learning-ingenieur te worden, ben je misschien klaar om je erin vast te bijten.
Kies een idee dat je opwindt
Om te beginnen moet je brainstormen over een aantal machine learning projectideeën. Denk na over uw interesses en kijk om high-level concepten te creëren rond die. Kies het meest levensvatbare idee, en maak het vervolgens hard met een schriftelijk voorstel, dat fungeert als een blauwdruk om gedurende het project te controleren.
Related: 5 Untraditional Industries That Are Leveraging AI
Avoid Going Out of Scope
Als het je eerste project is, moet je vechten tegen de drang om buiten de scope van het project te gaan. Focus op eenvoudige machine learning-projecten. Door u te concentreren op een klein probleem en onderzoek te doen naar een grote, relevante dataset, is de kans groter dat uw project een positief rendement op uw investering oplevert.
Test je hypothese
Zeker als we het hebben over eenvoudige machine learning-projecten voor beginners, is het belangrijkste om over na te denken het genereren van inzichten uit je project. Maak je nog geen zorgen over het handelen naar die inzichten. Modelleer je hypothese, en test het. Python is de gemakkelijkste taal voor beginners, en we raden je aan om het te gebruiken om je testen uit te voeren.
Uitvoeren van de resultaten
Als u alle gewenste uitkomsten heeft bereikt, kunt u gaan kijken naar het uitvoeren van uw project. Er zijn een paar stappen in deze fase:
- Maak een API (application programming interface) – Hiermee kunt u uw machine learning-inzichten integreren in het product.
- Leg resultaten vast in één database – Door alles bij elkaar te zetten, maak je het makkelijker om op de resultaten voort te bouwen.
- Embed de code – Als je weinig tijd hebt, is het embedden van de code sneller dan een API.
Revise and Learn
Wanneer u klaar bent met het project, evalueer dan de bevindingen. Denk na over wat er is gebeurd, en waarom. Wat had je anders kunnen doen? Na verloop van tijd, als je ervaring opdoet, zul je in staat zijn om van je eigen fouten te leren.
Tips voor Machine Learning-projecten voor beginners
Zelfs eenvoudige machine learning-projecten moeten worden gebouwd op een solide basis van kennis om een echte kans op succes te hebben. Bovendien maakt het competitieve speelveld het moeilijk voor nieuwkomers om op te vallen.
Gerelateerd: How to Land a Machine Learning Internship
Hier zijn een paar tips om je machine learning-project te laten schitteren.
Get Familiar With the Common Applications of Machine Learning
In het algemeen zijn er drie basistypen van machine learning:
- Supervised learning analyseert historische gegevens om nieuwe uitkomsten te voorspellen. Bijvoorbeeld het voorspellen van onroerendgoedprijzen.
- Unsupervised learning zoekt naar gegevenspatronen met behulp van statistische analyse. Bijvoorbeeld het identificeren van klantsegmenten binnen de verkoopgegevens van uw bedrijf.
- Reinforcement learning werkt met een dynamisch model dat gebruikmaakt van trial and error om de prestaties voortdurend te verbeteren. Bijvoorbeeld, de handel in aandelen.
Wanneer u een beter begrip van deze toepassingen ontwikkelt, zult u weten hoe u machine learning op uw probleem kunt toepassen.
Opwerking en opschoning van gegevens niet onderschatten
Vuile gegevens kunnen uw resultaten vertekenen. Daarom moet u regelmatig gebruik maken van data preprocessing en data cleaning. Eenvoudig gezegd gaat het erom uw gegevens begrijpelijker te maken. Door dingen op te ruimen en ontbrekende gegevens in te voeren, zorgt u ervoor dat uw modellen zo nauwkeurig mogelijk zijn. Als uw projecten op het gebied van machinaal leren problemen hebben met de kwaliteit van de gegevens, moet het artikel waarnaar hierboven wordt verwezen, u helpen met de basisprincipes van datatrimmen met machine learning-projectideeën.
Machine learning is een teamspel
Zelfs Neo had vrienden nodig. Als je machine learning-projecten ontwikkelt, moet je samenwerken met andere mensen, van wie velen niet dezelfde kennis van AI en software zullen hebben als jij.
Je moet andere mensen vertrouwen, en ook eerlijk zijn over je model. Uiteindelijk, als je werkt aan machine learning-projecten, streef dan naar transparantie en open communicatie, zodat je project soepel kan verlopen.
Focus op het oplossen van problemen in de echte wereld
Het is allemaal goed en wel om machine learning te gebruiken voor leuke toepassingen, maar als je je oog hebt op het landen van een baan als machine learning engineer, moet je je richten op het verlichten van een pijnpunt dat door veel mensen wordt gevoeld. Denk na over hoe je project waarde zal bieden aan klanten. Door onderzoek te doen naar problemen in de echte wereld, kun je jouw project laten opvallen als een project dat de wereld wil en nodig heeft. Bedenk niet alleen deep learning-projecten om te pronken met je vaardigheden – creëer een betekenisvolle impact met welke technologie je ook maar kunt. Het is de impact en niet de technologie die er echt toe doet.
Speel op je sterke punten
Als je nieuw bent in machine learning en niet veel ervaring hebt, kan het een beetje ontmoedigend zijn om het op te nemen tegen veteraan codeurs en software engineers. In dit geval kan je vermeende zwakte een sterkte zijn. U kunt uw achtergrond en voorkennis over verschillende sectoren gebruiken om unieke machine learning-projecten op te zetten waar veel andere mensen misschien niet eens aan denken. U kunt machine learning-projectideeën genereren met uw eigen perspectief door ook naar open datasets te kijken.
Machine learning kan de wereld menselijker maken
De machine learning-industrie zal de komende jaren blijven groeien. Hoewel sommige mensen de zogenaamde “opkomst van de robots” zien als het einde van de persoonlijke benadering in het bedrijfsleven, is de werkelijkheid precies het tegenovergestelde. Er zijn zoveel geweldige machine learning-projectideeën die bedrijven daadwerkelijk helpen een betere service te bieden, waarbij merken effectief worden vermenselijkt door ze beter af te stemmen op de interesses van hun doelpubliek.
Het is niet eenvoudig om uw eerste machine learning projectideeën te ontwikkelen. Door van anderen te leren, kunt u iets geweldigs creëren. Projecten op het gebied van machinaal leren kunnen dramatische effecten hebben op gebieden die zo divers en zo belangrijk zijn als menselijke gezondheid en economie: projecten op het gebied van machinaal leren kunnen helpen ons begrip van onszelf en van onze wereld te bevorderen.
Springboard’s Machine Learning Engineering Career Track, de eerste in zijn soort die wordt geleverd met een baangarantie, richt zich op projectgebaseerd leren. Kom meer te weten.