Den växande artificiella intelligensen (AI) har inspirerat fler mjukvaruingenjörer, datavetare och andra yrkesverksamma att utforska möjligheten till en karriär inom maskininlärning. Vissa nykomlingar tenderar dock att fokusera för mycket på teori och för lite på praktisk tillämpning. Om du ska lyckas måste du börja bygga maskininlärningsprojekt förr snarare än senare. behöver idéer till maskininlärningsprojekt för att förbättra din portfölj.
Det kan vara svårt att veta var man ska börja, så det är alltid en bra idé att söka vägledning och inspiration från andra. I det här inlägget delar vi med oss av verkliga exempel på maskininlärningsprojekt som hjälper dig att förstå hur ett färdigt projekt bör se ut. Vi kommer också att ge användbara tips för att skapa dina egna uppmärksammade maskininlärningsprojekt.
Om du vill ha en mer omfattande inblick i karriärmöjligheterna inom maskininlärning kan du kolla in våra guider om hur man blir datavetare och hur man blir dataingenjör.
Identifiera Twits på Twitter med hjälp av naturlig språkbehandling (nybörjare)
Hatretorik och falska nyheter i sociala medier har blivit världsomspännande fenomen i den digitala tidsåldern. Även om kränkande inlägg är ett problem är det ännu värre när de är felaktiga eller felaktigt tillskrivs personer genom falska profiler.
(Källa: Towards Data Science)
Projekt om maskininlärning kan hjälpa till. En populär tillämpning av behandling av naturliga språk (NLP) är sentimentanalys. Detta gör det möjligt att på några sekunder skanna tusentals textdokument efter vissa filter. Twitter kan till exempel behandla inlägg med avseende på rasistiska eller sexistiska kommentarer och skilja dessa tweets från andra.
Eugene Aiken genomförde ett projekt för att analysera två personers inlägg och bestämma sannolikheten för att en viss tweet kom från en viss användare. För att göra detta använde han tweets från två välkända politiska rivaler: Donald Trump och Hillary Clinton.
Detta innebar flera steg:
- Skrapa deras tweets
- Kör dem genom en processor för naturligt språk
- Klassificera dem med en algoritm för maskininlärning
- Använd predict-proba-metoden för att bestämma sannolikheten
Med hjälp av resultaten kunde Eugene identifiera vilka tweets som med störst respektive minst sannolikhet var från Donald Trump. Samma process kan användas för att analysera tweets från vem som helst, inklusive dina vänner eller din familj.
Du kan lära dig mer om det här maskininlärningsprojektet här och ladda ner datamängden här.
Finns bedrägerierna samtidigt som du tar itu med obalanserade data (Intermediate)
I takt med att världen rör sig mot en kontantlös, molnbaserad verklighet, är banksektorn under större hot än någonsin. Den globala kostnaden för kreditkortsbedrägerier förväntas stiga till över 32 miljarder dollar år 2020.
Sammantaget är det ett stort problem, men bedrägerier står bara för en mycket liten del av det totala antalet transaktioner som sker varje dag. Detta ger upphov till ett annat problem: obalanserade data.
I maskininlärning betraktas bedrägerier som ett klassificeringsproblem, och när man har att göra med obalanserade data innebär det att det problem som ska förutsägas är i minoritet. Som ett resultat kommer den prediktiva modellen ofta att kämpa för att producera verkligt affärsvärde från data, och den kan ibland få fel.
(Källa: Towards Data Science)
Rafael Pierre förklarar hur Towards Data Science-teamet genomförde ett projekt för att ta itu med det här problemet. De arbetade med en mycket obalanserad datamängd med 492 bedrägerier av 284 807 transaktioner och implementerade tre olika strategier:
- Oversampling
- Undersampling
- En kombinerad strategi
Vidare varje teknik har sina fördelar, men kombinationsstrategin var en perfekt kombination mellan precision och recall, vilket ger en hög grad av precision när det gäller obalanserade datamängder.
Du kan läsa mer om detta maskininlärningsprojekt här.
Fånga skurkar på kroken med hjälp av geokartläggning och molntjänster (avancerat)
Sårbart marint liv är oerhört hotat av illegala tjuvjägare runt om i världen. Under många år var det praktiskt taget omöjligt att hålla koll på alla båtar till havs. I dag har framsteg inom artificiell intelligens, geokartläggning och molntjänster kombinerats för att förverkliga en briljant projektidé för maskininlärning: Global Fishing Watch.
(Källa: Unsplash)
Så, hur exakt hjälper maskininlärning Global Fishing Watch att identifiera olaglig fiskeverksamhet i våra hav? Detta pågående projekt omfattar tre huvudfaser:
- Skörda data – De flesta stora fartyg använder en GPS-liknande enhet som kallas automatiskt identifieringssystem (AIS), som sänder ut deras position. Även om många fiskebåtar inte har AIS står de som har det för cirka 80 procent av det globala fisket på öppet hav. Genom att spåra AIS-enheter med hjälp av satelliter är det möjligt att övervaka fartygens rörelser, även i avlägsna områden.
- Bearbetning – Global Fishing Watch använder neurala nätverk för att bearbeta informationen och hitta mönster i stora datamängder. Detta omfattar cirka 60 miljoner datapunkter från över 300 000 fartyg – dagligen! Med hjälp av fiskeexperter har algoritmen lärt sig att klassificera dessa fartyg utifrån ett antal faktorer, t.ex:
- Typ – segel, last, fiske
- Fångstredskap – grind, långrev, snörpvad
- Fiskebeteende – var det befinner sig, när det är aktivt
- Delning av resultaten – Den här informationen om fartygsspårning är allmänt tillgänglig. Vem som helst kan besöka webbplatsen för att spåra kommersiella fiskebåtars rörelser i realtid, följa dem på den interaktiva kartan eller ladda ner uppgifterna. Människor kan till och med skapa värmekartor för att kontrollera mönster i fiskeverksamheten eller visa spåren av specifika fartyg i marinskyddade områden.
Du kan läsa mer om detta maskininlärningsprojekt här.
Uber Hjälpsam kundsupport med hjälp av djupinlärning (avancerad)
Som ett av de främsta exemplen på tekniska störningar har Uber för avsikt att stanna kvar. Med miljarder resor att hantera varje år behöver samåkningsappen ett fantastiskt supportsystem för att lösa kundproblem så snabbt som möjligt.
(Källa: Uber)
Uber satte sig för att förbättra effektiviteten hos sina kundsupportrepresentanter genom att skapa en modellarkitektur med en ”människa i loopen”-modell, som kallas Customer Obsession Ticket Assistant, eller COTA.
För att dela ut två versioner av COTA använde Uber-teamet djupinlärning för att upptäcka effekten på handläggningstiden för biljetter, kundnöjdhet och intäkter. Det är en bra modell för djupinlärningsprojekt som kombinerar smart teknisk arkitektur med mänsklig input och kommer förhoppningsvis att ge dig andra idéer till djupinlärningsprojekt.
Du kan läsa mer om detta maskininlärningsprojekt här.
Barbie med hjärnor med hjälp av djupinlärningsalgoritmer (avancerad)
Moderna dockor som kan ”tala” spelar en viktig roll när det gäller att forma barnens unga sinnen. Standarddockor har dock vanligtvis en begränsad uppsättning fraser som inte har något samband med vad barnet säger.
Men tänk om dockan kunde förstå frågor? Tänk om dockan kunde ge logiska svar?
(Källa: ToyTalk)
Hello Barbie är en spännande demonstration av kraften i maskininlärning och artificiell intelligens. Genom NLP och lite avancerad ljudanalys kan Barbie interagera i en logisk konversation. Mikrofonen på hennes halsband registrerar vad som sägs och överför det sedan till ToyTalk-servrarna, där det analyseras.
Det finns över 8 000 dialograder tillgängliga, och servrarna skickar tillbaka det lämpligaste svaret inom en sekund så att Barbie kan svara. Betrakta det som ytterligare en arkitektur som läggs till i din samling av idéer för projekt för djupinlärning.
Du kan läsa mer om detta maskininlärningsprojekt här.
Netflix Artwork Personalization Using AI (Advanced)
Netflix är den dominerande kraften inom underhållning nu, och företaget förstår att olika människor har olika smak. Ibland gör sig människor skyldiga till att bedöma program eller filmer efter deras bilder och därför kanske de aldrig kollar in vissa program. För att inte låta sig besegras har Netflix som mål att övertala fler människor att titta på deras program.
(Källa: Unsplash)
När du besöker Netflix ser du ibland olika konstverk för samma program. Detta är maskininlärning i arbete. Netflix använder ett konvolutionellt neuralt nätverk som analyserar visuella bilder. Företaget förklarar att de också förlitar sig på ”kontextuella banditer”, som kontinuerligt arbetar för att avgöra vilket konstverk som får bättre engagemang.
Med tiden, när du använder Netflix mer, börjar det förstå inte bara vilka program du gillar, utan också vilken typ av konstverk! Om du till exempel har tittat på flera filmer med Uma Thurman i huvudrollen, är det troligt att du kommer att se Pulp Fiction-konst med skådespelerskan i stället för medspelarna John Travolta eller Samuel L. Jackson.
Du kan läsa mer om det här maskininlärningsprojektet här.
Relaterat: Om du redan håller på att lära dig att bli en maskininlärningsingenjör är du kanske redo att sätta dig in i arbetet. Om inte, så följer här några steg för att komma igång.
Välj en idé som lockar dig
För att sätta igång måste du brainstorma några projektidéer för maskininlärning. Tänk på dina intressen och försök att skapa koncept på hög nivå kring dessa. Välj den mest genomförbara idén och befäst den sedan med ett skriftligt förslag, som fungerar som en blåkopia som du kan kontrollera under hela projektet.
Relaterat: 5 otraditionella branscher som utnyttjar AI
Undvik att gå utanför omfattningen
Om det är ditt första projekt bör du kämpa mot lusten att gå utanför projektets omfattning. Fokusera på enkla projekt för maskininlärning. Genom att fokusera på ett litet problem och undersöka en stor, relevant datamängd har ditt projekt större sannolikhet att generera en positiv avkastning på din investering.
Testa din hypotes
Särskilt när man talar om enkla maskininlärningsprojekt för nybörjare är det viktigaste att tänka på att generera insikter från ditt projekt. Oroa dig inte för att agera på dessa insikter ännu. Modellera din hypotes och testa den. Python är det enklaste språket för nybörjare, och vi råder dig att använda det för att genomföra dina tester.
Implementera resultaten
När du har uppnått alla önskade resultat kan du se till att implementera ditt projekt. Det finns några steg i det här skedet:
- Skapa ett API (application programming interface) – Detta gör att du kan integrera dina insikter om maskininlärning i produkten.
- Registrera resultaten i en enda databas – Genom att samla allting gör du det lättare att bygga vidare på resultaten.
- Bädda in koden – När du har ont om tid är det snabbare att bädda in koden än ett API.
Revise and Learn
När du har avslutat projektet ska du utvärdera resultaten. Tänk på vad som hände och varför. Vad kunde du ha gjort annorlunda? Med tiden, när du får mer erfarenhet, kommer du att kunna lära dig av dina egna misstag.
Tips för maskininlärningsprojekt för nybörjare
Även enkla maskininlärningsprojekt måste byggas på en gedigen kunskapsgrund för att ha någon verklig chans att lyckas. Dessutom gör den konkurrensutsatta spelplanen det svårt för nykomlingar att sticka ut.
Relaterat: Här är några tips för att få ditt maskininlärningsprojekt att glänsa.
Förbered dig på de vanligaste tillämpningarna av maskininlärning
I stort sett finns det tre grundläggande typer av maskininlärning:
- Övervakad inlärning analyserar historiska data för att förutsäga nya resultat. Till exempel kan man förutsäga fastighetspriser.
- Unsupervised learning letar efter datamönster med hjälp av statistisk analys. Till exempel identifiera kundsegment i företagets försäljningsdata.
- Reinforcement learning arbetar med en dynamisk modell som använder trial and error för att ständigt förbättra resultatet. Till exempel aktiehandel.
När du utvecklar en bättre förståelse för dessa tillämpningar vet du hur du ska tillämpa maskininlärning på ditt problem.
Underskatta inte förbehandling och rensning av data
Röriga data kan snedvrida dina resultat. Därför bör du se till att använda förbehandling och rensning av data regelbundet. Enkelt uttryckt handlar detta om att ta dina data och göra dem lättare att förstå. Genom att städa upp saker och ting och föra in saknade uppgifter ser du till att dina modeller blir så korrekta som möjligt. Om dina projekt om maskininlärning har problem med datakvaliteten bör den länkade artikeln innan hjälpa till med grunderna för dataförbehandling med projektidéer för maskininlärning.
Maskininlärning är ett lagspel
Även Neo behövde vänner. När du utvecklar projekt för maskininlärning måste du samarbeta med andra människor, varav många inte har samma förståelse för AI och programvara som du.
Du måste lita på andra människor och också vara ärlig om din modell. När du arbetar med maskininlärningsprojekt ska du i slutändan sträva efter transparens och öppen kommunikation så att projektet kan löpa smidigt.
Fokusera på att lösa verkliga problem
Det är bra att använda maskininlärning för roliga tillämpningar, men om du har siktet inställt på att få ett jobb som maskininlärningsingenjör bör du fokusera på att lindra en smärtpunkt som många känner. Tänk på hur ditt projekt kommer att ge kunderna ett mervärde. Genom att undersöka verkliga problem kan du få ditt projekt att framstå som något som världen vill ha och behöver. Kom inte bara på djupinlärningsprojekt för att visa upp dina färdigheter – skapa meningsfull påverkan med den teknik du kan. Det är effekten och inte tekniken som verkligen spelar roll.
Spela på dina styrkor
Om du är ny inom maskininlärning och inte har så mycket erfarenhet kan det vara lite skrämmande att gå upp mot erfarna kodare och programvaruingenjörer. I det här fallet kan din upplevda svaghet bli en styrka. Du kan luta dig mot din bakgrund och tidigare kunskap om olika branscher för att skapa unika maskininlärningsprojekt som många andra kanske inte ens tänker på. Du kan skapa projektidéer för maskininlärning med ditt eget perspektiv genom att titta på öppna dataset.
Maskininlärning kan göra världen mänskligare
Industrin för maskininlärning kommer att fortsätta att växa under många år framöver. Även om vissa människor ser den så kallade ”robotarnas uppkomst” som slutet för den personliga kontakten i näringslivet, är verkligheten den motsatta. Det finns så många bra projektidéer för maskininlärning som faktiskt hjälper företag att erbjuda en bättre service, och som effektivt humaniserar varumärken genom att göra dem mer i samklang med målgruppens intressen.
Det är inte lätt att utveckla sina första projektidéer för maskininlärning. Genom att lära dig av andra kan du skapa något fantastiskt. Projekt om maskininlärning kan få dramatiska effekter på så olika och viktiga områden som människors hälsa och ekonomi: projekt om maskininlärning kan bidra till att främja vår förståelse av oss själva och vår värld.
Springboards karriärspår för ingenjörer inom maskininlärning, det första i sitt slag med jobbgaranti, fokuserar på projektbaserat lärande. Ta reda på mer.