Top 6 Machine Learning Projects To Inspire Your Portfolio

Væksten i kunstig intelligens (AI) har inspireret flere softwareingeniører, dataloger og andre fagfolk til at udforske muligheden for en karriere inden for maskinlæring. Nogle nybegyndere har dog en tendens til at fokusere for meget på teori og ikke nok på praktisk anvendelse. Hvis du vil have succes, skal du begynde at opbygge maskinlæringsprojekter snarere før end senere. har brug for ideer til maskinlæringsprojekter for at forbedre din portefølje.

Det kan være svært at vide, hvor man skal begynde, så det er altid en god idé at søge vejledning og inspiration fra andre. I dette indlæg vil vi dele eksempler fra den virkelige verden på maskinlæringsprojekter, som vil hjælpe dig med at forstå, hvordan et færdigt projekt skal se ud. Vi giver også handlingsanvisende tips til at skabe dine egne opsigtsvækkende maskinlæringsprojekter.

Hvis du leder efter et mere omfattende indblik i karrieremulighederne inden for maskinlæring, kan du læse vores vejledninger om, hvordan man bliver datalog og hvordan man bliver datatekniker.

Identificering af twits på Twitter ved hjælp af Natural Language Processing (Beginner)

Hadetale på sociale medier og fake news er blevet verdensomspændende fænomener i den digitale tidsalder. Mens krænkende indlæg er et problem, er det endnu værre, når de er unøjagtige eller fejlagtigt tilskrives personer gennem falske profiler.

(Kilde: Towards Data Science)

Projekter om maskinlæring kan hjælpe. En populær anvendelse af naturlig sprogbehandling (NLP) er sentimentanalyse. Dette gør det muligt at scanne tusindvis af tekstdokumenter for bestemte filtre på få sekunder. Twitter kan f.eks. behandle indlæg for racistiske eller sexistiske bemærkninger og adskille disse tweets fra andre.

Eugene Aiken iværksatte et projekt for at analysere indlæg fra to personer og bestemme sandsynligheden for, at et bestemt tweet kom fra en bestemt bruger. Til dette formål brugte han tweets fra to velkendte politiske rivaler: Donald Trump og Hillary Clinton.

Dette involverede flere faser:

Skrab deres tweets
Kør dem gennem en processor til naturligt sprog
Klassificer dem med en maskinlæringsalgoritme
Brug predict-proba-metoden til at bestemme sandsynligheden

Med resultaterne kunne Eugene identificere, hvilke tweets der var mest og mindst sandsynlige for at være fra Donald Trump. Den samme proces kan bruges til at analysere tweets fra alle, herunder dine venner eller familie.

Du kan få mere at vide om dette maskinlæringsprojekt her og downloade datasættet her.

Find svindlerne, mens du tackler ubalancerede data (Intermediate)

I takt med at verden bevæger sig mod en kontantløs, cloud-baseret virkelighed, er banksektoren under større trussel end nogensinde før. De globale omkostninger ved kreditkortsvindel forventes at stige til over 32 milliarder dollars i 2020.

Selv om det er et stort problem, udgør svindel kun en meget lille brøkdel af det samlede antal transaktioner, der finder sted hver dag. Dette giver anledning til et andet problem: ubalancerede data.

I maskinlæring betragtes bedrageri som et klassifikationsproblem, og når man har med ubalancerede data at gøre, betyder det, at det problem, der skal forudsiges, er i mindretal. Derfor vil den prædiktive model ofte have svært ved at producere reel forretningsværdi ud fra dataene, og den kan nogle gange tage fejl.

(Kilde: Towards Data Science)

Rafael Pierre forklarer, hvordan Towards Data Science-teamet gennemførte et projekt for at løse dette problem. De arbejdede med et meget ubalanceret datasæt, der havde 492 svindelnumre ud af 284.807 transaktioner, og implementerede tre forskellige strategier:

Oversampling
Undersampling
En kombineret tilgang

Mens hver teknik har sine fordele, ramte den kombinerede tilgang et perfekt sted mellem præcision og recall, hvilket effektivt giver en høj grad af præcision, når man har med ubalancerede datasæt at gøre.

Du kan få mere at vide om dette maskinlæringsprojekt her.

Fange skurke på krogen ved hjælp af geokortlægning og cloud computing (avanceret)

Sårbare marine organismer er under enorm trussel fra ulovlige krybskytter i hele verden. I mange år var det praktisk talt umuligt at holde øje med aktiviteterne på hver eneste båd på havet. I disse dage er fremskridt inden for AI, geokortlægning og cloud computing blevet kombineret for at realisere en genial projektidé om maskinlæring: Global Fishing Watch.

(Kilde: Unsplash)

Så, hvordan præcist hjælper maskinlæring Global Fishing Watch med at identificere ulovligt fiskeri i vores oceaner? Dette igangværende projekt omfatter tre hovedfaser:

Indsamling af data – De fleste store skibe bruger en GPS-lignende enhed kaldet AIS (Automatic Identification System), som udsender deres position. Selv om mange fiskerbåde ikke har AIS, står de, der har det, for omkring 80 procent af det globale fiskeri på åbent hav. Ved at spore AIS-enhederne med satellitter er det muligt at overvåge skibsbevægelser, selv i fjerntliggende områder.
Behandling – Global Fishing Watch anvender neurale netværk til at behandle oplysningerne og finde mønstre i store datasæt. Dette omfatter ca. 60 millioner datapunkter fra over 300.000 fartøjer – dagligt! Med hjælp fra fiskerieksperter har algoritmen lært at klassificere disse fartøjer ud fra en række faktorer som f.eks:
- Type – sejl, fragt, fiskeri
- Fangstredskaber – grinde, langline, snurrevod
- Fangstadfærd – hvor det befinder sig, hvornår det er aktivt
Deling af resultaterne – Disse oplysninger om fartøjssporing er offentligt tilgængelige. Alle kan besøge webstedet for at følge de kommercielle fiskerfartøjers bevægelser i realtid, følge dem på det interaktive kort eller downloade dataene. Folk kan endda oprette varmekort for at undersøge mønstre for fiskeriaktivitet eller se sporene af bestemte fartøjer i havbeskyttede områder.

Du kan få mere at vide om dette maskinlæringsprojekt her.

Uber Hjælpsom kundesupport ved hjælp af Deep Learning (Avanceret)

Som et af de bedste eksempler på teknologisk disruption har Uber til hensigt at blive hængende. Med milliarder af kørsler, der skal håndteres hvert år, har kørselsappen brug for et fantastisk supportsystem til at løse kundeproblemer så hurtigt som muligt.

(Kilde: Uber)

Uber satte sig for at forbedre effektiviteten af sine kundesupportrepræsentanter ved at skabe en “menneske-i-løbet”-modelarkitektur, som kaldes Customer Obsession Ticket Assistant, eller COTA.

Gennem split-test af to versioner af COTA brugte Uber-teamet deep learning til at opdage virkningen på billetbehandlingstiden, kundetilfredsheden og indtægterne. Det er en god model for deep learning-projekter, der kombinerer smart teknisk arkitektur med menneskelige input, og det vil forhåbentlig give dig andre idéer til deep learning-projekter.

Du kan lære mere om dette maskinlæringsprojekt her.

Barbie With Brains Using Deep Learning Algorithms (Advanced)

Moderne dukker, der kan “tale”, spiller en vigtig rolle i formningen af børns unge hjerner. Standarddukker har dog typisk et begrænset sæt sæt sætninger, der ikke har nogen sammenhæng med det, som barnet siger.

Men hvad nu, hvis dukken kunne forstå spørgsmål? Hvad hvis dukken kunne give logiske svar?

(Kilde: ToyTalk)

Hello Barbie er en spændende demonstration af kraften i maskinlæring og kunstig intelligens. Gennem NLP og nogle avancerede lydanalyser kan Barbie interagere i en logisk samtale. Mikrofonen på hendes halskæde optager alt, hvad der bliver sagt, og sender det derefter til ToyTalk-serverne, hvor det bliver analyseret.

Der er over 8.000 dialoglinjer til rådighed, og serverne sender det mest passende svar tilbage inden for et sekund, så Barbie kan svare. Betragt det som endnu en arkitektur, der føjer sig til din samling af idéer til deep learning-projekter.

Du kan lære mere om dette maskinlæringsprojekt her.

Netflix Artwork Personalization Using AI (Advanced)

Netflix er den dominerende kraft inden for underholdning nu, og virksomheden forstår, at forskellige mennesker har forskellige smage. Nogle gange er folk skyldige i at bedømme shows eller film ud fra deres billeder, og derfor vil de måske aldrig tjekke visse programmer ud. Netflix vil ikke lade sig besejre og har derfor til formål at overtale flere mennesker til at se deres programmer.

(Kilde: Unsplash)

Når du besøger Netflix, vil du nogle gange se forskellige illustrationer for de samme programmer. Det er maskinlæring på arbejde. Netflix bruger et konvolutionelt neuralt netværk, der analyserer visuelle billeder. Virksomheden forklarer, at de også stoler på “kontekstuelle banditter”, som løbende arbejder på at bestemme, hvilket kunstværk der får bedre engagement.

Med tiden, efterhånden som du bruger Netflix mere, begynder den ikke kun at forstå, hvilke programmer du kan lide, men også hvilken type kunstværk! Hvis du f.eks. har set flere film med Uma Thurman i hovedrollen, vil du sandsynligvis se Pulp Fiction-kunst med skuespillerinden i stedet for medspillere som John Travolta eller Samuel L. Jackson.

Du kan få mere at vide om dette maskinlæringsprojekt her.

Relateret: Hvis du allerede er i gang med at lære at blive maskinlæringsingeniør, er du måske klar til at gå i gang. Hvis ikke, er her nogle trin til at få gang i tingene.

Vælg en idé, der begejstrer dig

For at sætte tingene i gang skal du brainstorme nogle ideer til maskinlæringsprojekter. Tænk på dine interesser, og prøv at skabe koncepter på højt niveau omkring disse. Vælg den mest levedygtige idé, og fastgør den derefter med et skriftligt forslag, der fungerer som en plan, som du kan kontrollere under hele projektet.

Relateret: 5 utraditionelle industrier, der udnytter AI

Undgå at gå ud over omfanget

Hvis det er dit første projekt, bør du bekæmpe trangen til at gå ud over projektets omfang. Fokuser på enkle maskinlæringsprojekter. Ved at fokusere på et lille problem og undersøge et stort, relevant datasæt er der større sandsynlighed for, at dit projekt vil give et positivt afkast af din investering.

Test din hypotese

Særligt når vi taler om nemme maskinlæringsprojekter for begyndere, er det vigtigste at tænke på at generere indsigt fra dit projekt. Du skal ikke bekymre dig om at handle på disse indsigter endnu. Modeller din hypotese, og test den. Python er det nemmeste sprog for begyndere, og vi råder dig til at bruge det til at udføre dine test.

Implementer resultaterne

Når du har nået alle de ønskede resultater, kan du se på at implementere dit projekt. Der er et par trin i denne fase:

Opret et API (application programming interface) – Dette giver dig mulighed for at integrere din indsigt i maskinlæring i produktet.
Registrer resultaterne i en enkelt database – Ved at samle alting sammen gør du det lettere at bygge videre på resultaterne.
Indlejr koden – Når du er i tidsnød, er det hurtigere at indlejre koden end et API.

Revisionér og lær

Når du er færdig med projektet, skal du evaluere resultaterne. Tænk over, hvad der skete, og hvorfor. Hvad kunne du have gjort anderledes? Efterhånden som du får erfaring, vil du kunne lære af dine egne fejltagelser.

Tips til maskinlæringsprojekter for begyndere

Selv simple maskinlæringsprojekter skal bygge på et solidt vidensgrundlag for at have en reel chance for succes. Desuden gør det konkurrenceprægede spillerum det svært for nybegyndere at skille sig ud.

Relateret: Sådan får du et praktikophold i maskinlæring

Her er et par tips til at få dit maskinlæringsprojekt til at skinne.

Før dig bekendt med de almindelige anvendelser af maskinlæring

Der er tre grundlæggende typer af maskinlæring:

Supervised learning analyserer historiske data for at forudsige nye resultater. F.eks. forudsigelse af ejendomspriser.
Usupervised learning søger efter datamønstre ved hjælp af statistisk analyse. F.eks. identificering af kundesegmenter i din virksomheds salgsdata.
Reinforcement learning opererer med en dynamisk model, der anvender trial and error til konstant at forbedre præstationen. For eksempel aktiehandel.

Når du udvikler en bedre forståelse af disse anvendelser, ved du, hvordan du kan anvende maskinlæring på dit problem.

Undervurder ikke forbehandling og rensning af data

Støjfyldte data kan forvrænge dine resultater. Derfor bør du sørge for at bruge dataforbehandling og datarengøring regelmæssigt. Kort sagt drejer det sig om at tage dine data og gøre dem lettere at forstå. Ved at rydde op i tingene og indtaste manglende data sikrer du, at dine modeller er så præcise som muligt. Hvis dine projekter om maskinlæring har problemer med datakvaliteten, bør den linkede artikel før hjælpe dig med det grundlæggende i dataforarbejdning med ideer til maskinlæringsprojekter.

Machine Learning Is a Team Game

Selv Neo havde brug for venner. Når du udvikler maskinlæringsprojekter, skal du arbejde sammen med andre mennesker, hvoraf mange ikke har den samme forståelse af AI og software som dig.

Du skal stole på andre mennesker og også være ærlig omkring din model. I sidste ende skal du, når du arbejder på maskinlæringsprojekter, stræbe efter gennemsigtighed og åben kommunikation, så dit projekt kan forløbe gnidningsløst.

Fokuser på at løse problemer i den virkelige verden

Det er fint nok at bruge maskinlæring til sjove applikationer, men hvis du har øje for at få et job som maskinlæringsingeniør, bør du fokusere på at afhjælpe et smertepunkt, som mange mennesker føler. Tænk over, hvordan dit projekt vil give kunderne værdi. Ved at undersøge problemer fra den virkelige verden kan du få dit projekt til at skille sig ud som et projekt, som verden ønsker og har brug for. Kom ikke bare med deep learning-projekter for at vise dine færdigheder frem – skab en meningsfuld indvirkning med den teknologi, du kan. Det er virkningen og ikke teknologien, der virkelig betyder noget.

Spil på dine styrker

Hvis du er ny inden for maskinlæring og ikke har meget erfaring, kan det være lidt skræmmende at skulle op imod erfarne kodere og softwareingeniører. I dette tilfælde kan din opfattede svaghed blive en styrke. Du kan læne dig op ad din baggrund og tidligere viden om forskellige brancher for at skabe unikke maskinlæringsprojekter, som mange andre måske ikke engang tænker på. Du kan også generere idéer til maskinlæringsprojekter med dit eget perspektiv ved at kigge på åbne datasæt.

Maskinlæring kan gøre verden mere menneskelig

Maskinlæringsindustrien vil fortsætte med at vokse i mange år fremover. Mens nogle mennesker ser den såkaldte “robotternes fremmarch” som afslutningen på det personlige touch i erhvervslivet, er virkeligheden det stik modsatte. Der er så mange gode ideer til maskinlæringsprojekter, som faktisk hjælper virksomheder med at tilbyde en bedre service og effektivt menneskeliggøre brands ved at gøre dem mere i tråd med målgruppens interesser.

Det er ikke let at udvikle sine første ideer til maskinlæringsprojekter. Ved at lære af andre kan du skabe noget fantastisk. Projekter om maskinlæring kan have dramatiske virkninger på så forskellige og vigtige områder som menneskers sundhed og økonomi: projekter om maskinlæring kan bidrage til at fremme vores forståelse af os selv og af vores verden.

Springboard’s Machine Learning Engineering Career Track, som er det første af sin slags med jobgaranti, fokuserer på projektbaseret læring. Få mere at vide.