Top 6 proiecte de învățare automată pentru a vă inspira portofoliul

Creșterea inteligenței artificiale (AI) a inspirat tot mai mulți ingineri software, cercetători de date și alți profesioniști să exploreze posibilitatea unei cariere în învățarea automată. Cu toate acestea, unii nou-veniți au tendința de a se concentra prea mult pe teorie și nu suficient pe aplicarea practică. Dacă aveți de gând să reușiți, trebuie să începeți să construiți proiecte de învățare automată mai devreme decât mai târziu. veți avea nevoie de idei de proiecte de învățare automată pentru a vă îmbunătăți portofoliul.

Poate fi greu să știi de unde să începi, așa că este întotdeauna o idee bună să cauți îndrumare și inspirație de la alții. În această postare, vom împărtăși exemple reale de proiecte de machine learning care vă vor ajuta să înțelegeți cum ar trebui să arate un proiect finalizat. De asemenea, vom oferi sfaturi practice pentru a vă crea propriile proiecte de învățare automată care să vă atragă atenția.

Dacă sunteți în căutarea unei viziuni mai cuprinzătoare asupra opțiunilor de carieră în domeniul învățării automate, consultați ghidurile noastre despre cum să deveniți un om de știință de date și cum să deveniți un inginer de date.

Identificarea Twits pe Twitter folosind procesarea limbajului natural (începător)

Discursul de ură din social media și știrile false au devenit fenomene mondiale în era digitală. În timp ce postările ofensatoare sunt o problemă, este și mai rău atunci când acestea sunt inexacte sau atribuite în mod greșit unor persoane prin intermediul unor profiluri false.

(Sursa: Towards Data Science)

Proiectele privind învățarea automată pot ajuta. O aplicație populară a procesării limbajului natural (NLP) este analiza sentimentelor. Aceasta permite ca mii de documente de text să fie scanate pentru anumite filtre în câteva secunde. De exemplu, Twitter poate procesa postările pentru remarci rasiste sau sexiste și poate separa aceste tweet-uri de altele.

Eugene Aiken a întreprins un proiect pentru a analiza postările a două persoane și a determina probabilitatea ca un anumit tweet să provină de la un anumit utilizator. Pentru a face acest lucru, el a folosit tweet-urile a doi rivali politici bine-cunoscuți: Donald Trump și Hillary Clinton.

Aceasta a implicat mai multe etape:

Scraparea tweet-urilor lor
Executarea lor printr-un procesor de limbaj natural
Clasificarea lor cu un algoritm de învățare automată
Utilizarea metodei predict-proba pentru a determina probabilitatea

Cu ajutorul rezultatelor, Eugene a reușit să identifice care tweet-uri aveau cea mai mare și cea mai mică probabilitate de a fi de la Donald Trump. Același proces poate fi folosit pentru a analiza tweet-uri de la oricine, inclusiv de la prietenii sau familia dumneavoastră.

Puteți afla mai multe despre acest proiect de învățare automată aici și puteți descărca setul de date aici.

Descoperiți fraudele în timp ce abordați datele dezechilibrate (Intermediar)

În timp ce lumea se îndreaptă spre o realitate fără numerar, bazată pe cloud, sectorul bancar este mai amenințat ca niciodată. Se preconizează că, până în 2020, costul global al fraudelor cu carduri de credit va depăși 32 de miliarde de dolari.

În timp ce este o problemă majoră, frauda reprezintă doar o fracțiune infimă din numărul total de tranzacții care au loc în fiecare zi. Acest lucru dă naștere unei alte probleme: date dezechilibrate.

În învățarea automată, frauda este văzută ca o problemă de clasificare, iar atunci când aveți de-a face cu date dezechilibrate, înseamnă că problema care trebuie prezisă este minoritară. Ca urmare, modelul predictiv se va strădui adesea să producă o valoare comercială reală din date și, uneori, poate greși.

(Sursa: Towards Data Science)

Rafael Pierre explică modul în care echipa Towards Data Science a realizat un proiect pentru a aborda această problemă. Lucrând cu un set de date foarte dezechilibrat, care avea 492 de fraude din 284.807 tranzacții, au implementat trei strategii diferite:

Supraeșantionare
Supraeșantionare
O abordare combinată

În timp ce fiecare tehnică are virtuțile sale, abordarea combinată a atins un punct optim între precizie și rechemare, oferind efectiv un nivel ridicat de precizie atunci când se confruntă cu seturi de date dezechilibrate.

Puteți afla mai multe despre acest proiect de învățare automată aici.

Capturarea infractorilor în cârlig folosind Geo-Mapping și Cloud Computing (Avansat)

Viața marină vulnerabilă se află sub o amenințare imensă din partea braconierilor ilegali din întreaga lume. Timp de mulți ani, a fost practic imposibil să se țină evidența activităților fiecărei ambarcațiuni de pe mare. În aceste zile, progresele în materie de inteligență artificială, geo-cartografiere și cloud computing s-au combinat pentru a realiza o idee genială de proiect de învățare automată: Global Fishing Watch.

(Sursa: Unsplash)

Atunci, cum anume ajută machine learning Global Fishing Watch să identifice activitățile de pescuit ilegale din oceanele noastre? Acest proiect în curs de desfășurare implică trei etape principale:

Culegerea datelor – Majoritatea navelor mari folosesc un dispozitiv asemănător cu GPS, cunoscut sub numele de sistem de identificare automată (AIS), care transmite poziția lor. Deși multe nave de pescuit nu au AIS, cele care au AIS reprezintă aproximativ 80% din pescuitul global în largul mării. Prin urmărirea dispozitivelor AIS cu ajutorul sateliților, este posibil să se monitorizeze mișcările navelor, chiar și în zone îndepărtate.
Procesare – Global Fishing Watch utilizează rețele neuronale pentru a procesa informațiile și a găsi modele în seturi mari de date. Acesta cuprinde aproximativ 60 de milioane de puncte de date de la peste 300.000 de nave – zilnic! Cu ajutorul experților în domeniul pescuitului, algoritmul a învățat cum să clasifice aceste nave în funcție de o serie de factori, cum ar fi:
- Tipul – cu vele, de marfă, de pescuit
- Unelte de pescuit – graur, paragate, plase-pungă
- Comportamente de pescuit – unde se află, când este activă
Împărtășirea rezultatelor – Aceste informații privind urmărirea navelor sunt disponibile public. Oricine poate vizita site-ul web pentru a urmări mișcările navelor de pescuit comercial în timp real, pentru a le urmări pe harta interactivă sau pentru a descărca datele. Oamenii pot chiar să creeze hărți termice pentru a verifica modelele de activitate de pescuit sau pentru a vizualiza urmele anumitor nave în zonele marine protejate.

Puteți afla mai multe despre acest proiect de învățare automată aici.

Uber Helpful Customer Support Using Deep Learning (Advanced)

Ca unul dintre cele mai bune exemple de perturbare tehnologică, Uber intenționează să rămână prin preajmă. Cu miliarde de curse de gestionat în fiecare an, aplicația de ride-sharing are nevoie de un sistem de asistență fantastic pentru a rezolva problemele clienților cât mai repede posibil.

(Sursa: Uber)

Uber și-a propus să îmbunătățească eficiența reprezentanților săi de asistență pentru clienți prin crearea unei arhitecturi model „human-in-the-loop”, care se numește Customer Obsession Ticket Assistant, sau COTA.

Prin testarea divizată a două versiuni de COTA, echipa Uber a folosit învățarea profundă pentru a descoperi impactul asupra timpului de gestionare a biletelor, a satisfacției clienților și a veniturilor. Este un model excelent pentru proiectele de învățare profundă care combină arhitectura tehnică inteligentă cu contribuția umană și sperăm că vă va oferi și alte idei de proiecte de învățare profundă.

Puteți afla mai multe despre acest proiect de învățare automată aici.

Barbie With Brains Using Deep Learning Algorithms (Advanced)

Păpușile moderne care pot „vorbi” joacă un rol important în modelarea minților tinere ale copiilor. Cu toate acestea, păpușile standard au, de obicei, un set limitat de fraze care nu au nicio corelație cu ceea ce spune copilul.

Dar ce s-ar întâmpla dacă păpușa ar putea înțelege întrebările? Ce s-ar întâmpla dacă păpușa ar putea da răspunsuri logice?

(Sursa: ToyTalk)

Hello Barbie este o demonstrație interesantă a puterii învățării automate și a inteligenței artificiale. Prin NLP și câteva analize audio avansate, Barbie poate interacționa într-o conversație logică. Microfonul de pe lănțișorul ei înregistrează tot ceea ce se spune și apoi îl transmite către serverele ToyTalk, unde este analizat.

Există peste 8.000 de linii de dialog disponibile, iar serverele vor transmite înapoi răspunsul cel mai potrivit în decurs de o secundă, astfel încât Barbie să poată răspunde. Considerați că este o altă arhitectură care se adaugă la tezaurul dumneavoastră de idei de proiecte de învățare profundă.

Puteți afla mai multe despre acest proiect de învățare automată aici.

Personalizarea operelor de artă Netflix folosind AI (avansat)

Netflix este acum forța dominantă în divertisment, iar compania înțelege că diferiți oameni au gusturi diferite. Uneori, oamenii sunt vinovați de a judeca emisiunile sau filmele după imagini și astfel s-ar putea să nu verifice niciodată anumite programe. Pentru a nu se lăsa învinsă, Netflix își propune să convingă mai mulți oameni să se uite la emisiunile lor.

(Sursa: Unsplash)

Când vizitați Netflix, uneori veți vedea ilustrații diferite pentru aceleași emisiuni. Aceasta este învățarea automată la lucru. Netflix folosește o rețea neuronală convoluțională care analizează imaginile vizuale. Compania explică faptul că se bazează, de asemenea, pe „bandiții contextuali”, care lucrează în mod continuu pentru a determina ce ilustrație obține o implicare mai bună.

În timp, pe măsură ce utilizați Netflix mai mult, acesta începe să înțeleagă nu numai ce programe vă plac, ci și ce tip de ilustrație! De exemplu, dacă ați vizionat mai multe filme în care joacă Uma Thurman, este probabil să vedeți opere de artă Pulp Fiction cu actrița în loc de co-stelele John Travolta sau Samuel L. Jackson.

Puteți afla mai multe despre acest proiect de învățare automată aici.

Relaționat: 6 proiecte complete de știință a datelor

Cum să vă generați propriile idei de proiecte de învățare automată

Dacă învățați deja să deveniți un inginer de învățare automată, s-ar putea să fiți gata să vă apucați de treabă. Dacă nu, iată câțiva pași pentru a pune lucrurile în mișcare.

Scoateți o idee care să vă entuziasmeze

Pentru a da startul, trebuie să faceți un brainstorming de idei de proiecte de învățare automată. Gândiți-vă la interesele dvs. și căutați să creați concepte de nivel înalt în jurul acestora. Alegeți cea mai viabilă idee și apoi solidificați-o cu o propunere scrisă, care acționează ca un plan de verificare pe tot parcursul proiectului.

Relaționat: 5 industrii netradiționale care profită de inteligența artificială

Evitați să ieșiți din domeniul de aplicare

Dacă este primul dvs. proiect, ar trebui să luptați împotriva impulsului de a depăși domeniul de aplicare al proiectului. Concentrați-vă pe proiecte simple de învățare automată. Concentrându-vă pe o problemă mică și cercetând un set de date mare și relevant, este mai probabil ca proiectul dvs. să genereze un randament pozitiv al investiției.

Testați-vă ipoteza

În special atunci când vorbim despre proiecte simple de învățare automată pentru începători, principalul lucru la care trebuie să vă gândiți este să generați informații din proiectul dumneavoastră. Nu vă îngrijorați încă să acționați pe baza acestor insight-uri. Modelează-ți ipoteza și testeaz-o. Python este cel mai ușor limbaj pentru începători și vă sfătuim să îl folosiți pentru a vă efectua testele.

Implementați rezultatele

După ce ați obținut toate rezultatele dorite, puteți căuta să vă implementați proiectul. Există câțiva pași în această etapă:

Creați o API (interfață de programare a aplicațiilor) – Acest lucru vă permite să integrați cunoștințele dvs. de învățare automată în produs.
Înregistrați rezultatele într-o singură bază de date – Prin faptul că adunați totul la un loc, vă este mai ușor să construiți pe baza rezultatelor.
Încorporați codul – Atunci când aveți puțin timp, încorporarea codului este mai rapidă decât o API.

Revizuiți și învățați

Când ați terminat proiectul, evaluați rezultatele. Gândiți-vă la ce s-a întâmplat și de ce. Ce ați fi putut face diferit? În timp, pe măsură ce câștigați experiență, veți putea învăța din propriile greșeli.

Consiliere pentru proiecte de învățare automată pentru începători

Chiar și proiectele simple de învățare automată trebuie să fie construite pe o bază solidă de cunoștințe pentru a avea șanse reale de succes. Mai mult decât atât, terenul de joc competitiv face ca nou-veniților să le fie greu să iasă în evidență.

Relaționat: How to Land a Machine Learning Internship

Iată câteva sfaturi pentru ca proiectul dvs. de învățare automată să strălucească.

Familiarizați-vă cu aplicațiile comune ale învățării automate

În general, există trei tipuri de bază de învățare automată:

Învățarea supravegheată analizează datele istorice pentru a prezice noi rezultate. De exemplu, prezicerea prețurilor proprietăților.
Învățarea nesupravegheată caută modele de date prin utilizarea analizei statistice. De exemplu, identificarea segmentelor de clienți în cadrul datelor de vânzări ale companiei dumneavoastră.
Învățarea prin întărire funcționează cu un model dinamic care utilizează încercarea și eroarea pentru a îmbunătăți constant performanța. De exemplu, tranzacționarea acțiunilor.

Când veți dezvolta o mai bună înțelegere a acestor aplicații, veți ști cum să aplicați învățarea automată la problema dumneavoastră.

Nu subestimați preprocesarea și curățarea datelor

Datele zgomotoase vă pot distorsiona rezultatele. Prin urmare, ar trebui să căutați să utilizați preprocesarea și curățarea datelor în mod regulat. Mai simplu spus, este vorba de a lua datele dvs. și de a le face mai ușor de înțeles. Prin ordonarea lucrurilor și introducerea datelor lipsă, vă asigurați că modelele dvs. sunt cât mai precise posibil. Dacă proiectele dvs. de învățare automată au probleme de calitate a datelor, articolul legat anterior ar trebui să vă ajute cu elementele de bază ale curățării datelor cu idei de proiecte de învățare automată.

Machine Learning Is a Team Game

Chiar și Neo avea nevoie de prieteni. Atunci când dezvoltați proiecte de învățare automată, va trebui să lucrați cu alte persoane, dintre care multe nu vor avea aceeași înțelegere a inteligenței artificiale și a software-ului ca și dumneavoastră.

Trebuie să aveți încredere în alte persoane și, de asemenea, să fiți sincer cu privire la modelul dumneavoastră. În cele din urmă, atunci când lucrați la proiecte de învățare automată, urmăriți transparența și comunicarea deschisă, astfel încât proiectul dvs. să se desfășoare fără probleme.

Concentrați-vă pe rezolvarea problemelor din lumea reală

Este foarte bine să folosiți învățarea automată pentru aplicații distractive, dar dacă aveți în vedere să obțineți un loc de muncă ca inginer de învățare automată, ar trebui să vă concentrați pe ameliorarea unui punct de durere resimțit de o mulțime de oameni. Gândiți-vă la modul în care proiectul dvs. va oferi valoare clienților. Prin cercetarea problemelor din lumea reală, puteți face ca proiectul dvs. să iasă în evidență ca fiind unul pe care lumea îl dorește și de care are nevoie. Nu veniți cu proiecte de învățare profundă doar pentru a vă etala abilitățile – creați un impact semnificativ cu orice tehnologie pe care o puteți. Ceea ce contează cu adevărat este impactul și nu tehnologia.

Play to Your Strengths

Dacă sunteți nou în domeniul învățării automate și nu aveți multă experiență, poate fi puțin descurajant să vă confruntați cu programatori și ingineri software veterani. În acest caz, slăbiciunea dvs. percepută poate fi un punct forte. Vă puteți baza pe trecutul dvs. și pe cunoștințele anterioare despre diferite industrii pentru a crea proiecte unice de învățare automată la care mulți alți oameni nici măcar nu se pot gândi. Puteți genera idei de proiecte de învățare automatizată din propria perspectivă, analizând, de asemenea, seturi de date deschise.

Machine Learning Can Make the World More Human

Industria învățării automate va continua să crească în anii următori. În timp ce unii oameni văd așa-numita „ascensiune a roboților” ca fiind sfârșitul atingerii personale în afaceri, realitatea este chiar opusă. Există atât de multe idei grozave de proiecte de învățare automată care ajută, de fapt, companiile să ofere un serviciu mai bun, umanizând efectiv mărcile, făcându-le să fie mai în ton cu interesele publicului țintă.

Nu este ușor să dezvoltați primele idei de proiecte de învățare automată. Învățând de la alții, puteți crea ceva grozav. Proiectele de învățare automată pot avea efecte dramatice în domenii atât de diverse și atât de importante precum sănătatea umană și economia: proiectele de învățare automată pot contribui la avansarea înțelegerii noastre despre noi înșine și despre lumea noastră.

Springboard’s Machine Learning Engineering Career Track, primul de acest gen care vine cu un loc de muncă garantat, se concentrează pe învățarea bazată pe proiecte. Aflați mai multe.