Top 6 Machine Learning Projects To Inspire Your Portfolio

, Author

A mesterséges intelligencia (AI) növekedése egyre több szoftvermérnököt, adattudóst és más szakembert inspirált arra, hogy felfedezzék a gépi tanulásban való karrier lehetőségét. Néhány újonc azonban hajlamos túl sokat foglalkozni az elmélettel, és nem eleget a gyakorlati alkalmazással. Ha sikeres akar lenni, inkább előbb, mint utóbb el kell kezdenie gépi tanulási projekteket építeni. gépi tanulási projektötletekre lesz szüksége, hogy javítsa a portfólióját.

Nehéz lehet tudni, hol kezdjünk hozzá, ezért mindig jó ötlet útmutatást és inspirációt kérni másoktól. Ebben a bejegyzésben valós példákat osztunk meg gépi tanulási projektekre, amelyek segítenek megérteni, hogyan kell kinéznie egy kész projektnek. Emellett megvalósítható tippeket is adunk ahhoz, hogy saját, figyelemfelkeltő gépi tanulási projekteket hozzon létre.

Ha átfogóbb betekintést szeretne nyerni a gépi tanulási karrierlehetőségekbe, nézze meg az adattudós és az adatmérnöki pályára lépésről szóló útmutatónkat.

Twitterek azonosítása a Twitteren természetes nyelvi feldolgozással (Kezdő)

A közösségi médiában megjelenő gyűlöletbeszéd és az álhírek a digitális korban világméretű jelenséggé váltak. Míg a sértő bejegyzések problémát jelentenek, még rosszabb, ha pontatlanok vagy hamis profilokon keresztül tévesen tulajdonítanak embereknek.

(Forrás: Towards Data Science)

A gépi tanulással kapcsolatos projektek segíthetnek. A természetes nyelvfeldolgozás (NLP) egyik népszerű alkalmazása a hangulatelemzés. Ez lehetővé teszi, hogy több ezer szöveges dokumentumot pillanatok alatt átvizsgáljanak bizonyos szűrők alapján. A Twitter például képes feldolgozni a bejegyzések rasszista vagy szexista megjegyzéseit, és elkülöníteni ezeket a tweeteket a többitől.

Eugene Aiken arra vállalkozott, hogy két ember posztjait elemezve meghatározza annak valószínűségét, hogy egy adott tweet egy adott felhasználótól származik. Ehhez két ismert politikai rivális tweetjeit használta fel: Donald Trump és Hillary Clinton.

Ez több szakaszból állt:

  • Elkaparta a tweetjeiket
  • Futtatta őket egy természetes nyelvi processzoron
  • Klasszifikálta őket egy gépi tanulási algoritmussal
  • A predict-proba módszert használta a valószínűség meghatározásához

Az eredmények alapján Eugene azonosítani tudta, hogy mely tweetek származnak a legnagyobb és a legkisebb valószínűséggel Donald Trumptól. Ugyanez az eljárás bárkitől származó tweetek elemzésére is használható, beleértve a barátaitól vagy családtagjaitól származó tweetek elemzését.

Ezzel a gépi tanulási projekttel kapcsolatban itt tudhat meg többet, az adatkészletet pedig itt töltheti le.

A csalók megtalálása a kiegyensúlyozatlan adatok kezelése közben (Intermediate)

Amint a világ a készpénzmentes, felhőalapú valóság felé halad, a bankszektort minden eddiginél nagyobb veszély fenyegeti. A hitelkártyacsalások globális költségei 2020-ra várhatóan 32 milliárd dollár fölé emelkednek.

Bár jelentős problémáról van szó, a csalás a naponta lebonyolított tranzakcióknak csak egy parányi töredékét teszi ki. Ebből adódik egy másik probléma: az adatok kiegyensúlyozatlansága.

A gépi tanulásban a csalást osztályozási problémának tekintik, és ha kiegyensúlyozatlan adatokkal van dolgunk, az azt jelenti, hogy a megjósolandó probléma kisebbségben van. Ennek eredményeképpen a prediktív modell gyakran nehezen tud valódi üzleti értéket előállítani az adatokból, és néha tévedhet.”

(Forrás: Towards Data Science)

Rafael Pierre elmondja, hogy a Towards Data Science csapata hogyan végzett egy projektet ennek a problémának a kezelésére. Egy erősen kiegyensúlyozatlan adathalmazzal dolgozva, amely 284 807 tranzakcióból 492 csalást tartalmazott, három különböző stratégiát alkalmaztak:

  1. Oversampling
  2. Undersampling
  3. Kombinált megközelítés

Míg mindegyik technikának megvannak a maga erényei, a kombinált megközelítés eltalálta a pontosság és a visszahívás közötti édes pontot, hatékonyan magas szintű pontosságot kínálva kiegyensúlyozatlan adathalmazok kezelése esetén.

Ezzel a gépi tanulási projekttel kapcsolatban itt tudhat meg többet.

Geotérképezés és felhőalapú számítástechnika segítségével a csalók horogra kerítése (haladó)

A sérülékeny tengeri élővilágot világszerte óriási veszély fenyegeti az illegális orvvadászok miatt. Sokáig gyakorlatilag lehetetlen volt nyomon követni minden egyes tengeren közlekedő hajó tevékenységét. Napjainkban a mesterséges intelligencia, a geotérképezés és a felhőalapú számítástechnika fejlődése együttesen egy zseniális gépi tanulási projektötletet valósít meg: Global Fishing Watch.

(Forrás: Unsplash)

Szóval, pontosan hogyan segít a gépi tanulás a Global Fishing Watch-nak azonosítani az óceánjainkban folyó illegális halászati tevékenységet? Ez a folyamatban lévő projekt három fő szakaszt foglal magában:

  1. Adatgyűjtés – A legtöbb nagy hajó GPS-szerű eszközt, úgynevezett automatikus azonosító rendszert (AIS) használ, amely közvetíti a helyzetét. Bár sok halászhajó nem rendelkezik AIS-sel, azok, amelyek rendelkeznek, a nyílt tengeren folytatott globális halászat mintegy 80 százalékát teszik ki. Az AIS-berendezések műholdakkal történő nyomon követésével lehetővé válik a hajók mozgásának nyomon követése, még a távoli területeken is.
  2. Feldolgozás – A Global Fishing Watch neurális hálózatokat használ az információk feldolgozására és a nagy adathalmazokban lévő minták megtalálására. Ez mintegy 60 millió adatpontot tartalmaz több mint 300 000 hajóról – naponta! A halászati szakértők segítségével az algoritmus megtanulta, hogyan osztályozza ezeket a hajókat számos tényező alapján, mint például:
    • Típus – vitorlás, teherhajó, halászhajó
    • Halászeszközök – vonóháló, horogsor, erszényes kerítőháló
    • Halászati viselkedés – hol van, mikor aktív
  3. Az eredmények megosztása – A hajók nyomon követésére vonatkozó ezen információk nyilvánosan elérhetők. A weboldalon bárki meglátogathatja a kereskedelmi halászhajók mozgását valós időben, követheti őket az interaktív térképen, vagy letöltheti az adatokat. Az emberek még hőtérképeket is létrehozhatnak a halászati tevékenység mintáinak ellenőrzésére, vagy megtekinthetik bizonyos hajók nyomvonalát a tengeri védett területeken.

Erről a gépi tanulási projektről itt tudhat meg többet.

Uber Helpful Customer Support Using Deep Learning (Advanced)

A technológiai felbomlás egyik legjobb példájaként az Uber a jövőben is itt akar maradni. Mivel évente több milliárd fuvart kell lebonyolítania, a fuvarmegosztó alkalmazásnak fantasztikus támogató rendszerre van szüksége az ügyfelek problémáinak minél gyorsabb megoldásához.

(Forrás: Uber)

Az Uber egy “ember a hurokban” modellarchitektúra létrehozásával kívánta javítani ügyfélszolgálati munkatársai hatékonyságát, amelyet Customer Obsession Ticket Assistantnak, azaz COTA-nak neveznek.

A COTA két verziójának osztott tesztelésével az Uber csapata mélytanulással tárta fel a jegykezelési időre, az ügyfélelégedettségre és a bevételre gyakorolt hatást. Ez egy nagyszerű modell az olyan mélytanulási projektekhez, amelyek az okos technikai architektúrát emberi ráfordítással kombinálják, és remélhetőleg más mélytanulási projektötletekkel is szolgál.

Erről a gépi tanulási projektről itt tudhat meg többet.

Barbie With Brains Using Deep Learning Algorithms (Advanced)

A “beszélni” képes modern babák fontos szerepet játszanak a gyerekek fiatal elméjének formálásában. A hagyományos babák azonban jellemzően korlátozott számú mondattal rendelkeznek, amelyek nincsenek összefüggésben azzal, amit a gyermek mond.

De mi lenne, ha a baba értené a kérdéseket? Mi lenne, ha a baba logikus válaszokat tudna adni?

(Forrás: ToyTalk)

A Hello Barbie a gépi tanulás és a mesterséges intelligencia erejének izgalmas demonstrációja. Az NLP és némi fejlett hangelemzés segítségével Barbie képes logikus beszélgetésbe lépni. A nyakláncán lévő mikrofon rögzíti, amit mond, majd továbbítja azt a ToyTalk szerverekre, ahol elemzik.

Több mint 8000 párbeszédsor áll rendelkezésre, és a szerverek egy másodpercen belül visszaküldik a legmegfelelőbb választ, hogy Barbie reagálni tudjon. Tekintse ezt egy újabb architektúrának, amely a mélytanulási projektötletek tárházát gyarapítja.

Ezzel a gépi tanulási projekttel kapcsolatban itt tudhat meg többet.

Netflix Artwork Personalization Using AI (Advanced)

ANetflix jelenleg a szórakoztatóipar meghatározó ereje, és a vállalat megérti, hogy a különböző emberek ízlése eltérő. Néha az emberek bűnösek abban, hogy a műsorokat vagy filmeket a képek alapján ítélik meg, ezért előfordulhat, hogy soha nem néznek meg bizonyos programokat. A Netflix nem hagyja magát legyőzni, és célja, hogy minél több embert meggyőzzön arról, hogy nézze meg a műsorait.

(Forrás: Unsplash)

Amikor a Netflixet látogatod, néha ugyanazokhoz a műsorokhoz különböző grafikákat látsz. Ez a gépi tanulás munkája. A Netflix egy konvolúciós neurális hálózatot használ, amely a vizuális képeket elemzi. A vállalat elmagyarázza, hogy “kontextuális banditákra” is támaszkodnak, amelyek folyamatosan azon dolgoznak, hogy meghatározzák, melyik műalkotás kap jobb elkötelezettséget.

Az idő múlásával, ahogy többet használod a Netflixet, a rendszer nemcsak azt kezdi megérteni, hogy milyen programokat szeretsz, hanem azt is, hogy milyen típusú műalkotásokat! Ha például több olyan filmet is megnézett, amelyben Uma Thurman szerepel, akkor valószínűleg a színésznőt ábrázoló Pulp Fiction művészeti alkotásokat fogja látni a társszereplők, John Travolta vagy Samuel L. Jackson helyett.

A gépi tanulási projektről itt tudhat meg többet.

Kapcsolódó:

Hogyan generáld a saját gépi tanulási projektötleteidet

Ha már tanulsz, hogy gépi tanulási mérnök legyél, talán készen állsz arra, hogy belevágj. Ha még nem, íme néhány lépés, hogy elindítsd a dolgokat.

Válassz ki egy ötletet, ami izgat

Az induláshoz szükséged van néhány gépi tanulási projektötletre. Gondolkodjon el az érdeklődési körén, és keressen magas szintű koncepciókat ezek köré. Válassza ki a legéletképesebb ötletet, majd szilárdítsa meg egy írásos javaslattal, amely tervrajzként szolgál a projekt során történő ellenőrzéshez.

Related:

Kerülje el, hogy túllépje a projekt hatókörét

Ha ez az első projektje, le kell küzdenie a késztetést, hogy túllépje a projekt hatókörét. Koncentráljon egyszerű gépi tanulási projektekre. Ha egy kis problémára és egy nagy, releváns adathalmaz kutatására összpontosítasz, a projekted nagyobb valószínűséggel hozhat pozitív megtérülést.

Tesztelje a hipotézisét

Egyszerű, kezdőknek szóló gépi tanulási projektekről beszélve a legfontosabb dolog, amire gondolnia kell, hogy a projektből meglátásokat generáljon. Ne aggódj még azon, hogy ezeknek a felismeréseknek az alapján cselekedj. Modellezd le a hipotézisedet, és teszteld azt. A Python a legegyszerűbb nyelv kezdők számára, és azt tanácsoljuk, hogy ezt használja a teszteléshez.

Eredmények megvalósítása

Ha már minden kívánt eredményt elértél, akkor nézhetsz a projekted megvalósítása felé. Ennek a szakasznak néhány lépése van:

  • API (alkalmazásprogramozási interfész) létrehozása – Ez lehetővé teszi, hogy a gépi tanulási meglátásait integrálja a termékbe.
  • Az eredmények rögzítése egyetlen adatbázisban – Azzal, hogy mindent összevezet, megkönnyíti az eredményekre való építkezést.
  • A kód beágyazása – Ha kevés az ideje, a kód beágyazása gyorsabb, mint egy API.

Továbbfejlesztés és tanulás

Amikor befejezte a projektet, értékelje az eredményeket. Gondolja át, mi történt, és miért. Mit tehettél volna másképp? Idővel, ahogy tapasztalatot szerez, képes lesz tanulni a saját hibáiból.

Tippek gépi tanulási projektekhez kezdőknek

Még az egyszerű gépi tanulási projekteket is szilárd tudásalapra kell építeni ahhoz, hogy valódi esélye legyen a sikerre. Ráadásul a versenyhelyzet megnehezíti a kezdők számára a kitűnést.

Related:

Íme néhány tipp, hogy a gépi tanulási projektje ragyogjon.

Ismerkedjen meg a gépi tanulás általános alkalmazásaival

Tágabb értelemben a gépi tanulásnak három alapvető típusa van:

  • A felügyelt tanulás a múltbeli adatokat elemzi, hogy új eredményeket jósoljon meg. Például az ingatlanárak előrejelzése.
  • A felügyelet nélküli tanulás statisztikai elemzéssel keres adatmintákat. Például ügyfélszegmensek azonosítása a vállalati értékesítési adatokon belül.
  • A megerősített tanulás dinamikus modellel működik, amely próbálgatással és hibával folyamatosan javítja a teljesítményt. Például a tőzsdei kereskedés.

Amikor jobban megérti ezeket az alkalmazásokat, tudni fogja, hogyan alkalmazza a gépi tanulást a problémájára.

Ne becsülje alá az adatok előfeldolgozását és tisztítását

A zajos adatok torzíthatják az eredményeit. Ezért törekedjen az adatok előfeldolgozásának és adattisztításának rendszeres alkalmazására. Egyszerűen fogalmazva, ez arról szól, hogy fogjuk az adatait, és könnyebben érthetővé tesszük őket. A dolgok rendbetételével és a hiányzó adatok bevitelével biztosítja, hogy modelljei a lehető legpontosabbak legyenek. Ha a gépi tanulással kapcsolatos projektjeiben adatminőségi problémák merülnek fel, az előzőleg linkelt cikknek segítséget kell nyújtania a gépi tanulási projektötletekkel kapcsolatos adattisztítás alapjaival kapcsolatban.

A gépi tanulás csapatjáték

Még Neónak is szüksége volt barátokra. Amikor gépi tanulási projekteket fejlesztesz, más emberekkel kell együtt dolgoznod, akik közül sokan nem ugyanúgy értenek a mesterséges intelligenciához és a szoftverekhez, mint te.

Meg kell bíznod másokban, és őszintének kell lenned a modelleddel kapcsolatban is. Végső soron, amikor gépi tanulási projekteken dolgozol, törekedj az átláthatóságra és a nyílt kommunikációra, hogy a projekt zökkenőmentesen működhessen.

Fókuszálj a valós problémák megoldására

A gépi tanulást szórakoztató alkalmazásokhoz használni szép és jó, de ha gépi tanulási mérnökként szeretnél elhelyezkedni, akkor egy sok ember által érzett fájdalmas pont enyhítésére kell koncentrálnod. Gondold végig, hogy a projekted hogyan fog értéket nyújtani az ügyfeleknek. Ha valós problémákat kutatsz, akkor a projektedet úgy emelheted ki, mint olyat, amit a világ akar és amire szüksége van. Ne csak azért találj ki mélytanulási projekteket, hogy megmutasd a képességeidet – teremts értelmes hatást bármilyen technológiával, amit csak tudsz. A hatás és nem a technológia az, ami igazán számít.

Játszd ki az erősségeidet

Ha új vagy a gépi tanulásban, és nincs sok tapasztalatod, kicsit ijesztő lehet a veterán programozókkal és szoftvermérnökökkel szemben. Ebben az esetben a vélt gyengeséged erősséged lehet. A hátteredre és a különböző iparágakkal kapcsolatos korábbi ismereteidre támaszkodva olyan egyedi gépi tanulási projekteket hozhatsz létre, amelyekre sokan mások talán nem is gondolnak. A nyílt adathalmazok megtekintésével saját szemszögből is generálhat gépi tanulási projektötleteket.

A gépi tanulás emberibbé teheti a világot

A gépi tanulási iparág még évekig növekedni fog. Bár egyesek úgy látják, hogy az úgynevezett “robotok felemelkedése” a személyes érintkezés végét jelenti az üzleti életben, a valóság ennek éppen az ellenkezője. Nagyon sok nagyszerű gépi tanulási projektötlet létezik, amelyek valójában segítenek a vállalatoknak jobb szolgáltatást nyújtani, és hatékonyan humanizálják a márkákat azáltal, hogy jobban összehangolják őket a célközönségük érdekeivel.

Nem könnyű kidolgozni az első gépi tanulási projektötleteket. A másoktól való tanulással valami nagyszerűt hozhat létre. A gépi tanulással kapcsolatos projektek drámai hatással lehetnek az olyan különböző és fontos területekre, mint az emberi egészség és a gazdaság: a gépi tanulással kapcsolatos projektek segíthetnek abban, hogy jobban megértsük önmagunkat és a világunkat.

A Springboard gépi tanulási mérnöki karrierpályája, amely az első a maga nemében, amely állásgaranciával jár, a projektalapú tanulásra összpontosít. Tudjon meg többet.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.