Top 6 Machine Learning Projects To Inspire Your Portfolio

Das Wachstum der künstlichen Intelligenz (KI) hat immer mehr Software-Ingenieure, Datenwissenschaftler und andere Fachleute dazu inspiriert, die Möglichkeit einer Karriere im Bereich des maschinellen Lernens zu erkunden. Manche Neulinge konzentrieren sich jedoch zu sehr auf die Theorie und zu wenig auf die praktische Anwendung. Wenn Sie erfolgreich sein wollen, müssen Sie eher früher als später mit der Erstellung von Projekten zum maschinellen Lernen beginnen. Sie brauchen Ideen für Projekte zum maschinellen Lernen, um Ihr Portfolio zu verbessern.

Es kann schwierig sein, zu wissen, wo man anfangen soll, daher ist es immer eine gute Idee, sich von anderen beraten und inspirieren zu lassen. In diesem Beitrag stellen wir Ihnen Beispiele aus der Praxis von Projekten zum maschinellen Lernen vor, die Ihnen zeigen, wie ein abgeschlossenes Projekt aussehen sollte. Außerdem geben wir Ihnen praktische Tipps, wie Sie Ihre eigenen aufmerksamkeitsstarken Projekte zum maschinellen Lernen erstellen können.

Wenn Sie einen umfassenderen Einblick in die Karrieremöglichkeiten im Bereich des maschinellen Lernens suchen, lesen Sie unsere Leitfäden „Wie wird man Data Scientist“ und „Wie wird man Data Engineer“.

Twits auf Twitter mit natürlicher Sprachverarbeitung identifizieren (Anfänger)

Hassreden in sozialen Medien und Fake News sind im digitalen Zeitalter zu einem weltweiten Phänomen geworden. Beleidigende Beiträge sind zwar ein Problem, aber noch schlimmer ist es, wenn sie ungenau sind oder Personen durch falsche Profile fälschlicherweise zugeschrieben werden.

(Quelle: Towards Data Science)

Projekte zum maschinellen Lernen können helfen. Eine beliebte Anwendung der natürlichen Sprachverarbeitung (NLP) ist die Stimmungsanalyse. Damit lassen sich Tausende von Textdokumenten innerhalb von Sekunden auf bestimmte Filter hin durchsuchen. So kann Twitter beispielsweise Beiträge auf rassistische oder sexistische Äußerungen hin untersuchen und diese Tweets von anderen trennen.

Eugene Aiken unternahm ein Projekt, um die Beiträge zweier Personen zu analysieren und die Wahrscheinlichkeit zu bestimmen, dass ein bestimmter Tweet von einem bestimmten Nutzer stammt. Dazu verwendete er die Tweets von zwei bekannten politischen Rivalen: Donald Trump und Hillary Clinton.

Dies umfasste mehrere Stufen:

Scrapen ihrer Tweets
Sie durch einen Prozessor für natürliche Sprache laufen lassen
Sie mit einem Algorithmus für maschinelles Lernen klassifizieren
Die Predict-Proba-Methode verwenden, um die Wahrscheinlichkeit zu bestimmen

Mit den Ergebnissen konnte Eugene feststellen, welche Tweets am wahrscheinlichsten und welche am unwahrscheinlichsten von Donald Trump stammten. Mit dem gleichen Verfahren können auch Tweets von anderen Personen analysiert werden, z. B. von Freunden oder Familienmitgliedern.

Weitere Informationen zu diesem Projekt des maschinellen Lernens finden Sie hier, und den Datensatz können Sie hier herunterladen.

Betrugsfälle aufspüren und gleichzeitig mit unausgewogenen Daten umgehen (Zwischenbericht)

Während sich die Welt auf eine bargeldlose, cloudbasierte Realität zubewegt, ist der Bankensektor stärker denn je bedroht. Es wird erwartet, dass die weltweiten Kosten für Kreditkartenbetrug bis 2020 auf über 32 Milliarden Dollar ansteigen werden.

Betrug ist zwar ein großes Problem, macht aber nur einen winzigen Bruchteil der gesamten täglichen Transaktionen aus. Daraus ergibt sich ein weiteres Problem: unausgewogene Daten.

Beim maschinellen Lernen wird Betrug als Klassifizierungsproblem betrachtet, und wenn man es mit unausgewogenen Daten zu tun hat, bedeutet das, dass das Problem, das vorhergesagt werden soll, in der Minderheit ist. Infolgedessen hat das Vorhersagemodell oft Schwierigkeiten, aus den Daten einen echten geschäftlichen Nutzen zu ziehen, und manchmal liegt es sogar falsch.

(Quelle: Towards Data Science)

Rafael Pierre erklärt, wie das Team von Towards Data Science ein Projekt durchgeführt hat, um dieses Problem zu lösen. Bei der Arbeit mit einem stark unausgewogenen Datensatz, der 492 Betrugsfälle aus 284.807 Transaktionen enthielt, setzten sie drei verschiedene Strategien ein:

Oversampling
Undersampling
Ein kombinierter Ansatz

Während jede Technik ihre Vorzüge hat, hat der kombinierte Ansatz einen goldenen Mittelweg zwischen Präzision und Recall gefunden, der bei unausgewogenen Datensätzen ein hohes Maß an Präzision gewährleistet.

Mehr über dieses Projekt zum maschinellen Lernen erfahren Sie hier.

Mit Geo-Mapping und Cloud Computing (Fortgeschrittene)

Die gefährdete Meeresfauna und -flora ist durch illegale Wilderer auf der ganzen Welt stark bedroht. Viele Jahre lang war es praktisch unmöglich, die Aktivitäten aller Boote auf See zu überwachen. Heutzutage haben Fortschritte in der künstlichen Intelligenz, der Geokartierung und dem Cloud-Computing eine brillante Projektidee für maschinelles Lernen hervorgebracht: Global Fishing Watch.

(Quelle: Unsplash)

Wie genau hilft das maschinelle Lernen Global Fishing Watch dabei, illegale Fischereiaktivitäten in unseren Ozeanen zu identifizieren? Dieses laufende Projekt umfasst drei Hauptphasen:

Datenerfassung – Die meisten großen Schiffe verwenden ein GPS-ähnliches Gerät, das so genannte automatische Identifikationssystem (AIS), das ihre Position übermittelt. Obwohl viele Fischerboote nicht mit AIS ausgestattet sind, machen diejenigen, die es haben, etwa 80 Prozent des weltweiten Fischfangs auf hoher See aus. Durch die Verfolgung von AIS-Geräten mit Satelliten ist es möglich, die Schiffsbewegungen auch in entlegenen Gebieten zu überwachen.
Verarbeitung – Global Fishing Watch verwendet neuronale Netze, um die Informationen zu verarbeiten und Muster in großen Datensätzen zu finden. Dies umfasst etwa 60 Millionen Datenpunkte von über 300.000 Schiffen – täglich! Mit Hilfe von Fischereiexperten hat der Algorithmus gelernt, diese Schiffe nach einer Reihe von Faktoren zu klassifizieren, wie z. B.:
- Typ – Segel, Fracht, Fischerei
- Fanggeräte – Schleppnetze, Langleinen, Ringwaden
- Fischereiverhalten – wo es sich befindet, wann es aktiv ist
Weitergabe der Ergebnisse – Diese Informationen zur Schiffsverfolgung sind öffentlich zugänglich. Jeder kann die Website besuchen, um die Bewegungen kommerzieller Fischerboote in Echtzeit zu verfolgen, sie auf der interaktiven Karte zu verfolgen oder die Daten herunterzuladen. Die Nutzer können sogar Heatmaps erstellen, um nach Mustern der Fischereitätigkeit zu suchen oder die Spuren bestimmter Schiffe in Meeresschutzgebieten zu verfolgen.

Mehr über dieses Projekt zum maschinellen Lernen erfahren Sie hier.

Uber: Hilfreiche Kundenbetreuung mit Deep Learning (Fortgeschrittene)

Als eines der Paradebeispiele für technologische Umwälzungen hat Uber die Absicht, sich zu behaupten. Mit Milliarden von Fahrten, die jedes Jahr abgewickelt werden müssen, braucht die Mitfahr-App ein fantastisches Support-System, um Kundenprobleme so schnell wie möglich zu lösen.

(Quelle: Uber)

Uber hat sich vorgenommen, die Effektivität seiner Kundenbetreuer zu verbessern, indem es eine „Human-in-the-Loop“-Modellarchitektur geschaffen hat, die Customer Obsession Ticket Assistant oder COTA genannt wird.

Durch Split-Tests mit zwei Versionen von COTA konnte das Uber-Team mithilfe von Deep Learning die Auswirkungen auf die Bearbeitungszeit von Tickets, die Kundenzufriedenheit und den Umsatz ermitteln. Es ist ein großartiges Modell für Deep-Learning-Projekte, die eine clevere technische Architektur mit menschlichem Input kombinieren, und wird Ihnen hoffentlich weitere Deep-Learning-Projektideen liefern.

Mehr über dieses Projekt zum maschinellen Lernen erfahren Sie hier.

Barbie mit Gehirn unter Verwendung von Deep-Learning-Algorithmen (Fortgeschrittene)

Moderne Puppen, die „sprechen“ können, spielen eine wichtige Rolle bei der Bildung der jungen Köpfe von Kindern. Standardpuppen verfügen jedoch in der Regel über eine begrenzte Anzahl von Sätzen, die keinen Bezug zu dem haben, was das Kind sagt.

Aber was wäre, wenn die Puppe Fragen verstehen könnte? Was wäre, wenn die Puppe logische Antworten geben könnte?

(Quelle: ToyTalk)

Hallo Barbie ist eine aufregende Demonstration der Leistungsfähigkeit von maschinellem Lernen und künstlicher Intelligenz. Durch NLP und fortschrittliche Audioanalyse kann Barbie in logischen Gesprächen interagieren. Das Mikrofon an ihrer Halskette zeichnet alles auf, was gesagt wird, und überträgt es dann an die ToyTalk-Server, wo es analysiert wird.

Es stehen über 8.000 Dialogzeilen zur Verfügung, und die Server senden innerhalb einer Sekunde die am besten geeignete Antwort zurück, damit Barbie antworten kann. Betrachten Sie dies als eine weitere Architektur, die Ihren Fundus an Ideen für Deep-Learning-Projekte bereichert.

Mehr über dieses Projekt zum maschinellen Lernen erfahren Sie hier.

Netflix Artwork Personalization Using AI (Advanced)

Netflix ist heute die dominierende Kraft in der Unterhaltungsbranche, und das Unternehmen weiß, dass unterschiedliche Menschen unterschiedliche Geschmäcker haben. Manchmal sind Menschen schuldig, Shows oder Filme nach ihren Bildern zu beurteilen, und deshalb sehen sie sich bestimmte Programme vielleicht nie an. Netflix will sich nicht unterkriegen lassen und versucht, mehr Menschen dazu zu bringen, sich seine Sendungen anzusehen.

(Quelle: Unsplash)

Wenn man Netflix besucht, sieht man manchmal verschiedene Bilder für dieselben Sendungen. Das ist maschinelles Lernen bei der Arbeit. Netflix verwendet ein neuronales Faltungsnetzwerk, das die visuellen Bilder analysiert. Das Unternehmen erklärt, dass es sich auch auf „kontextuelle Banditen“ stützt, die ständig daran arbeiten, herauszufinden, welche Bilder besser ankommen.

Mit der Zeit, wenn Sie Netflix häufiger nutzen, beginnt es nicht nur zu verstehen, welche Programme Sie mögen, sondern auch, welche Art von Bildern! Wenn Sie zum Beispiel mehrere Filme mit Uma Thurman gesehen haben, werden Sie wahrscheinlich eher Pulp Fiction-Kunstwerke mit der Schauspielerin sehen als solche mit John Travolta oder Samuel L. Jackson.

Sie können hier mehr über dieses maschinelle Lernprojekt erfahren.

Verwandt: 6 komplette Data-Science-Projekte

Wie Sie Ihre eigenen Ideen für Machine-Learning-Projekte generieren

Wenn Sie bereits lernen, ein Machine-Learning-Ingenieur zu werden, sind Sie vielleicht schon bereit, loszulegen. Wenn nicht, finden Sie hier einige Schritte, um die Dinge in Gang zu bringen.

Wählen Sie eine Idee, die Sie begeistert

Um die Dinge in Gang zu bringen, müssen Sie einige Ideen für Projekte zum maschinellen Lernen sammeln. Denken Sie über Ihre Interessen nach und versuchen Sie, daraus Konzepte zu entwickeln. Wählen Sie die umsetzbarste Idee aus und verfestigen Sie sie mit einem schriftlichen Vorschlag, der als Blaupause für die Überprüfung während des Projekts dient.

Verwandt: 5 Untraditional Industries That Are Leveraging AI

Avoid Going Out of Scope

Wenn es sich um Ihr erstes Projekt handelt, sollten Sie den Drang bekämpfen, über den Umfang des Projekts hinauszugehen. Konzentrieren Sie sich auf einfache Projekte zum maschinellen Lernen. Wenn Sie sich auf ein kleines Problem konzentrieren und einen großen, relevanten Datensatz untersuchen, ist es wahrscheinlicher, dass Ihr Projekt eine positive Rendite abwirft.

Testen Sie Ihre Hypothese

Speziell bei einfachen Projekten zum maschinellen Lernen für Anfänger sollten Sie vor allem daran denken, Erkenntnisse aus Ihrem Projekt zu gewinnen. Machen Sie sich noch keine Gedanken darüber, wie Sie auf diese Erkenntnisse reagieren. Modellieren Sie Ihre Hypothese, und testen Sie sie. Python ist die einfachste Sprache für Anfänger, und wir empfehlen Ihnen, sie für Ihre Tests zu verwenden.

Umsetzung der Ergebnisse

Wenn Sie alle gewünschten Ergebnisse erreicht haben, können Sie sich an die Umsetzung Ihres Projekts machen. In dieser Phase gibt es einige Schritte:

Erstellen Sie eine API (Anwendungsprogrammierschnittstelle) – Damit können Sie Ihre Erkenntnisse aus dem maschinellen Lernen in das Produkt integrieren.
Erfassen Sie die Ergebnisse in einer einzigen Datenbank – Wenn Sie alles zusammenfassen, können Sie leichter auf den Ergebnissen aufbauen.
Den Code einbetten – Wenn Sie wenig Zeit haben, ist das Einbetten des Codes schneller als eine API.

Revise und Lernen

Wenn Sie das Projekt abgeschlossen haben, werten Sie die Ergebnisse aus. Denken Sie darüber nach, was passiert ist und warum. Was hätten Sie anders machen können? Im Laufe der Zeit werden Sie mit zunehmender Erfahrung in der Lage sein, aus Ihren eigenen Fehlern zu lernen.

Tipps für Projekte zum maschinellen Lernen für Anfänger

Selbst einfache Projekte zum maschinellen Lernen müssen auf einem soliden Wissensfundament aufgebaut werden, um eine echte Chance auf Erfolg zu haben. Außerdem ist es für Neulinge aufgrund der starken Konkurrenz schwierig, sich von der Masse abzuheben.

Verwandt: How to Land a Machine Learning Internship

Hier sind ein paar Tipps, damit Ihr Machine Learning-Projekt glänzt.

Get familiar with the Common Applications of Machine Learning

Grundlegend gibt es drei Arten des maschinellen Lernens:

Supervised Learning analysiert historische Daten, um neue Ergebnisse vorherzusagen. Zum Beispiel bei der Vorhersage von Immobilienpreisen.
Unüberwachtes Lernen sucht mit Hilfe statistischer Analysen nach Datenmustern. Beispiel: Identifizierung von Kundensegmenten in den Verkaufsdaten Ihres Unternehmens.
Verstärkungslernen arbeitet mit einem dynamischen Modell, das Versuch und Irrtum nutzt, um die Leistung ständig zu verbessern. Zum Beispiel beim Aktienhandel.

Wenn Sie ein besseres Verständnis dieser Anwendungen entwickeln, wissen Sie, wie Sie maschinelles Lernen auf Ihr Problem anwenden können.

Unterschätzen Sie nicht die Datenvorverarbeitung und -bereinigung

Verrauschte Daten können Ihre Ergebnisse verfälschen. Daher sollten Sie darauf achten, dass Sie die Datenvorverarbeitung und Datenbereinigung regelmäßig anwenden. Einfach ausgedrückt, geht es darum, Ihre Daten so aufzubereiten, dass sie leichter zu verstehen sind. Indem Sie Dinge bereinigen und fehlende Daten eingeben, stellen Sie sicher, dass Ihre Modelle so genau wie möglich sind. Wenn Ihre Projekte zum maschinellen Lernen Probleme mit der Datenqualität haben, sollte der oben verlinkte Artikel mit den Grundlagen der Datenbereinigung bei Projektideen zum maschinellen Lernen helfen.

Maschinelles Lernen ist ein Teamspiel

Auch Neo braucht Freunde. Wenn Sie Projekte zum maschinellen Lernen entwickeln, müssen Sie mit anderen Menschen zusammenarbeiten, von denen viele nicht dasselbe Verständnis von KI und Software haben wie Sie.

Sie müssen anderen Menschen vertrauen und auch ehrlich zu Ihrem Modell sein. Letztendlich sollten Sie bei der Arbeit an Projekten des maschinellen Lernens Transparenz und offene Kommunikation anstreben, damit Ihr Projekt reibungslos ablaufen kann.

Konzentrieren Sie sich auf die Lösung von Problemen der realen Welt

Es ist schön und gut, maschinelles Lernen für unterhaltsame Anwendungen zu nutzen, aber wenn Sie eine Stelle als Ingenieur für maschinelles Lernen anstreben, sollten Sie sich darauf konzentrieren, einen Schmerzpunkt zu lindern, den viele Menschen haben. Denken Sie darüber nach, wie Ihr Projekt den Kunden einen Nutzen bringen kann. Indem Sie reale Probleme erforschen, können Sie Ihr Projekt als etwas herausstellen, das die Welt will und braucht. Denken Sie sich nicht nur Deep-Learning-Projekte aus, um mit Ihren Fähigkeiten zu prahlen, sondern schaffen Sie mit jeder Technologie, die Ihnen zur Verfügung steht, eine sinnvolle Wirkung. Es ist die Wirkung und nicht die Technologie, die wirklich zählt.

Spielen Sie Ihre Stärken aus

Wenn Sie neu auf dem Gebiet des maschinellen Lernens sind und noch nicht viel Erfahrung haben, kann es ein wenig entmutigend sein, gegen erfahrene Programmierer und Softwareingenieure anzutreten. In diesem Fall kann Ihre vermeintliche Schwäche eine Stärke sein. Sie können sich auf Ihren Hintergrund und Ihr Vorwissen über verschiedene Branchen stützen, um einzigartige Projekte zum maschinellen Lernen zu entwickeln, an die viele andere vielleicht gar nicht denken. Sie können Ideen für Projekte im Bereich des maschinellen Lernens aus Ihrer eigenen Perspektive entwickeln, indem Sie sich auch offene Datensätze ansehen.

Maschinelles Lernen kann die Welt menschlicher machen

Die Branche des maschinellen Lernens wird in den nächsten Jahren weiter wachsen. Während einige Leute den so genannten „Aufstieg der Roboter“ als das Ende des persönlichen Kontakts in der Wirtschaft sehen, ist die Realität genau das Gegenteil. Es gibt so viele großartige Projektideen im Bereich des maschinellen Lernens, die Unternehmen dabei helfen, einen besseren Service zu bieten und Marken zu vermenschlichen, indem sie sie besser auf die Interessen ihrer Zielgruppe abstimmen.

Es ist nicht leicht, die ersten Ideen für ein Projekt zum maschinellen Lernen zu entwickeln. Wenn Sie von anderen lernen, können Sie etwas Großartiges schaffen. Projekte zum maschinellen Lernen können dramatische Auswirkungen auf so unterschiedliche und wichtige Bereiche wie die menschliche Gesundheit und die Wirtschaft haben: Projekte zum maschinellen Lernen können dazu beitragen, unser Verständnis von uns selbst und von unserer Welt zu verbessern.

Springboard’s Machine Learning Engineering Career Track, der erste seiner Art mit einer Jobgarantie, konzentriert sich auf projektbasiertes Lernen. Erfahren Sie mehr.