Top 6 des projets d'apprentissage automatique pour inspirer votre portefeuille

La croissance de l’intelligence artificielle (IA) a inspiré plus d’ingénieurs logiciels, de scientifiques des données et d’autres professionnels à explorer la possibilité d’une carrière dans l’apprentissage automatique. Cependant, certains nouveaux arrivants ont tendance à trop se concentrer sur la théorie et pas assez sur l’application pratique. Si vous voulez réussir, vous devez commencer à élaborer des projets d’apprentissage automatique plus tôt que tard. Vous aurez besoin d’idées de projets d’apprentissage automatique pour améliorer votre portefeuille.

Il peut être difficile de savoir par où commencer, alors c’est toujours une bonne idée de chercher des conseils et de l’inspiration auprès des autres. Dans ce post, nous partagerons des exemples réels de projets d’apprentissage automatique qui vous aideront à comprendre à quoi devrait ressembler un projet achevé. Nous fournirons également des conseils pratiques pour créer vos propres projets d’apprentissage automatique qui attirent l’attention.

Si vous cherchez un aperçu plus complet des options de carrière en apprentissage automatique, consultez nos guides sur la façon de devenir un scientifique de données et sur la façon de devenir un ingénieur de données.

Identifier les Twits sur Twitter en utilisant le traitement du langage naturel (débutant)

Les discours de haine sur les médias sociaux et les fake news sont devenus des phénomènes mondiaux à l’ère numérique. Si les posts offensants sont un problème, c’est encore pire lorsqu’ils sont inexacts ou attribués à tort à des personnes par le biais de faux profils.

(Source : Towards Data Science)

Les projets d’apprentissage automatique peuvent aider. Une application populaire du traitement du langage naturel (NLP) est l’analyse des sentiments. Cela permet de balayer des milliers de documents textuels pour certains filtres en quelques secondes. Par exemple, Twitter peut traiter les messages à la recherche de remarques racistes ou sexistes et séparer ces tweets des autres.

Eugene Aiken a entrepris un projet visant à analyser les messages de deux personnes et à déterminer la probabilité qu’un tweet spécifique provienne d’un utilisateur particulier. Pour ce faire, il a utilisé les tweets de deux rivaux politiques bien connus : Donald Trump et Hillary Clinton.

Cela a nécessité plusieurs étapes :

Craper leurs tweets
Les faire passer par un processeur de langage naturel
Les classer à l’aide d’un algorithme d’apprentissage automatique
Utiliser la méthode predict-proba pour déterminer la probabilité

Avec les résultats, Eugène a pu identifier les tweets les plus et les moins susceptibles d’être de Donald Trump. Ce même processus peut être utilisé pour analyser les tweets de n’importe qui, y compris de vos amis ou de votre famille.

Vous pouvez en savoir plus sur ce projet d’apprentissage automatique ici, et télécharger l’ensemble de données ici.

Démasquer les fraudes tout en s’attaquant aux données déséquilibrées (intermédiaire)

Alors que le monde se dirige vers une réalité sans argent liquide et basée sur le cloud, le secteur bancaire est plus menacé que jamais. Le coût mondial de la fraude à la carte de crédit devrait s’envoler au-dessus de 32 milliards de dollars d’ici 2020.

Bien qu’il s’agisse d’un problème majeur, la fraude ne représente qu’une infime partie du nombre total de transactions effectuées chaque jour. Cela donne lieu à un autre problème : le déséquilibre des données.

Dans l’apprentissage automatique, la fraude est considérée comme un problème de classification, et lorsque vous avez affaire à des données déséquilibrées, cela signifie que le problème à prédire est minoritaire. Par conséquent, le modèle prédictif aura souvent du mal à produire une véritable valeur commerciale à partir des données, et il peut parfois se tromper.

(Source : Towards Data Science)

Rafael Pierre explique comment l’équipe de Towards Data Science a mené un projet pour s’attaquer à ce problème. Travaillant avec un ensemble de données très déséquilibré qui comptait 492 fraudes sur 284 807 transactions, ils ont mis en œuvre trois stratégies différentes :

Sur-échantillonnage
Sous-échantillonnage
Une approche combinée

Bien que chaque technique ait ses vertus, l’approche combinée a trouvé le juste milieu entre la précision et le rappel, offrant effectivement un haut niveau de précision lors du traitement d’ensembles de données déséquilibrés.

Vous pouvez en savoir plus sur ce projet d’apprentissage automatique ici.

Atteindre les escrocs à l’hameçon en utilisant la géocartographie et le cloud computing (avancé)

La vie marine vulnérable est sous l’immense menace des braconniers illégaux dans le monde entier. Pendant de nombreuses années, il était pratiquement impossible de garder un œil sur les activités de chaque bateau en mer. De nos jours, les progrès de l’IA, de la géocartographie et de l’informatique en nuage se sont combinés pour réaliser une brillante idée de projet d’apprentissage automatique : Global Fishing Watch.

(Source : Unsplash)

Alors, comment l’apprentissage automatique aide-t-il exactement Global Fishing Watch à identifier les activités de pêche illégale dans nos océans ? Ce projet en cours comporte trois étapes principales :

Récolte de données – La plupart des grands navires utilisent un dispositif de type GPS appelé système d’identification automatique (AIS), qui diffuse leur position. Bien que de nombreux bateaux de pêche n’aient pas d’AIS, ceux qui en ont un représentent environ 80 % de la pêche mondiale en haute mer. En suivant les dispositifs AIS avec des satellites, il est possible de surveiller les mouvements des navires, même dans des zones éloignées.
Traitement – Global Fishing Watch utilise des réseaux neuronaux pour traiter les informations et trouver des modèles dans de grands ensembles de données. Celui-ci comprend quelque 60 millions de points de données provenant de plus de 300 000 navires – quotidiennement ! Avec l’aide d’experts en pêche, l’algorithme a appris à classer ces navires selon un certain nombre de facteurs, tels que :
- Type – voile, cargaison, pêche
- Engin de pêche – chalut, palangre, senne coulissante
- Comportements de pêche – où il est, quand il est actif
Partage des résultats – Ces informations sur le suivi des navires sont accessibles au public. N’importe qui peut visiter le site web pour suivre les mouvements des bateaux de pêche commerciale en temps réel, les suivre sur la carte interactive ou télécharger les données. Les gens peuvent même créer des cartes thermiques pour vérifier les modèles d’activité de pêche ou voir les traces de navires spécifiques dans les zones marines protégées.

Vous pouvez en savoir plus sur ce projet d’apprentissage automatique ici.

Uber Helpful Customer Support Using Deep Learning (Advanced)

Comme l’un des principaux exemples de perturbation technologique, Uber a l’intention de rester dans les parages. Avec des milliards de trajets à gérer chaque année, l’application de covoiturage a besoin d’un fantastique système d’assistance pour résoudre les problèmes des clients le plus rapidement possible.

(Source : Uber)

Uber a entrepris d’améliorer l’efficacité de ses représentants de l’assistance clientèle en créant une architecture modèle » humaine dans la boucle « , appelée Customer Obsession Ticket Assistant, ou COTA.

En testant de manière fractionnée deux versions de COTA, l’équipe d’Uber a utilisé l’apprentissage profond pour découvrir l’impact sur le temps de traitement des tickets, la satisfaction des clients et les revenus. C’est un excellent modèle pour les projets d’apprentissage profond qui combinent une architecture technique intelligente avec des apports humains et qui, nous l’espérons, vous fournira d’autres idées de projets d’apprentissage profond.

Vous pouvez en savoir plus sur ce projet d’apprentissage automatique ici.

Barbie avec des cerveaux en utilisant des algorithmes d’apprentissage profond (avancé)

Les poupées modernes qui peuvent « parler » jouent un rôle important dans la formation des jeunes esprits des enfants. Cependant, les poupées standard ont généralement un ensemble limité de phrases qui n’ont aucune corrélation avec ce que l’enfant dit.

Mais si la poupée pouvait comprendre les questions ? Et si la poupée pouvait donner des réponses logiques ?

(Source : ToyTalk)

Hello Barbie est une démonstration passionnante de la puissance de l’apprentissage automatique et de l’intelligence artificielle. Grâce au NLP et à certaines analyses audio avancées, Barbie peut interagir dans une conversation logique. Le microphone de son collier enregistre tout ce qui est dit et le transmet ensuite aux serveurs de ToyTalk, où il est analysé.

Il y a plus de 8000 lignes de dialogue disponibles, et les serveurs retransmettent la réponse la plus appropriée en une seconde pour que Barbie puisse réagir. Considérez que c’est une autre architecture qui s’ajoute à votre trove d’idées de projets d’apprentissage profond.

Vous pouvez en savoir plus sur ce projet d’apprentissage automatique ici.

Personnalisation des œuvres d’art de Netflix à l’aide de l’IA (avancée)

Netflix est la force dominante dans le divertissement maintenant, et la société comprend que différentes personnes ont des goûts différents. Parfois, les gens sont coupables de juger les émissions ou les films par leurs images et donc ils pourraient ne jamais vérifier certains programmes. Pour ne pas s’avouer vaincu, Netflix vise à persuader plus de gens de regarder leurs émissions.

(Source : Unsplash)

Lorsque vous visitez Netflix, vous verrez parfois différentes illustrations pour les mêmes émissions. C’est l’apprentissage automatique à l’œuvre. Netflix utilise un réseau neuronal convolutif qui analyse l’imagerie visuelle. La société explique qu’elle s’appuie également sur des « bandits contextuels », qui travaillent continuellement pour déterminer quelle œuvre d’art obtient un meilleur engagement.

Au fil du temps, à mesure que vous utilisez davantage Netflix, il commence à comprendre non seulement quels programmes vous aimez, mais aussi quel type d’œuvre d’art ! Par exemple, si vous avez regardé plusieurs films mettant en vedette Uma Thurman, vous serez susceptible de voir des œuvres d’art Pulp Fiction mettant en vedette l’actrice plutôt que ses co-stars John Travolta ou Samuel L. Jackson.

Vous pouvez en apprendre davantage sur ce projet d’apprentissage automatique ici.

Relié : 6 Projets complets de science des données

Comment générer vos propres idées de projet d’apprentissage automatique

Si vous apprenez déjà à devenir un ingénieur en apprentissage automatique, vous êtes peut-être prêt à vous lancer. Si ce n’est pas le cas, voici quelques étapes pour faire avancer les choses.

Chez une idée qui vous excite

Pour lancer les choses, vous devez faire un brainstorming sur des idées de projets d’apprentissage automatique. Pensez à vos intérêts et cherchez à créer des concepts de haut niveau autour de ceux-ci. Choisissez l’idée la plus viable, puis solidifiez-la avec une proposition écrite, qui sert de plan directeur à vérifier tout au long du projet.

Relié : 5 industries non traditionnelles qui tirent parti de l’IA

Évitez de sortir du cadre

S’il s’agit de votre premier projet, vous devriez combattre l’envie de sortir du cadre du projet. Concentrez-vous sur des projets d’apprentissage automatique simples. En vous concentrant sur un petit problème et en faisant des recherches sur un grand ensemble de données pertinentes, votre projet est plus susceptible de générer un retour positif sur votre investissement.

Tester votre hypothèse

En particulier lorsqu’on parle de projets d’apprentissage automatique faciles pour les débutants, la principale chose à laquelle il faut penser est de générer des idées à partir de votre projet. Ne vous souciez pas encore d’agir sur ces insights. Modélisez votre hypothèse et testez-la. Python est le langage le plus facile pour les débutants, et nous vous conseillons de l’utiliser pour réaliser vos tests.

Mettre en œuvre les résultats

Une fois que vous avez atteint tous les résultats souhaités, vous pouvez chercher à mettre en œuvre votre projet. Il y a quelques étapes à cette étape :

Créer une API (interface de programmation d’application) – Cela vous permet d’intégrer vos connaissances d’apprentissage machine dans le produit.
Enregistrer les résultats sur une base de données unique – En rassemblant tout, vous facilitez l’exploitation des résultats.
Intégrer le code – Lorsque vous manquez de temps, intégrer le code est plus rapide qu’une API.

Réviser et apprendre

Lorsque vous avez terminé le projet, évaluez les résultats. Réfléchissez à ce qui s’est passé, et pourquoi. Qu’est-ce que vous auriez pu faire différemment ? Au fil du temps, en acquérant de l’expérience, vous serez en mesure d’apprendre de vos propres erreurs.

Conseils pour les projets d’apprentissage automatique pour les débutants

Même les projets d’apprentissage automatique simples doivent être construits sur une base solide de connaissances pour avoir une réelle chance de succès. En outre, le terrain de jeu concurrentiel fait qu’il est difficile pour les nouveaux arrivants de se démarquer.

Relié : Comment décrocher un stage en apprentissage automatique

Voici quelques conseils pour faire briller votre projet d’apprentissage automatique.

Faites-vous connaître des applications courantes de l’apprentissage automatique

D’une manière générale, il existe trois types fondamentaux d’apprentissage automatique :

L’apprentissage supervisé analyse les données historiques pour prédire de nouveaux résultats. Par exemple, la prédiction des prix de l’immobilier.
L’apprentissage non supervisé recherche des modèles de données en utilisant l’analyse statistique. Par exemple, identifier des segments de clientèle dans les données de vente de votre entreprise.
L’apprentissage par renforcement fonctionne avec un modèle dynamique qui utilise des essais et des erreurs pour améliorer constamment les performances. Par exemple, le trading boursier.

Lorsque vous développerez une meilleure compréhension de ces applications, vous saurez comment appliquer l’apprentissage automatique à votre problème.

Ne sous-estimez pas le prétraitement et le nettoyage des données

Les données bruyantes peuvent fausser vos résultats. Par conséquent, vous devez chercher à utiliser régulièrement le prétraitement et le nettoyage des données. En termes simples, il s’agit de prendre vos données et de les rendre plus faciles à comprendre. En remettant les choses en ordre et en saisissant les données manquantes, vous vous assurez que vos modèles sont aussi précis que possible. Si vos projets sur l’apprentissage automatique ont des problèmes de qualité des données, l’article lié ci-dessus devrait vous aider avec les bases du traitement des données avec des idées de projets d’apprentissage automatique.

L’apprentissage automatique est un jeu d’équipe

Même Neo avait besoin d’amis. Lorsque vous développez des projets d’apprentissage automatique, vous devrez travailler avec d’autres personnes, dont beaucoup n’auront pas la même compréhension de l’IA et des logiciels que vous.

Vous devez faire confiance aux autres personnes, et aussi être honnête sur votre modèle. En fin de compte, lorsque vous travaillez sur des projets d’apprentissage automatique, visez la transparence et la communication ouverte afin que votre projet puisse se dérouler sans heurts.

Focus sur la résolution de problèmes du monde réel

C’est très bien d’utiliser l’apprentissage automatique pour des applications amusantes, mais si vous avez l’œil pour décrocher un emploi d’ingénieur en apprentissage automatique, vous devriez vous concentrer sur le soulagement d’un point douloureux ressenti par beaucoup de gens. Réfléchissez à la manière dont votre projet apportera de la valeur aux clients. En étudiant les problèmes du monde réel, vous pouvez faire en sorte que votre projet se démarque comme étant celui que le monde désire et dont il a besoin. Ne vous contentez pas d’inventer des projets d’apprentissage profond pour montrer vos compétences – créez un impact significatif avec toutes les technologies que vous pouvez. C’est l’impact et non la technologie qui compte vraiment.

Playez sur vos forces

Si vous êtes nouveau dans l’apprentissage automatique et que vous n’avez pas beaucoup d’expérience, il peut être un peu intimidant de se mesurer à des codeurs et des ingénieurs logiciels vétérans. Dans ce cas, votre faiblesse perçue peut devenir une force. Vous pouvez vous appuyer sur vos antécédents et vos connaissances préalables de différents secteurs pour créer des projets d’apprentissage automatique uniques auxquels beaucoup d’autres personnes n’ont peut-être même pas pensé. Vous pouvez générer des idées de projets d’apprentissage automatique avec votre propre perspective en regardant également des ensembles de données ouverts.

L’apprentissage automatique peut rendre le monde plus humain

L’industrie de l’apprentissage automatique continuera à se développer dans les années à venir. Alors que certaines personnes considèrent la soi-disant « montée des robots » comme la fin de la touche personnelle dans les affaires, la réalité est tout le contraire. Il existe tellement d’excellentes idées de projets d’apprentissage automatique qui aident réellement les entreprises à offrir un meilleur service, en humanisant efficacement les marques en les rendant plus en phase avec les intérêts de leur public cible.

Il n’est pas facile de développer vos premières idées de projet d’apprentissage automatique. En apprenant des autres, vous pouvez créer quelque chose d’exceptionnel. Les projets sur l’apprentissage automatique peuvent avoir des effets spectaculaires sur des domaines aussi divers et aussi importants que la santé humaine et l’économie : les projets sur l’apprentissage automatique peuvent contribuer à faire progresser notre compréhension de nous-mêmes et de notre monde.

La filière professionnelle d’ingénierie de l’apprentissage automatique de Springboard, la première du genre à être assortie d’une garantie d’emploi, est axée sur l’apprentissage par projet. En savoir plus.