Los 6 mejores proyectos de aprendizaje automático para inspirar tu cartera

El crecimiento de la inteligencia artificial (IA) ha inspirado a más ingenieros de software, científicos de datos y otros profesionales a explorar la posibilidad de una carrera en el aprendizaje automático. Sin embargo, algunos recién llegados tienden a centrarse demasiado en la teoría y no lo suficiente en la aplicación práctica. Si quieres tener éxito, tienes que empezar a crear proyectos de aprendizaje automático más pronto que tarde. necesitarás ideas de proyectos de aprendizaje automático para mejorar tu cartera.

Puede ser difícil saber por dónde empezar, así que siempre es una buena idea buscar orientación e inspiración de otros. En este post, compartiremos ejemplos reales de proyectos de aprendizaje automático que te ayudarán a entender cómo debería ser un proyecto completo. También proporcionaremos consejos prácticos para crear tus propios proyectos de aprendizaje automático que llamen la atención.

Si estás buscando una visión más completa de las opciones de carrera de aprendizaje automático, echa un vistazo a nuestras guías sobre cómo convertirse en un científico de datos y cómo convertirse en un ingeniero de datos.

Identificación de twits en Twitter utilizando el procesamiento del lenguaje natural (principiante)

El discurso de odio en las redes sociales y las noticias falsas se han convertido en fenómenos mundiales en la era digital. Si bien las publicaciones ofensivas son un problema, es aún peor cuando son inexactas o se atribuyen erróneamente a personas a través de perfiles falsos.

(Fuente: Towards Data Science)Los proyectos de aprendizaje automático pueden ayudar. Una aplicación popular del procesamiento del lenguaje natural (PLN) es el análisis de sentimientos. Esto permite analizar miles de documentos de texto en busca de determinados filtros en cuestión de segundos. Por ejemplo, Twitter puede procesar las publicaciones en busca de comentarios racistas o sexistas y separar estos tuits de los demás.

Eugene Aiken emprendió un proyecto para analizar las publicaciones de dos personas y determinar la probabilidad de que un tuit específico procediera de un usuario concreto. Para ello, utilizó los tuits de dos conocidos rivales políticos: Donald Trump y Hillary Clinton.

Esto implicó varias etapas:

Recoger sus tuits
Ejecutarlos a través de un procesador de lenguaje natural
Clasificarlos con un algoritmo de aprendizaje automático
Utilizar el método predict-proba para determinar la probabilidad

Con los resultados, Eugene fue capaz de identificar qué tuits eran más y menos probables de ser de Donald Trump. Este mismo proceso puede utilizarse para analizar los tuits de cualquier persona, incluidos los de tus amigos o familiares.

Puedes obtener más información sobre este proyecto de aprendizaje automático aquí, y descargar el conjunto de datos aquí.

Descubrir los fraudes mientras se abordan los datos desequilibrados (intermedio)

A medida que el mundo avanza hacia una realidad sin dinero en efectivo y basada en la nube, el sector bancario está más amenazado que nunca. Se espera que el coste global del fraude con tarjetas de crédito se dispare por encima de los 32.000 millones de dólares en 2020.

Aunque es un problema importante, el fraude sólo representa una fracción mínima del número total de transacciones que se realizan cada día. Esto da lugar a otro problema: los datos desequilibrados.

En el aprendizaje automático, el fraude se considera un problema de clasificación, y cuando se trata de datos desequilibrados, significa que el problema a predecir es minoritario. Como resultado, el modelo predictivo a menudo tendrá dificultades para producir un valor empresarial real a partir de los datos, y a veces puede equivocarse.

(Fuente: Towards Data Science)

Rafael Pierre explica cómo el equipo de Towards Data Science llevó a cabo un proyecto para abordar este problema. Trabajando con un conjunto de datos muy desequilibrado que contenía 492 fraudes de 284.807 transacciones, aplicaron tres estrategias diferentes:

Sobremuestreo
Submuestreo
Un enfoque combinado

Aunque cada técnica tiene sus virtudes, el enfoque combinado alcanzó un punto óptimo entre la precisión y la recuperación, ofreciendo efectivamente un alto nivel de precisión cuando se trata de conjuntos de datos desequilibrados.

Puede obtener más información sobre este proyecto de aprendizaje automático aquí.

Capturar a los ladrones en el anzuelo utilizando geomapas y computación en la nube (avanzada)

La vida marina vulnerable está bajo la inmensa amenaza de los cazadores furtivos en todo el mundo. Durante muchos años, era prácticamente imposible vigilar las actividades de cada barco en el mar. Hoy en día, los avances en IA, geomapping y computación en la nube se han combinado para hacer realidad una brillante idea de proyecto de aprendizaje automático: Global Fishing Watch.

(Fuente: Unsplash)

Entonces, ¿cómo ayuda exactamente el aprendizaje automático a Global Fishing Watch a identificar la actividad pesquera ilegal en nuestros océanos? Este proyecto en curso comprende tres etapas principales:

Recogida de datos – La mayoría de los grandes barcos utilizan un dispositivo similar al GPS conocido como sistema de identificación automática (AIS), que transmite su posición. Aunque muchos barcos pesqueros no tienen AIS, los que sí lo tienen representan alrededor del 80% de la pesca mundial en alta mar. El seguimiento de los dispositivos AIS con satélites permite controlar los movimientos de los barcos, incluso en zonas remotas.
Procesamiento – Global Fishing Watch utiliza redes neuronales para procesar la información y encontrar patrones en grandes conjuntos de datos. Se trata de unos 60 millones de puntos de datos procedentes de más de 300.000 embarcaciones, ¡todos los días! Con la ayuda de expertos en pesca, el algoritmo ha aprendido a clasificar estos barcos por una serie de factores, como:
- Tipo – de vela, de carga, de pesca
- Arte de pesca – de arrastre, de palangre, de cerco
- Comportamiento de pesca – dónde está, cuándo está activo
Compartir los resultados – Esta información sobre el seguimiento de los buques es de acceso público. Cualquiera puede visitar el sitio web para seguir los movimientos de los barcos de pesca comercial en tiempo real, seguirlos en el mapa interactivo o descargar los datos. La gente puede incluso crear mapas de calor para comprobar los patrones de actividad pesquera o ver los rastros de buques específicos en zonas marinas protegidas.

Puede obtener más información sobre este proyecto de aprendizaje automático aquí.

Uber ayuda a los clientes mediante el aprendizaje profundo (avanzado)

Como uno de los principales ejemplos de disrupción tecnológica, Uber pretende quedarse. Con miles de millones de viajes que gestionar cada año, la app de viajes compartidos necesita un fantástico sistema de asistencia para resolver los problemas de los clientes lo más rápido posible.

(Fuente: Uber)

Uber se propuso mejorar la eficacia de sus representantes de asistencia al cliente creando una arquitectura de modelo «humano en el bucle», que se llama Customer Obsession Ticket Assistant, o COTA.

Por medio de pruebas divididas de dos versiones de COTA, el equipo de Uber utilizó el aprendizaje profundo para descubrir el impacto en el tiempo de gestión de tickets, la satisfacción del cliente y los ingresos. Es un gran modelo para los proyectos de aprendizaje profundo que combinan la arquitectura técnica inteligente con la aportación humana y es de esperar que te proporcione otras ideas de proyectos de aprendizaje profundo.

Puedes aprender más sobre este proyecto de aprendizaje automático aquí.

Barbie con cerebro usando algoritmos de aprendizaje profundo (avanzado)

Las muñecas modernas que pueden «hablar» juegan un papel importante en la formación de las mentes jóvenes de los niños. Sin embargo, los muñecos estándar suelen tener un conjunto limitado de frases que no tienen correlación con lo que el niño está diciendo.

¿Pero qué pasaría si la muñeca pudiera entender preguntas? ¿Y si la muñeca pudiera dar respuestas lógicas?

(Fuente: ToyTalk)

Hola Barbie es una emocionante demostración del poder del aprendizaje automático y la inteligencia artificial. A través de la PNL y algunos análisis de audio avanzados, Barbie puede interactuar en una conversación lógica. El micrófono de su collar graba lo que se dice y luego lo transmite a los servidores de ToyTalk, donde se analiza.

Hay más de 8.000 líneas de diálogo disponibles, y los servidores transmitirán la respuesta más adecuada en un segundo para que Barbie pueda responder. Considérelo como otra arquitectura que se suma a su tesoro de ideas de proyectos de aprendizaje profundo.

Puede obtener más información sobre este proyecto de aprendizaje automático aquí.

Personalización de obras de arte de Netflix usando IA (avanzada)

Netflix es la fuerza dominante en el entretenimiento ahora, y la compañía entiende que diferentes personas tienen diferentes gustos. A veces, las personas son culpables de juzgar los programas o las películas por sus imágenes y, por lo tanto, es posible que nunca revisen ciertos programas. Para no dejarse vencer, Netflix pretende persuadir a más personas para que vean sus programas.

(Fuente: Unsplash)

Cuando visitas Netflix, a veces verás diferentes ilustraciones para los mismos programas. Esto es el aprendizaje automático en el trabajo. Netflix utiliza una red neuronal convolucional que analiza las imágenes visuales. La empresa explica que también se basa en «bandidos contextuales», que trabajan continuamente para determinar qué obras de arte obtienen un mejor compromiso.

Con el tiempo, a medida que usas más Netflix, empieza a entender no solo qué programas te gustan, sino también qué tipo de obras de arte. Por ejemplo, si has visto varias películas protagonizadas por Uma Thurman, es probable que veas el arte de Pulp Fiction con la actriz en lugar de los coprotagonistas John Travolta o Samuel L. Jackson.

Puedes aprender más sobre este proyecto de aprendizaje automático aquí.

Relacionado: 6 proyectos completos de ciencia de datos

Cómo generar tus propias ideas de proyectos de aprendizaje automático

Si ya estás aprendiendo a convertirte en un ingeniero de aprendizaje automático, puede que estés listo para ponerte manos a la obra. Si no es así, aquí tienes algunos pasos para poner las cosas en marcha.

Elige una idea que te entusiasme

Para empezar, necesitas hacer una lluvia de ideas de proyectos de aprendizaje automático. Piensa en tus intereses y busca crear conceptos de alto nivel en torno a ellos. Elija la idea más viable, y luego solidifíquela con una propuesta escrita, que actúe como un plano para comprobar a lo largo del proyecto.

Relacionado: 5 industrias no tradicionales que están aprovechando la IA

Evite salirse del alcance

Si es su primer proyecto, debe luchar contra el impulso de ir más allá del alcance del proyecto. Céntrate en proyectos sencillos de aprendizaje automático. Al centrarse en un problema pequeño e investigar un conjunto de datos grande y relevante, es más probable que su proyecto genere un retorno positivo de su inversión.

Prueba tu hipótesis

Especialmente cuando se habla de proyectos fáciles de aprendizaje automático para principiantes, lo principal es pensar en generar insights de tu proyecto. No te preocupes por actuar sobre esos insights todavía. Modela tu hipótesis, y pruébala. Python es el lenguaje más fácil para principiantes, y te aconsejamos que lo utilices para realizar tus pruebas.

Implementa los resultados

Una vez que hayas alcanzado todos los resultados deseados, puedes buscar implementar tu proyecto. Hay algunos pasos para esta etapa:

Crear una API (interfaz de programación de aplicaciones) – Esto le permite integrar sus conocimientos de aprendizaje automático en el producto.
Registrar los resultados en una única base de datos – Al cotejar todo junto, se facilita la construcción de los resultados.
Incrustar el código – Cuando se tiene poco tiempo, incrustar el código es más rápido que una API.

Revise y aprenda

Cuando haya terminado el proyecto, evalúe los resultados. Piensa en lo que ha pasado y por qué. ¿Qué podría haber hecho de forma diferente? Con el tiempo, a medida que adquiera experiencia, podrá aprender de sus propios errores.

Consejos para proyectos de aprendizaje automático para principiantes

Incluso los proyectos de aprendizaje automático más sencillos deben construirse sobre una base sólida de conocimientos para tener alguna posibilidad real de éxito. Además, el campo de juego competitivo hace que sea difícil para los recién llegados destacar.

Relacionado: Cómo conseguir unas prácticas de aprendizaje automático

Aquí tienes unos cuantos consejos para que tu proyecto de aprendizaje automático brille.

Familiarízate con las aplicaciones comunes del aprendizaje automático

En términos generales, hay tres tipos básicos de aprendizaje automático:

El aprendizaje supervisado analiza datos históricos para predecir nuevos resultados. Por ejemplo, la predicción de los precios de los inmuebles.
El aprendizaje no supervisado busca patrones de datos mediante un análisis estadístico. Por ejemplo, la identificación de segmentos de clientes dentro de los datos de ventas de su empresa.
El aprendizaje por refuerzo funciona con un modelo dinámico que utiliza el ensayo y error para mejorar constantemente el rendimiento. Por ejemplo, el comercio de acciones.

Cuando desarrolle una mejor comprensión de estas aplicaciones, sabrá cómo aplicar el aprendizaje automático a su problema.

No subestime el preprocesamiento y la limpieza de datos

Los datos ruidosos pueden sesgar sus resultados. Por lo tanto, usted debe tratar de utilizar el preprocesamiento de datos y la limpieza de datos con regularidad. En pocas palabras, se trata de tomar sus datos y hacerlos más fáciles de entender. Al poner en orden las cosas y al introducir los datos que faltan, te aseguras de que tus modelos sean lo más precisos posible. Si sus proyectos de aprendizaje automático tienen problemas de calidad de datos, el artículo enlazado anteriormente debería ayudar con los fundamentos de la limpieza de datos con ideas de proyectos de aprendizaje automático.

El aprendizaje automático es un juego de equipo

Hasta Neo necesitaba amigos. Cuando desarrolles proyectos de aprendizaje automático, tendrás que trabajar con otras personas, muchas de las cuales no tendrán los mismos conocimientos de IA y software que tú.

Debes confiar en otras personas, y también ser honesto sobre tu modelo. En última instancia, cuando trabajes en proyectos de aprendizaje automático, busca la transparencia y la comunicación abierta para que tu proyecto se desarrolle sin problemas.

Enfócate en resolver problemas del mundo real

Está muy bien utilizar el aprendizaje automático para aplicaciones divertidas, pero si tienes la vista puesta en conseguir un trabajo como ingeniero de aprendizaje automático, deberías centrarte en aliviar un punto de dolor que siente mucha gente. Piensa en cómo tu proyecto ofrecerá valor a los clientes. Al investigar los problemas del mundo real, puedes hacer que tu proyecto destaque como uno que el mundo quiere y necesita. No te limites a idear proyectos de aprendizaje profundo para presumir de tus habilidades: crea un impacto significativo con cualquier tecnología que puedas. Es el impacto y no la tecnología lo que realmente importa.

Juega con tus puntos fuertes

Si eres nuevo en el aprendizaje automático y no tienes mucha experiencia, puede ser un poco desalentador enfrentarte a codificadores e ingenieros de software veteranos. En este caso, tu debilidad percibida puede ser una fortaleza. Puedes apoyarte en tu experiencia y en tus conocimientos previos sobre diferentes sectores para crear proyectos de aprendizaje automático únicos en los que muchas otras personas ni siquiera piensan. Puedes generar ideas de proyectos de aprendizaje automático con tu propia perspectiva mirando también conjuntos de datos abiertos.

El aprendizaje automático puede hacer que el mundo sea más humano

La industria del aprendizaje automático seguirá creciendo en los próximos años. Mientras que algunas personas ven el llamado «ascenso de los robots» como el fin del toque personal en los negocios, la realidad es todo lo contrario. Hay muchísimas ideas de proyectos de machine learning que realmente ayudan a las empresas a ofrecer un mejor servicio, humanizando efectivamente las marcas al hacerlas más afines a los intereses de su público objetivo.

No es fácil desarrollar tus primeras ideas de proyectos de machine learning. Aprendiendo de los demás, puedes crear algo grande. Los proyectos sobre aprendizaje automático pueden tener efectos dramáticos en campos tan diversos e importantes como la salud humana y la economía: los proyectos sobre aprendizaje automático pueden ayudar a avanzar en nuestra comprensión de nosotros mismos y de nuestro mundo.

La Carrera de Ingeniería de Aprendizaje Automático de Springboard, la primera de su tipo que viene con una garantía de empleo, se centra en el aprendizaje basado en proyectos. Más información.