Mas leido
Building Stories
Modo Rua: Redefiniendo el desarrollo de aplicaciones mediante iteración centrada en el usuario Ago 23
Building Stories
NuStories: Adaptación de productos para clientes fanáticos en varios países Oct 30
Culture & Values
Cómo los valores y la cultura de Nu dan forma a los productos que creamos Ago 7
Carreras
Reunimos a grandes mentes de diversos orígenes que permiten la discusión y el debate y mejoran la resolución de problemas.
Conoce más sobre nuestras carreras



Esta publicación fue revisada por: Luis Moneda, Tiago Magalhães, Jessica Sousa, Cristiano Breuel y Henrique Lopes
Los Científicos de Datos (DS) e Ingenieros de Aprendizaje Automático (MLE) existen desde hace algún tiempo (al menos según los estándares tecnológicos), pero eso no significa que las definiciones y expectativas específicas para cada función estén bien acordadas en la industria en su conjunto.
Lejos de ello. Muy a menudo la gente no está segura de en qué se diferencian exactamente y en qué se superponen.
En esta publicación compartiremos nuestra opinión sobre este tema, es decir, el alcance de estos roles en Nubank.
Como verás en las siguientes secciones, hay algunas dimensiones que analizar aquí, por lo que hay una respuesta corta con los insights más importantes y una respuesta larga donde explicamos lo que sucede con más detalle.
Entonces, ¿en qué se diferencian los roles DS y MLE? ¿Dónde residen las similitudes y en qué se diferencian?
Respuesta corta: Es un espectro de habilidades y se superponen
El grado de superposición dependerá de qué tan maduro sea su equipo (con respecto a las soluciones de Aprendizaje Automático)..
Descubre las oportunidades
Respuesta larga: Depende
Depende mucho, sobre todo del tipo de equipo en el que estés.
Aunque se pueden definir pautas generales para cada función, habrá mucha variación en las actividades diarias típicas de un DS o MLE en Nubank, principalmente dependiendo del tipo de equipos en los que estén trabajando.
Las dos distinciones más importantes suelen ser:
Como regla general, cuanta más experiencia tenga un equipo en la aplicación del aprendizaje automático a problemas empresariales, menos superposición habrá entre los científicos de datos y los ingenieros de aprendizaje automático.
En los equipos con mayor madurez, el enfoque suele cambiar de implementaciones ad-hoc a soluciones escalables y rentables.
La superposición DS/BA está presente en todos los equipos. Aunque los DSs empiezan a trabajar en modelos más especializados a medida que crece la madurez del equipo, estos dos roles son clave porque conectan el ″mundo de los datos″ con el ″mundo de los negocios″.
En los equipos orientados a la transmisión en tiempo real, los MLE serán los más cercanos a los ingenieros de software habituales, ya que ejecutarán muchas tareas similares aquí. Por el contrario, los MLE tendrán un alcance más cercano al de los ingenieros analíticos (AE) y los ingenieros de datos en equipos donde los modelos se ejecutan en lotes o en trabajos de larga duración.
El siguiente diagrama muestra lo que entendemos que son estas diferencias de equipo. Los analizaremos en detalle en las siguientes secciones.
El eje X separa los equipos de baja madurez de los de alta madurez, con respecto a las soluciones basadas en ML.
El eje Y separa los equipos en los que los modelos deben proporcionar resultados justo a tiempo (enfoque en tiempo real) frente a aquellos en los que podemos permitirnos puntuar instancias por lotes
Tipos de equipos
1) Enfoque en tiempo real, baja madurez
En una plantilla que está trabajando en su primer modelo en tiempo real hay mucha ambigüedad en el aire. Aún no está claro qué tareas deben realizarse (y quién debe realizarlas), por lo que esto da como resultado una gran superposición entre roles. Se espera que todos desempeñen un papel más “generalista” en todo momento.
Puntos clave
2) Enfoque en tiempo real, alta madurez
Se trata de equipos que ya han tenido experiencia en la aplicación de modelos en tiempo real a un par de problemas empresariales. Las personas comprenden las responsabilidades de cada rol y cuáles son los desafíos habituales. El enfoque se desplaza de la implementación al mantenimiento, la optimización y la eficiencia.
Puntos clave
3) Enfoque en lotes, baja madurez
Los equipos centrados en lotes sin modelos de ML previos generalmente intentarán adaptar sus rutinas de datos (es decir, flujos ETL) y/o administradores de programación (por ejemplo, trabajos cron, flujo de aire) para admitir la puntuación en lotes. Una vez más, es de esperar que haya mucha superposición entre varios roles.
Puntos clave
4) Enfoque en lotes, alta madurez
Un equipo de alta madurez y centrado en lotes ya tendrá varios modelos en producción y la mayoría de los problemas iniciales (implementación, integridad de datos, monitoreo) ya se habrán resuelto para los modelos individuales, por lo que la atención se centra en el escalamiento y la eficiencia. Se reduce la superposición entre DS/MLE.
Puntos clave
5) Equipos horizontales/de apoyo
Hay Ingenieros de Aprendizaje Automático (rara vez, también Científicos de Datos) que trabajan en equipos de soporte horizontales. Es difícil encajarlos en las descripciones anteriores, entonces, ¿qué les sucede?
Bueno, antes que nada, ¿a qué nos referimos con equipos horizontales?
En el ámbito de la ciencia de datos/aprendizaje automático, los equipos horizontales son equipos de equipos cruzados que trabajan con varias unidades de negocios a la vez, brindando soporte y creando herramientas y plataformas para que las utilice el resto de la empresa.
Recientemente, esto también se conoce como MLOps (ML Operations).
Puntos clave
Descripciones de Funciones Sugeridas
Con todas estas especificidades en mente e independientemente del tipo de equipo, todavía hay algunas actividades principales que están inequívocamente dentro del alcance de los científicos de datos y los ingenieros de aprendizaje automático, respectivamente.
Científico de Datos: Descripción de Función Sugerida
Debería hacer
Puede hacer
Ingeniero de Aprendizaje Automático: Descripción de Función Sugerida
Debería hacer
Puede hacer
Relacionado
Otros roles
Una empresa moderna se compone de varios roles y, por supuesto, no los incluimos todos en los diagramas. Entre los que pueden interactuar de alguna manera con DS/MLE, tenemos:
All information here is to be taken as a rough guideline only! While we have tried to make the text as widely applicable as possible, what works for us at Nubank may not necessarily work for everyone.
Descubre las oportunidades