Fredi Vivas es CEO y Fundador de RockingData, y autor de ¿Cómo piensan las máquinas? Explica en la nota cuáles son los beneficios de la ciencia de datos, por qué hay empresas que todavía no la están aprovechando y la importancia de alinear todo el trabajo de data con los objetivos de negocio.





RockingData



Los problemas que los datos pueden resolver

¿Cómo llegaste a trabajar en todo lo que es data?
Yo estudié Ingeniería en Sistemas de Información, que es todo este mundo de la data. Dentro de la carrera hay algunas materias que están muy relacionadas con business intelligence y, cuando las cursé, me llamaron mucho la atención. Siempre me gustó la tecnología, desde muy chico, 12 o 13 años, así que me resultaba natural. Hace más o menos 12 años encontré el concepto de big data y empecé a leer mucho sobre eso. Una fuente de conocimiento sobre el tema fue Singularity University, una universidad de Estados Unidos que es pionera en el estudio y desarrollo de tecnologías exponenciales, que son estas tecnologías que evolucionan más rápido que el resto de las cosas. En ese aprendizaje encontré esos conceptos de big data, de inteligencia artificial, de ciencia de datos y tuve la suerte de empezar a trabajar en un área de una compañía multinacional en el desarrollo de estas prácticas. Hace cuatro años, junto a dos amigos, fundamos RockingData, una empresa que se dedica específicamente a crear ese tipo de algoritmos para empresas. Ese fue mi recorrido.

Hoy la data es de esas cosas que todo el mundo sabe que las tiene que aprovechar, pero muchas veces no sabe cómo ni para qué. ¿Cómo es el abordaje que tienen con un cliente? ¿Cómo lo acompañan en su propio camino?
Tomo tus palabras de “su propio camino”, en el sentido de que cada empresa es un mundo diferente, es una organización que tiene sus propias prácticas, su propio nivel de madurez de uso de los datos, de los recursos que tiene, si tiene más o menos datos digitales. Hay muchas empresas que tienen dificultad para conseguir datos digitales de buena calidad, entonces hay que apoyarlas en ese camino para mejorar la calidad; también en la segurización de esa data para que no haya pérdida de información o hackeos o violación de privacidad en los datos de los clientes. Muchas veces la forma que tenemos de arrancar es a partir de un problema, de una pregunta de negocio. La pregunta de negocio es algo que necesitás resolver y, generalmente, los clientes que vienen a hablar con nosotros tienen la sensación de que los datos los pueden ayudar a resolver esa pregunta con más eficiencia. Por ejemplo, una pregunta de negocio puede ser “tengo un montón de clientes y quiero saber cuáles son los que tienen más probabilidad de dejar de comprarme”. Los datos te pueden ayudar, en ese caso, entendiendo la relación del cliente con la empresa. Otra pregunta puede ser “tengo un montón de clientes y quiero entender los grupos de clientes que tengo, para comunicarme con ellos a nivel de segmento”. Una universidad podría preguntarse cuáles son los alumnos con más probabilidad de abandonar la cursada, o un sanatorio médico podría intentar saber cuántos pacientes van a llegar con un determinado diagnóstico al sanatorio, o cuál es la recomendación de producto a un cliente que ya me compró, o el precio correcto para un producto específico. Lo que hacemos con los clientes es ayudarlos a resolver esos problemas con datos y a que eso quede como algo continuo dentro de la organización para tomar mejores decisiones. 


“Lo que hacemos con los clientes es ayudarlos a resolver esos problemas con datos y a que eso quede como algo continuo dentro de la organización para tomar mejores decisiones”.

En cuanto a la obtención de la data, ¿cómo se establecen los criterios y la forma de obtención?
La forma de obtención y cuál es la data que deberías tener tiene que ver con el objetivo estratégico. El objetivo de la organización tiene que estar alineado con las necesidades de la organización. Por ejemplo, sos un sanatorio médico y estás con el problema de que necesitás más turnos de los que podés tener, tenés mucha demanda de pacientes y les das turnos dentro de cuatro meses porque no los podés gestionar de otra manera. Entonces una posible solución puede ser saber cuáles son los turnos que tienen más probabilidad de cancelarse. Al tener ese conocimiento, podés hacer que a la gente con probabilidad de cancelación del turno de más del 80% se le haga un llamado, se le mande un mail el día anterior para confirmarlo o cancelarlo, y así poder dárselo a otra persona. Arrancamos de esa necesidad concreta y ahí empezamos a pensar qué datos tenemos: de cada persona, de los turnos que pidió y canceló, de la proyección de clima para ese día, porque cuando llueve o hace frío quizás la cancelación sube. Empezás a pensar creativamente para entender cuáles son los datos que pueden complementar ese modelo, y toda esa fuente de datos se la das al algoritmo; y el algoritmo, cuantas más fuentes de datos tiene, genera una predicción más precisa, por lo tanto, con esa precisión mayor tenés una decisión más segura. Yo siempre recomiendo para el proceso de recolección, sobre todo cuando estás comenzando, orientar las fuentes que vas a relevar en función al problema que querés resolver. Hay muchos métodos; la mayoría de las empresas que tienen mucha experiencia, tienen 10, 20, 30 fuentes de datos distintas. Se recomienda ponerlas todas en un único lugar, que se conoce como “data lake” y dentro de ese lago de datos los analistas de datos van a entrar para consultarlos y hacer los modelos predictivos.


“Cuantas más fuentes de datos tiene un algoritmo, más precisa es la predicción que genera; por lo tanto, con esa precisión mayor tenés una decisión más segura”.

¿Cuáles son las expectativas en cuanto a que la data y la tecnología puedan resolver problemas? ¿Hay una sobredemanda de resultados?
Sí, totalmente cierto. Es como que se le pone una sobre expectativa al resultado, por eso nosotros también hacemos mucha divulgación e intentamos entrenar a nuestros clientes, incluso antes de que nos compren. Por ejemplo, en términos de precisión de las predicciones, hemos hecho modelos predictivos en donde la precisión fue casi del 100%. Hicimos un modelo predictivo para un hospital, el segundo que recibió más casos de COVID-19 en Buenos Aires, para que puedan saber cuánta gente iba a ingresar con la enfermedad, y tuvo un 98% de precisión, en diciembre del año pasado. Ahora, eso pasa muy pocas veces y quizás es hasta normal que no pase, porque son muchas las cuestiones que inciden; si la cuarentena es más cerrada o más abierta, el clima, y había momentos de mucha variación. El foco no siempre tiene que estar en esa precisión, sino muchas veces en el proceso de aprendizaje que genera armar un modelo. Me refiero a que, cuando vos armás un modelo predictivo para saber cuáles son los clientes que te van a dejar de comprar, tenés que entender un montón de variables que inciden en ello: si te llamó al call center para quejarse, si te dejó de comprar, si no está usando el servicio, si consultó otros proveedores. Ya el mero proceso de analizar esas variables es un proceso rico, que es muy bueno para la organización, porque termina entendiendo en profundidad un problema específico a través de los datos. Muchas veces es generar un modelo para transformar esa realidad a datos e ir aprendiendo en el tiempo y haciendo que ese modelo se enriquezca. Y como hablamos de técnicas de machine learning, estos modelos van aprendiendo de la realidad que perciben. Por ejemplo, vos predecís una cantidad de ventas y después te topás con la realidad de cuánto vendiste. Esa cantidad se ingresa otra vez al modelo y este modelo va aprendiendo, y cada vez logra mayor precisión. Son modelos iterativos y puede haber varias etapas, donde cada etapa tiene un aprendizaje nuevo. Eso tiene sus tiempos, también mejorar la calidad de los datos tiene su tiempo, así como entrenar a la gente para leer los resultados.


“El mero proceso de analizar las variables que intervienen en un problema es un proceso rico, que es muy bueno para la organización, porque termina entendiendo en profundidad un problema específico a través de los datos”.

¿Cuáles son los talentos que están sumando en RockingData?
Estamos creciendo y estamos buscando gente también. Este último año y medio fue de armar estructura; no teníamos equipo de marketing, de administración, de ventas; estamos buscando una persona para que trabaje en ventas. Ya ingresó gente, pero queremos seguir creciendo para poder vender en Latinoamérica. Hoy vendimos algunos proyectos en Perú, Panamá, España, pero queremos crecer fuerte en este año y el que viene. Así que vamos a tomar gente para comercial, ventas y también los talentos más técnicos. Tenemos varias búsquedas, una es científico de datos, que es el rol más conocido en este mundo, que son quienes crean los modelos predictivos, los desarrollan y programan. También un rol que no es tan conocido, el de ingeniero de datos, que trabaja con la mejora de la calidad de los datos y la preparación de los datos para que los científicos y analistas de datos los puedan usar. 

¿Cuáles son los obstáculos para trabajar con data? ¿La inversión es uno de ellos?
Sí, es un problema la inversión, pero en realidad hay algo de fondo que es la priorización, porque generalmente las empresas no invierten en algo porque no ven el valor que tiene, no conocen los beneficios. Me parece que pasa más por ahí, porque hay empresas con presupuestos que usan para otras cosas. Por ejemplo, muchas empresas que venden productos y servicios hacen campañas de marketing, entonces las opciones son publicidad en distintos medios, mailings; pero si mandan mails y venden poco, pueden preguntarse cómo hacen para vender mejor. Podrían usar machine learning para entender los datos de sus clientes y hacer mejores recomendaciones que logran entre 30% y 40% más de conversión vía mail; pero en vez de hacer esas campañas, ponen más plata en medios más tradicionales. La inversión es una barrera, pero está relacionada con la priorización y el entendimiento. De todos modos, las empresas en Latinoamérica están empezando a invertir más. Es verdad que la mayor parte de nuestros clientes son grandes empresas, pero también estamos generando un producto dirigido a pymes, porque son casi el 97% de las empresas de Argentina. Reconocemos las diferencias, de presupuestos, de equipos, de profesionalización de ciertas prácticas, pero estamos metiéndonos más en eso.

En la búsqueda de patrones en el análisis de data, ¿recordás algún patrón que te haya llamado la atención?
Sí, muchos, pero, por ejemplo, me acuerdo un caso hace muchos años, de una empresa que hacía eventos de recitales y shows, donde analizamos datos de los últimos eventos para hacer predicciones para el próximo que se iba a hacer. Mirando esos datos, empezamos a analizar de dónde venía la gente que había comprado los tickets online, había mucha gente que venía del interior y aparecían patrones como que compraban determinado tipo de ticket, con determinada anticipación, compras para salidas grupales. Entonces empezás a perfilar al consumidor y, a partir de esos insights, podés crear nuevos productos. Les podían ofrecer una combi para llegar, un hotel, un producto nuevo en función de lo que se detectó en los datos que les podía servir. Hay un concepto que se llama “contactabilidad”, que es la relación entre el cliente y la empresa. A veces sentimos que nos mandan un montón de mails, entonces la data lo que te puede permitir es, entendiendo que cada cliente es único, diseñar un algoritmo de recomendación para un segmento específico.


“La inversión es una barrera, pero está más relacionada con la priorización y el entendimiento”.

Además de la predicción, ¿qué otros usos tiene el machine learning?
Machine learning tiene dos usos: uno que es para hacer modelos predictivos y otro que es para agrupar elementos. Agrupar elementos es el ejemplo de la segmentación. Sos una cadena de farmacias, tenés 100 farmacias en todo el país, no son todas iguales. Entonces, si querés formar grupos, al machine learning le pasás todos los datos que tenés sobre cada sucursal y con eso se arma una segmentación automática. Te permite un entendimiento de grupos de elementos, que pueden ser farmacias, escuelas, bares, clientes. Los modelos predictivos, por otro lado, pueden servir para predecir la probabilidad de que determinada transacción sea fraudulenta, por ejemplo, con tarjetas de crédito. También pueden ser modelos de predicción de demanda de un producto, de pricing optimization, dar el descuento a cada persona en función de lo que se necesite. Este uso de machine learning está ya en todas las industrias.

¿Por qué decidiste escribir un libro?
Vengo desde hace bastante con ese tema; muchas veces en las charlas y conferencias que doy me preguntan recomendaciones de libros y hace como tres años ya vengo pensándolo. Yo soy Ingeniero, pero estudié cuatro años periodismo, casi toda la carrera, y escribí muchos artículos. En un momento vi que estaba la posibilidad de hacer el libro. Hablé con un par de editoriales y les gustó la idea. Quería hacer un libro que tuviera facilidad de lectura, que fuera entretenido, que no fuera el clásico libro de datos, sino que se abriera también a gente que no conoce el tema, jóvenes que están decidiendo carreras universitarias o gente más grande que se quiere reconvertir en el rol. Busca ser una forma sencilla de hacer los primeros pasos en el mundo de la inteligencia artificial y de la ciencia de datos.

Adriana Lazzeretti


¿Utilizás terapias alternativas?
No, nunca hice nada, pero no tengo problema en empezar a experimentar. Son cosas interesantes.

¿Cuál es el estilo de decoración que te gusta?
Si tuviese dinero infinito y pudiera decidir sobre todo, haría una construcción muy futurista, como en los diseños de los 60, eso me parece alucinante; los espacios amplios, materiales como hierro, cemento alisado, grises. También me gusta el estilo alemán, también futurista.

Dentro de los dispositivos tecnológicos, ¿con cuál sentís más afinidad?
Me gustan todos; uso computadoras desde los 12 años, es mi herramienta de trabajo, de estudio. La laptop para mí es lo más importante que uso todos los días, me permite hacer todo lo que necesito para mi trabajo, por eso me gusta tener buenas computadoras, que funcionen rápido y tengan todo lo que necesito; así que si tuviera que elegir un dispositivo, elijo una laptop buena.