Tooling

2024
tidymodels
mlr3
MLJ
scikit-learn
Author

José Luis Cañadas Reche

Published

December 29, 2024

Listening

Forma, contenido, tooling.

Me comentaba el otro día mi amigo Mario, que por culpa del “tooling” en lo que antes tardaba 2 horas ahora se tira 2 semanas.

¿A qué me refiero con esto del “tooling”? Pues a lo que he comentado muchas veces, unas por aquí y otras hablando con amigos, a que se le de más importancia al cómo que al qué y al para qué. Por supuesto que el cómo se hagan las cosas es importante, para mí, las cosas se han de hacer bien, de forma sencilla y con “filosofía Unix”.

Lo de la filosofía UNIX es algo muy simple, haz software que haga una sola cosa pero que la haga bien. También se podría decir aquello del principio KISS (Keep It Simple Stupid).

En el mundo del análisis de datos hay algunas herramientas que están muy bien hechas y que cumplen ese criterio de Keep It Simple y el de modularidad e ir juntando unas piezas con otras. Ya sea a través de programación orientada a objetos bien hecha o de paradigmas funcionales componiendo operaciones.

En mi opinión, en vez de intentar crear un megasoftware, nos iría mejor usando lo que ya otros han desarrollado con buen criterio, y así centrarnos en lo verdaderamente importante. Os dejo por aquí algunos enlaces

  • MLJ. Framework en Julia para Machine Learning. a mi me gusta bastante
  • Tidymodels. Muy limpio y funcional, útil para centrarse en lo que importa
  • Mlr3. Desarrollado con paradigma OOP. Implementa flujos más complejos que otros y al usar como estructura de datos los data.table funciona muy bien y rápido
  • scikit-lean. Un estándard en muchos sitios, aunque a mi parecer le falta integrar mejor algunas transformaciones.

En fin, lo que quería decir no lo puedo decir, así es la vida. Pero por favor, centrémonos en qué quiero hacre y para qué, del cómo ya hay muchas herramientas maduras que nos facilitan la vida, no nos compliquemos inútilmente.