Fermer

pandas

De 48 heures à 6 minutes: mon voyage Optimisant un processus de réconciliation des pandas pour les données à grande échelle

De 48 heures à 6 minutes: mon voyage Optimisant un processus de réconciliation des pandas pour les données à grande échelle

Introduction J’ai récemment traversé une conduite sauvage mais gratifiante pour optimiser un flux de travail de réconciliation basé sur les pandas. Ce qui a commencé comme un morceau de code lent et maladroit mangeant 48 heuresa fini par être poli dans un maigre et méchant 6 minutes machine.Je voulais partager […]

Lire

Les koalas sont meilleurs que les pandas (sur Spark)

J'aide les entreprises à créer, gérer et, espérons-le, à tirer parti des grands magasins de données. Ou du moins, j'essaie. Afin de tirer parti de ces magasins de données à l'échelle du pétaoctet, j'ai besoin que les scientifiques des données puissent facilement appliquer leurs connaissances statistiques et du domaine. Il […]

Lire