Fermer

janvier 10, 2022

Quatre conseils pour résoudre des problèmes de science des données plus difficiles avec Jupyter Notebooks


Les blocs-notes Jupyter sont des outils polyvalents que les scientifiques des données peuvent utiliser à diverses fins. Dans cet article, nous explorerons quatre façons dont les notebooks Jupyter peuvent être utilisés pour améliorer votre flux de travail en science des données. Nous verrons comment les notebooks Jupyter peuvent être utilisés pour apprendre de nouveaux langages de programmation, documenter votre code, déboguer le code et créer des workflows reproductibles. Nous fournirons également des conseils sur la façon de tirer le meilleur parti des blocs-notes Jupyter.

Utilisez les blocs-notes Jupyter pour apprendre une nouvelle langue

Les blocs-notes Jupyter sont un outil utile. Ils peuvent être utilisés pour apprendre de nouvelles langues. Ils prennent en charge de nombreux langages, dont Python, R, Julia et Scala ! C'est bien car cela signifie qu'ils fonctionneront pour vous, quelle que soit la langue que vous souhaitez apprendre. Vous pouvez les utiliser pour écrire ou tester du code dans l'une de ces langues.

Utilisez Jupyter Notebooks pour documenter le code

Data Intelligence - The Future of Big Data
The Future of Big Data

Avec quelques conseils, vous pouvez créer une plate-forme de données adaptée aux besoins de votre organisation et tirer le meilleur parti de votre capital de données.

Obtenir le guide

Les commentaires peuvent expliquer ce qui se passe dans votre programme et pourquoi vous avez choisi une certaine méthode. Il peut être utile d'avoir des commentaires lorsque vous partagez votre code avec d'autres. Vous pouvez utiliser une cellule de démarque dans les blocs-notes Jupyter pour écrire du texte avec une mise en forme. Le texte est enregistré avec une extension HTML ou Markdown.

Code de débogage dans Jupyter Notebooks

Vous pouvez écrire et exécuter le code dans le notebook, ce qui peut vous aider à voir où il se décompose. Pour vous assurer que votre code s'exécute sans problème, ajoutez une cellule de sortie distincte pour chaque commande exécutée. Supprimez toutes les instructions de débogage du code et ne laissez que les parties que vous souhaitez utiliser.

Surveillez votre environnement d'exécution de code

L'option de menu « Kernel » dans le bloc-notes vous permet de visualiser l'activité du shell, comme les E/S requêtes et commandes système. Cela peut vous aider à voir si votre code devient trop lent ou utilise trop de mémoire.

Dans cet article, nous avons exploré les nombreuses façons dont les notebooks Jupyter peuvent être utilisés pour améliorer votre flux de travail en science des données. Nous espérons que ces conseils vous aideront à commencer à réfléchir à la façon dont vous pourriez les utiliser dans votre propre travail ou recherche. Si tout cela vous semble intimidant et que vous souhaitez savoir par où commencer, notre équipe est prête à s'associer à vous !

À propos de l'auteur <!– :   dcallaghan, Solutions Architect– ->

En tant qu'architecte de solutions chez Perficient, j'apporte vingt ans d'expérience en développement et je maîtrise actuellement Hadoop/Spark, blockchain et cloud, codage en Java, Scala et Go. Je suis certifié et travaille beaucoup avec Hadoop, Cassandra, Spark, AWS, MongoDB et Pentaho. Plus récemment, j'ai apporté des solutions de blockchain intégrées (en particulier Hyperledger et Ethereum) et de Big Data au cloud en mettant l'accent sur l'intégration de produits de données modernes tels que HBase, Cassandra et Neo4J en tant que référentiel hors blockchain. cet auteur




Source link