Que vérifier sur un livre d'apprentissage automatique Python avant de l'acheter
Avec autant de livres sur l'apprentissage automatique Python, faire un choix devient de plus en plus difficile. Vous investissez à la fois votre temps et votre argent pour apprendre quelque chose qui peut vous ouvrir de nouvelles perspectives de carrière. Ce serait une déception d’arriver à mi-parcours d’un livre d’apprentissage automatique de 700 pages pour se rendre compte que ce n’est pas pour vous. le volume est unique en soi. Et avec autant de livres ayant des titres similaires, le choix peut prêter à confusion, surtout si vous êtes au début de votre parcours d'apprentissage automatique.
Voici trois choses qui vous aideront à mieux évaluer un livre d'apprentissage automatique Python avant de l'acheter
Les prérequis
Chaque livre sur la programmation a une section dans la préface ou l'intro où les auteurs décrivent le public cible du livre. Cette partie est généralement intitulée «conditions préalables» ou «qui doit lire ce livre». Si vous êtes dans une librairie, prenez le livre et passez à cette section. Si vous achetez en ligne, Amazon et d'autres boutiques en ligne vous permettent d'afficher les premières pages du livre, y compris la section sur les prérequis.
Voici quelques éléments qui méritent d'être recherchés dans la section des prérequis:
- Compétences Python: certains livres utilisent des extraits de code simples juste pour prouver un concept, tandis que d'autres utilisent des fonctionnalités avancées de Python telles que la compréhension de liste, le découpage, avec instructions le déballage des paramètres, etc. . S'il n'est pas juste de s'attendre à ce que le livre crée une liste complète de toutes les techniques qu'il utilisera, il devrait au moins mentionner le niveau de compétences dont vous avez besoin. (La plupart des livres d'apprentissage automatique supposent que vous avez une compréhension de base de la science des données et de Python.)
- Bibliothèques Python: les livres d'apprentissage automatique Python utilisent généralement ScikitLearn (et parfois SciPy) pour implémenter des algorithmes. Livres sur apprentissage en profondeur couverture TensorFlow, Keras et PyTorch. Mais ces livres utilisent également des bibliothèques scientifiques telles que Numpy, Pandas et Matplotlib pour charger et manipuler des données. Certains livres couvriront ces bibliothèques tandis que d'autres vous diront que vous devriez déjà en avoir l'expérience. (Pour être clair, ces bibliothèques ont des livres dédiés qui s'étendent sur plusieurs centaines de pages.)
- Outils Python: La plupart des développeurs de machine learning Python préfèrent Jupyter Notebook, une interface Web qui vous permet de coder et de tester vos algorithmes en un seul endroit et d'enregistrer les résultats au format HTML. Si un livre utilise Jupyter, il doit indiquer s'il vous guidera à travers l'installation et la configuration.
- Compétences mathématiques: Sous le capot, l'apprentissage automatique implique une grande quantité d'algèbre linéaire, de calcul, et statistiques . Certains livres tenteront de décrire la mécanique des algorithmes d'apprentissage automatique à travers des descriptions conceptuelles et des dessins. D'autres ne feront que répéter les équations mathématiques et vous permettront de le comprendre par vous-même (et certains livres essaieront de combler le fossé entre les deux avec une description étape par étape des algorithmes). La plupart des livres vous indiquent les compétences en mathématiques dont vous avez besoin pour lire le livre.
Exemple de section sur les prérequis d'un livre d'apprentissage automatique Python
Si un livre n'énonce pas clairement les exigences, ne vous inquiétez pas. Nous avons d'autres moyens de le savoir.
La table des matières
Un coup d'œil à la table des matières vous donnera une bonne idée de la profondeur à laquelle elle va dans différents domaines de l'apprentissage automatique et des bibliothèques Python. La plupart des librairies en ligne vous permettent de consulter la table des matières avant d'acheter le livre. La table des matières vous aidera à combler certaines lacunes si la section des prérequis n'indique pas explicitement ce que vous devez savoir avant de lire le livre.
Voici quelques éléments à rechercher dans la table des matières: [19659008] Notions de base: chaque livre sur l'apprentissage automatique commence par les bases. Les livres avancés ont tendance à parcourir cette partie et à la résumer en un seul chapitre. Les livres pour débutants consacrent généralement plusieurs chapitres à discuter des bases de l'apprentissage automatique, des mathématiques, du prétraitement des données et des types de données, ainsi que du pipeline d'apprentissage automatique. clustering) et des concepts de haut niveau (apprentissage supervisé vs non supervisé, apprentissage d'ensemble, réglage des hyperparamètres, réduction de la dimensionnalité). Les livres avancés ont généralement des chapitres plus granulaires sur des types d'algorithmes spécifiques (support des machines vectorielles, arbres de décision, analyse des composants principaux, différentes méthodes de clustering, etc.)
Les livres d'introduction contiennent des chapitres qui expliquent les bibliothèques Python de base utilisées en science des données et ML tâches (Source: Principles of Data Science)
Début r et les livres intermédiaires fournissent une vue de haut niveau de l'ensemble du pipeline d'apprentissage automatique avec un exemple de bout en bout. (Source: Apprentissage automatique pratique avec Scikit-Learn, Keras et TensorFlow: concepts, outils et techniques pour créer des systèmes intelligents, 2e édition)
- Extras: jetez un œil aux derniers chapitres et annexes. C'est ici que vous trouverez quelques-uns des joyaux uniques que le livre a à offrir, tels que des actualisations mathématiques et Python, l'utilisation de services d'hébergement cloud et une introduction aux plates-formes Big Data telles que Hadoop et Apache Spark. L'utilisation de plates-formes cloud et de grands magasins de données offre des volumes pédagogiques complets, mais les connaissances fournies dans ces livres peuvent vous indiquer où regarder ensuite dans votre exploration de l'apprentissage automatique.
The code repo
un livre d'apprentissage automatique par sa couverture, d'après mon expérience, ses exemples de code en disent long sur la qualité du livre et son public cible. La plupart des livres d'apprentissage automatique Python sont accompagnés d'un référentiel GitHub, où vous pouvez accéder aux exemples de code. L'adresse du référentiel est généralement écrite dans l'introduction du livre, mais vous pouvez également la trouver en recherchant sur Google le titre du livre avec GitHub.
Le GitHub officiel du livre est généralement classé sous le profil de l'auteur du livre ou de l'éditeur . Assurez-vous de ne pas atterrir sur de faux dépôts.
La plupart des livres d'apprentissage automatique ont un référentiel GitHub qui peut être trouvé via la recherche Google.
Les référentiels GitHub des livres d'apprentissage automatique Python ont des structures différentes. En général, vous devriez voir un dossier pour les blocs-notes et les exemples de code de chaque chapitre, et des dossiers séparés pour les éléments tels que les ensembles de données et les images.
Ouvrez l'un des dossiers de chapitre et examinez son contenu. Voici quelques éléments qui peuvent déterminer la qualité du code:
- Format: le livre fournit-il ses exemples au format Jupyter Notebook ou de simples fichiers de code Python? Les notebooks Jupyter offrent une expérience beaucoup plus riche. Même si vous n'exécutez pas le code, ils vous montrent les résultats des expériences (valeurs, graphiques de tracé, etc.) si les auteurs les ont exécutés avant de les télécharger.
- Détail: Jupyter permet également d'ajouter du non-code information. Les bons livres utilisent généralement les fonctionnalités de Jupyter pour ajouter des détails tels que des instructions de configuration, des sous-titres et d'autres informations qui vous aident à corréler chaque bloc de code à sa place correspondante dans le livre.
- Commentaires: Je ne m'attends pas à ce que les exemples de code d'un livre soient commenté en détail, mais il devrait y avoir au moins quelques commentaires minimaux qui montrent les étapes de base de l'expérience. La plupart des fichiers de code incluent également des lignes qui ont été omises dans le livre par souci de concision. Les bons livres marquent généralement ces sections dans les commentaires.
Bon les exemples de code doivent contenir des commentaires décrivant les étapes de chaque expérience (Source: Machine Learning Algorithms, Second Edition)
Outre la qualité, les fichiers de code fournissent de bons indices sur l'audience du livre au cas où la section des prérequis ne le ferait pas. t fournir suffisamment d'informations:
- L'examen du contenu d'un ou deux fichiers d'exemple de code devrait déterminer le type de compétences Python dont vous avez besoin. Si vous voyez des éléments tels que l'héritage de classe, la surcharge d'opérateurs, le déballage des paramètres et la compréhension de listes imbriquées, les auteurs supposent probablement que vous êtes un codeur Python chevronné. D'autres livres évitent les constructions avancées pour le rendre accessible à un public plus large.
- Regardez quelques exemples que le livre explore. Certains livres utilisent les prix des logements, les ventes des clients et d'autres données du monde réel pour décrire les algorithmes d'apprentissage automatique. Ces exemples sont généralement plus accessibles au public débutant car ils sont directement liés à une situation réelle. Ils s'appuient généralement sur ces exemples dans un ou plusieurs blocs-notes et chapitres Jupyter pour vous aider à comprendre le pipeline d'apprentissage automatique. Les livres de niveau intermédiaire utilisent des ensembles de données de référence tels que CIFAR, MNIST, Iris ou des données sur le vin. Ce sont des ensembles de données légers qui peuvent aider à comprendre l'importance des différentes configurations et hyperparamètres, mais qui ne sont pas très bons pour les exemples de bout en bout. D'autres livres peuvent utiliser des fonctions de générateur d'ensembles de données dans les bibliothèques Python telles que make_blobs, make_circles et make_classification qui n'ont aucune valeur conceptuelle mais sont utiles pour montrer comment fonctionnent les algorithmes.
Fonctions du générateur comme make_blob, créez des ensembles de données qui sont bons pour tester les algorithmes d'apprentissage automatique, mais ne fournissent pas de contexte réel
Réflexions finales
Pas de livre unique pour faire de vous un maître de l'apprentissage automatique Python. Mais j'espère que ces conseils vous aideront à tirer le meilleur parti de votre temps et de votre argent et à vous familiariser facilement avec l'apprentissage automatique.
Tout cela étant dit, voici quelques recommandations basées sur ce que nous avons déjà examiné:
] Cet article a été initialement publié par Ben Dickson sur TechTalks une publication qui examine les tendances de la technologie, comment elles affectent la façon dont nous vivons et faisons des affaires, et les problèmes qu'elles résolvent. Mais nous discutons également du côté pervers de la technologie, des implications plus sombres des nouvelles technologies et de ce que nous devons surveiller. Vous pouvez lire l'article original ici .
Publié le 8 novembre 2020 – 09:00 UTC
Source link