Fermer

janvier 30, 2019

Le «scientifique des données» est-il le «métier le plus sexy du XXIe siècle»? Et comment obtenez-vous l'un des vôtres?


Même si vous n’êtes pas familiarisé avec l’analyse avancée et la science des données, vous pouvez comprendre le processus de pensée auquel les scientifiques de données sont soumis.


8 min de lecture

Les opinions exprimées par les contributeurs de l'Entrepreneur sont les leurs.


Lorsque vous entendez le mot " data scientist ", que signifie ce terme pour vous?

S'agit-il du " travail le plus sexy " du XXIe siècle comme La Harvard Business Review a suggéré? Décrit-il une personne très intelligente possédant des diplômes avancés en informatique, en mathématiques appliquées, en statistique, en économie? Quelqu'un qui analyse et extrait la valeur commerciale du Big Data?

Lié: Vous pensez que votre entreprise a besoin d'un scientifique de données? Vous êtes probablement en erreur.

Un scientifique des données peut présenter toutes ces choses et bien plus. Ce type de professionnel recherche des modèles et des tendances dans de grands ensembles de données, en utilisant une variété d’outils, de techniques et de pensée critique pour trouver des solutions pratiques à des problèmes réels liés aux données .

Selon Hugo Bowne Andersen in HBR, «Les scientifiques utilisent des expériences en ligne, entre autres méthodes, pour parvenir à une croissance durable. Ils nettoient, préparent et valident également des données structurées et non structurées pour construire des pipelines d’apprentissage automatique et des produits de données personnalisés afin de mieux comprendre leurs activités et leurs clients et de prendre de meilleures décisions. "

Maintenant, même si vous ne le saviez pas N'allez pas à l'école dans l'analyse avancée et la science des données, comprendre le processus de pensée des scientifiques de données peut aider votre jeune startup à comprendre ce que font exactement ces professionnels:

Les scientifiques de données posent de bonnes questions.

N'importe quelle donnée projet scientifique aura un ensemble d'attentes sur les résultats attendus, les objectifs, les résultats, la durée, etc. Et, comme l'a souligné James Le dans l'article de Medium « Comment penser comme un scientifique des données dans 12 Steps "un moyen utile de mieux comprendre les attentes d'une personne consiste à poser de bonnes questions.

" Les bonnes questions sont concrètes dans leurs hypothèses, et de bonnes réponses constituent un succès mesurable, sans trop de coûts. , "Le a écrit. Améliorer votre compétence dans poser de bonnes questions est utile dans toute situation de travail. Cela peut aider votre démarrage à un stade précoce si vous êtes sur le point de devenir plus axé sur les données. Mark Schindler a expliqué sur TowardsDataScience.com comment « créer un paysage de questions » peut être utile pour créer une stratégie de données ; il a suggéré de classer vos questions en trois catégories:

  • À quelles questions pouvez-vous répondre maintenant?
  • À quelles questions pouvez-vous répondre si vous avez un peu creusé avec vos données actuelles?
  • À quelles questions ne pouvez-vous pas répondre car vous n'avez pas encore les données?

Schindler a proposé des exemples de questions pour chaque catégorie:

  • «Combien de téléchargements avez-vous eu au cours des 30 derniers jours?» pourrait entrer dans la première catégorie.
  • les données démographiques de vos utilisateurs les plus fréquents au cours des 30 derniers jours? "pourrait tomber dans la seconde.
  • Et" Quelle est la durée moyenne de session de votre quartile supérieur et inférieur? "peut tomber dans le troisième.
  • 19659018] Cet exercice utile vous aide à comprendre certains éléments de votre entreprise et de vos données auxquels vous pouvez répondre. Il vous orientera peut-être sur l'orientation (une feuille de route des données ) de nouvelles questions ou de scénarios hypothétiques qui ne sont pas encore connus. être prouvé ou connu que vous souhaitez explorer

    Les scientifiques de données comprennent comment identifier les sources de données et leur valeur.

    Bill Schmarzo, Le CTO de la pratique du Big Data chez Dell EMC a créé un livre blanc de 28 pages, . Guide de travail de Think Like a Data Scientist . Dans ce document, il a exploré le processus de la pensée scientifique utilisant l'utilisation de l'analyse prédictive et de l'analyse normative pour trouver les bonnes réponses afin qu'une entreprise puisse atteindre ses objectifs.

    Lié: 3 façons Les entrepreneurs craintifs peuvent garder les scientifiques de données à bord et les motiver

    J'ai particulièrement aimé la section intitulée «Identifier les sources de données», qui explique qu'au cours de l'exercice en huit étapes du cahier d'exercices, le lecteur trouvera toutes sortes de nouvelles Les sources de données qui «pourraient» apporter de la valeur en ce qui concerne: 1) l’initiative commerciale ciblée (augmentation des ventes, du chiffre d’affaires, du trafic sur le site Web, des conversions, etc.), et: 2) les principales décisions commerciales auxquelles il souhaite répondre. Selon le livre blanc, les sources de données probables sont les suivantes:

    • Données historiques sur les systèmes opérationnels et transactionnels (ERP, finances, ressources humaines, chaîne logistique, automatisation de la force de vente et marketing, pour lesquelles des données sont capturées, mais ne sont probablement pas disponibles sur des plateformes facilement accessibles.
    • Sources de données internes non structurées telles que conversations par courrier électronique, commentaires de consommateurs, études cliniques, documents de recherche et notes d'interactions entre employés et clients.
    • Sources de données externes, y compris médias sociaux, fils d'actualités, météo, trafic, données économiques, documents de recherche, livres blancs et données du domaine public émanant d'institutions gouvernementales et collégiales (comme le classeur Think Like a Scientist).

    Dans le classeur, Chipotle est un exemple fréquent. Les sources de données de Chipotle pourraient consister en: transactions de points de vente, market pankets Product Master, données démographiques des magasins et ventes des magasins concurrents, notes de directeur de magasin, données démographiques des employés, commentaires des consommateurs, Yelp, Zillow / Realtor .com, Twitter / Facebook / Instagram et plus encore

    Une fois que vous avez identifié une variété de sources de données, vous devez ensuite évaluer la valeur commerciale que chaque source apporte pour appuyer certaines décisions commerciales clés. Vous pouvez configurer une feuille de calcul et tracer les sources de données sous forme d'en-têtes de lignes dans la première colonne verticale, puis tracer les décisions clés en tant qu'en-têtes de colonnes horizontales dans la première ligne. Dans l'exemple avec Chipotle, certaines des décisions commerciales étaient les suivantes:

    • Augmentation du trafic dans les magasins
    • Augmentation des revenus du panier
    • Augmentation de l'efficacité de la promotion

    Vous pouvez le faire vous-même en posant des questions d'utilisation pertinentes en rapport avec: votre secteur d'activité et votre startup.

    Quelques conseils utiles pour l'embauche de votre premier informaticien.

    Si vous êtes une startup ou un commerce qui cherchent à s'étendre dans le monde du Big Data et de l'apprentissage automatique, ne vous laissez pas distancer de la concurrence, il est peut-être temps d'embaucher votre premier ingénieur spécialiste des données . L'embauche pour ce rôle peut être plus complexe qu'un développeur de logiciels, par exemple. Shourjya Sanyal, collaborateur de Forbes a récemment écrit, dans un article intitulé " Comment embaucher votre premier expert en données ", que cette tâche est plus complexe car:

    • Il est difficile de rédiger une description de poste pour un rôle de scientifique de données.
    • Un grand nombre de scientifiques de données peuvent accepter de postuler, mais peu d’entre eux possèdent l’expérience requise.
    • Peu de normes et de points de repère de l’industrie sont disponibles.

    M. Shourjya a suggéré des questions Par exemple, si vous construisez un produit ou une application de données, engager un scientifique directement dans le monde universitaire et dans des laboratoires de recherche apparentés risque de ne pas vous donner "l'expérience en matière de génie logiciel, ainsi que l'expérience de gestion" nécessaires pour: hiérarchisez les tâches et optimisez la valeur de votre entreprise.

    Bien sûr, il y a toujours l'exemple d'Uber qui a embauché un vice-président de la science des données sur Twitter . Les pipelines de données build peuvent également être utiles pour le lancement de produits pilotés par les données . Shourjya a également évoqué la question du portefeuille d’un candidat et, s’il incluait un projet d’équipe, ce que le candidat avait fait pour contribuer.

    En général, vous devez définir les besoins de votre entreprise pour votre première embauche. Dans "L'art de recruter des scientifiques de données", de Sara Sara spécialiste des données chez Insightly, écrivait: "Si vous souhaitez créer un ciblage publicitaire ou Si les moteurs de recommandation ou [to] suivent une formation algorithmique, vous voudrez alors chercher un candidat ayant une solide formation en mathématiques et en informatique. "

    Rappelez-vous que le domaine de la science des données est relativement nouveau et est souvent classé sous un ensemble de compétences différentes mais qui se chevauchent, telles que l'exploration de données, l'ingénierie de données la préparation de données, l'intelligence artificielle, l'apprentissage automatique, l'analyse, le big data, les statistiques ou même la visualisation de données.

    vous avez besoin d'un informaticien qui rendra compte aux responsables de l'état de votre produit, de la croissance ou de la croissance de la fréquentation, puis il est utile de trouver un article intitulé « data storytelling ». Brent Dukes, collaborateur de Forbes a décrit ce type de travail comme "une approche structurée de la communication d'informations basées sur les données, combinant trois éléments clés: des données, des éléments visuels et une description globale de ce qui se passe".

    Et, comme Vera a écrit, ces types de scientifiques de données peuvent provenir de « formations universitaires en sciences sociales car, dans le domaine médical, par exemple, la sociologie, l'économie ou la géographie les y habituent déjà avec leurs données.

    Liés: Les entreprises des cinq professionnels de l'IA doivent réussir en 2019

    Une fois que vous avez fait plus de recherches sur les besoins de votre entreprise, vous pouvez prendre une décision de recrutement plus éclairée. sur qui votre premier informaticien devrait-il être embauché. Votre incursion dans la compréhension des forces – et des faiblesses – des langages de programmation d'ingénierie et informatiques de ce professionnel peut vous aider à établir une feuille de route pour l'embauche afin de former une équipe complète de spécialistes des données informatiques.




Source link