Fermer

novembre 8, 2018

Interrogation de données externes dans Hive à l'aide du gestionnaire de stockage JDBC

Tutorial Querying External Data in Hive Using the JDBC Storage Handler_870x450


Il est maintenant plus facile que jamais de travailler avec des données externes dans Apache Hive. Découvrez comment vous pouvez connecter rapidement Hive à Salesforce avec Progress DataDirect.

Grâce à l'inclusion du gestionnaire de stockage JDBC, Hive facilite désormais l'accès à vos données et leur interrogation à partir de sources externes. Dans ce didacticiel, nous allons décrire la procédure de connexion de Hive à une instance Salesforce externe à l’aide du connecteur JDBC Progress DataDirect . .

Qu'est-ce qu'Apache Hive?

Apache Hive est l'un des entrepôts de données open source les plus populaires actuellement utilisés. Conçu pour résister aux forces volumineuses de Hadoop et doté d'une interface de requête conviviale de type SQL, Hive est une ressource fantastique pour la gestion et l'analyse de grands ensembles de données. Les premiers utilisateurs de Hive incluent Facebook, Netflix et Amazon. S'il peut gérer la quantité de données créée par ces sociétés, il sera probablement également responsable de la vôtre.

Qu'est-ce que Apache Hive Storage Handler?

À partir de la version 2.3, Hive a introduit une nouvelle et puissante fonctionnalité appelée JDBC Storage Handler . Cette nouvelle fonctionnalité vous permet de connecter et d'interroger n'importe quelle source de données avec un connecteur JDBC. Cela devient extrêmement utile, car vous devrez invariablement gérer et analyser plus que ce qui se trouve dans votre entrepôt de données. Et bien que Hive ait toujours eu une capacité limitée de gestion des données externes (vs gérées), cette nouvelle mise à niveau le rend plus facile et plus transparent.

Utilisation du gestionnaire de stockage Apache Hive avec les pilotes JDBC Progress DataDirect

pour parler de cette nouvelle fonctionnalité du produit, mais il vaut mieux commencer à travailler avec elle! Ma collègue Saikrishna Bobba a réuni les instructions pour vous permettre de démarrer rapidement. Dans cet exemple, il vous expliquera comment connecter Apache Hive à votre instance Salesforce à l'aide du connecteur Progress DataDirect Salesforce JDBC .

Une fois que vous avez parcouru le processus, vous pourrez Utilisez ce processus pour connecter Hive à toute source externe pour laquelle vous disposez d'un connecteur JDBC . Commencez dès aujourd'hui avec un téléchargement d'essai gratuit de nos pilotes DataDirect JDBC et voyez quelles données vous pouvez importer dans Apache Hive!

Lisez le didacticiel Hive

Téléchargez un essai JDBC Aujourd'hui



Source link