Fermer

juillet 31, 2025

Reconnaissance vocale personnalisée dans l’application Roku à l’aide de Google Speech dans la bibliothèque de texte

Reconnaissance vocale personnalisée dans l’application Roku à l’aide de Google Speech dans la bibliothèque de texte


Roku fournit une bibliothèque qui prend en charge les commandes vocales de base, telles que «Play», «Pause», «Next» et «Fast Forward», Roku fournit également un clavier intégré à la recherche vocale. Cependant, nous ne pouvons pas intégrer les commandes vocales personnalisées directement à partir de la bibliothèque vocale de Roku. Grâce à cet article, nous couvrirons comment intégrer les commandes vocales personnalisées dans un canal Roku en utilisant le composant «Romicrophone» et une bibliothèque de reconnaissance vocale tierce, comme l’API Google Speech-to-Text.

Pour utiliser le service de reconnaissance vocale, l’appareil Roku doit être exécuté sur OS 7.6 ou version ultérieure.

  1. Connaissance du développement d’applications Roku à l’aide de BrightScript / SceneGraph.
  2. Compte Google Cloud avec facturation activé.
  3. Appareil Roku avec mode développeur activé et avait la version 7.6 du système d’exploitation ou version ultérieure.

L’intégration de la commande vocale personnalisée sera effectuée en 2 étapes principales.

  1. Configuration de l’API Speech-the Text Google Cloud.
  2. Configuration du code de canal Roku.

Configuration de l’API Google Speech-to-Text

  1. Premièrement, nous devons créer un Compte de cloud Google. Connectez-vous à la console Google Cloud et activez la facturation.
  2. Créez un nouveau projet, donnez un nom selon votre préférence.
  3. Ouvrez l’API «API et SERVICES» et sélectionnez l’API Speech-to-Text ».
  4. Cliquez sur le bouton «Activer» pour activer l’API Speech-to-Text.
  5. Créer un Clé API.
Commande vocale personnalisée dans Roku

Console Cloud Google

Discours de cloud au texte

Discours de cloud au texte

Configuration du code

  1. Créez un composant personnalisé (qui est responsable de l’écoute et du retour du texte) nommé comme VoiceRecognnizer.xml
  2. Créez un objet «Romicrophone» pour accéder au micro de Roku Remote.
  3. Pour utiliser le microphone, nous devons d’abord régler le port à l’aide du SetMessageport(port) Fonction.
  4. Après cela, nous pouvons initier l’enregistrement à l’aide du microphone de Roku en utilisant le Record de départ() fonction.
  5. Maintenant, nous devons créer l’objet «RobyTearray» pour stocker les données audio dans les octets.
  6. Capturez les événements de microphone pour obtenir les données audio.
    • while true 
           micEvent = wait(0, port)
           if micEvent.IsRecordingInfo() 'when startRecording() function calls this event loop triggers
       
                info = micEvent.GetInfo()
       
                audioBytes.append(info.sample_data)
       
           else 
                exit while
       
           end if
       
      end while
  7. Maintenant, nous avons les données audio dans le bytearray, nous devons convertir ce bytearray en une base64string.
  8. Créez le corps de demande et les en-têtes pour appeler l’API.
    • têtes
    • corps
      • {
        "audio": {
             "content": audioData
        },
        
        "config": {
        
            "enableAutomaticPunctuation": true, 
        
            "encoding": "LINEAR16",
        
            "languageCode": "en-US", 
        
            "sampleRateHertz": 16000
        }
        }
  9. Créez maintenant un objet RourlTransfer et envoyez ces données à Google Speech à la bibliothèque de texte via ce qui est ci-dessous API.
  10. Créez une fonction d’observateur qui observe la réponse de l’appel API. Dans notre cas, la fonction d’observateur est mélanger().
  11. M.SspeechText est le texte de cette commande audio que nous donnons en utilisant le microphone du Roku.
  12. Maintenant, via ce m.speechText, nous pouvons effectuer les actions de notre application. Par exemple, si l’utilisateur disait «achetez cette commande» et que nous gérons la vérification de ce texte, nous pouvons effectuer l’événement Action onClick (Buttonsered) du bouton «Acheter maintenant».

La fonction de reconnaissance vocale personnalisée permet de faciliter l’expérience utilisateur, l’utilisateur peut effectuer plusieurs actions via sa voix, ces actions aident à faire de la navigation mains libres, de l’accessibilité et bien d’autres. Bien que Roku ne prenne pas en charge les commandes vocales personnalisées via sa bibliothèque vocale au-delà des commandes vocales de base, cette approche hybride combinant l’entrée de microphone de Roku avec des ponts de transcription basés sur le cloud qui écartent efficacement.

Vous avez trouvé cela utile? PARTAGEZ-LE






Source link