La reconnaissance vocale avec Python<span class="wtr-time-wrap after-title"><span class="wtr-time-number">4</span> min read</span>
python reconnaissance vocale google

La reconnaissance vocale avec Python4 min read

La reconnaissance vocale avec Python

La reconnaissance vocale gagne en popularité d’année en année. C’est une technologie qui permet de faire gagner beaucoup de temps à l’utilisateur en plus de lui apporter du confort.

Python est un langage de programmation particulièrement adapté à la reconnaissance vocale. On peut facilement mettre en place des systèmes qui vont comprendre ce que l’utilisateur va dire et donc réagir à ses demandes.

Dans le domaine de la reconnaissance vocale il existe deux solutions. Vous pouvez programmer vous-mêmes un système qui va comprendre ce que l’utilisateur dit ou vous pouvez vous baser un système qui existe déjà et qui est performant.

Dans ce tutoriel nous allons choisir la deuxième solution et utiliser la solution de google appelée “Google Speech API”. C’est actuellement la solution la plus utilisée et la plus performante.

L’installation

Vous vous en douterez, on va devoir installer quelques petites librairies afin que tout fonctionne. Voici les commandes pour chaque système d’exploitation :

Pour Linux / MacOS

sudo apt-get install python-pyaudio python3-pyaudio 
pip install SpeechRecognition

Pour Windows

pip install PyAudio
pip install SpeechRecognition

PyAudio est une librairie qui permet à python de communiquer avec les ports audio de votre machine. Cette librairie permet de jouer et d’enregistrer de l’audio très facilement.

SpeechRecognition permet de lancer les opérations de reconnaissance vocale. Cette librairie supporte plusieurs systèmes de reconnaissance et est facile à utiliser.

Un programme de reconnaissance vocale avec Python

import speech_recognition as sr  

r  = sr.Recognizer()
with sr.Microphone() as source:
    print("Dites quelque chose")
    audio = r.listen(source)
try:
    text = r.recognize_google(audio)
    print("Vous avez dit : " + text)
except sr.UnknownValueError:
    print("L'audio n'as pas été compris")
except sr.RequestError as e:
    print("Le service Google Speech API ne fonctionne plus" + format(e))

Ce programme renvoi :

Dites quelque chose

Vous avez dit : Bonjour tout le monde

Le programme capte donc ce que l’utilisateur dit et le retranscrit bien à l’écrit. Une fois cette logique implémentée, il est facile de créer des conditions pour réagir à certaines commandes vocales.

Analysons maintenant ce code afin de mieux comprendre comment il fonctionne :

D’abord, on importe le package speech_recognition en lui donnant l’alias sr . Puis, on crée un objet provenant de la class Recognizer. On utilise la méthode listen() sur cette classe pour écouter le micro et la méthode recognize_google() pour envoyer l’enregistrement à google.

La classe Microphone permets d’ouvrir le micro et de commencer le protocole d’écoute.

La méthode listen() écoute la phrase de l’utilisateur et va l’extraire dans un objet contenant les données.

Ensuite, on passe l’objet renvoyé par listen() dans la fonction recognize_google(). On utilise try – except afin de gérer les potentielles erreurs et d’éviter un crash de programme.

Vous vous en douterez , ce programme nécessite une connexion internet pour fonctionner.

En conclusion

J’espère que ce programme vous aura permis de comprendre comment utiliser les fonctionnalités de reconnaissance vocale offerte par Python.

Si cet article vous as plu, vous pouvez vous abonner à ma newsletter pour recevoir le guide GRATUIT Ultime pour bien débuter la programmation

Sinon, vous pouvez aussi checker ma formation pour apprendre python https://www.udemy.com/apprendre-le-langage-python/ 🙂

Vous abonner à notre newsletter

* champ requis

J’espère vous revoir bientôt sur mon site !

Laisser un commentaire

Fermer le menu
×
×

Panier