251 подписчик

Создание голосового бота на Python с использованием SpeechRecognition: Пошаговый гид

7 апреля 20257 апр 2025

5 мин

Привет, друзья! 👋 Когда-нибудь мечтали, чтобы ваш компьютер мог не только вас слушать, но и отвечать вам голосом? А может быть, вы хотите сделать бота, который будет понимать ваши голосовые команды? В этом случае вы попали по адресу! Сегодня мы научимся создавать голосового бота на Python с использованием библиотеки SpeechRecognition. Мы не просто сделаем бота, а научим его понимать, что вы говорите! 🔊 Всё будет пошагово, с реальным кодом, который мы разобьем на части, чтобы даже новичок мог легко разобраться. Готовы? Давайте начинать! Для начала нужно установить несколько библиотек. Откроем терминал или командную строку и выполним: pip install SpeechRecognition pyttsx3 pyaudio После установки этих библиотек можно переходить к следующему шагу! Чтобы наш бот мог вас слушать, нам нужно настроить микрофон. В Python для этого используется библиотека PyAudio. Однако на некоторых системах она может быть сложной для установки. Если у вас возникнут проблемы, вы можете посмотреть официальную

Оглавление

Шаг 1: Установка необходимых библиотек
Шаг 2: Настройка микрофона
Шаг 3: Код голосового бота

Привет, друзья! 👋

Когда-нибудь мечтали, чтобы ваш компьютер мог не только вас слушать, но и отвечать вам голосом? А может быть, вы хотите сделать бота, который будет понимать ваши голосовые команды? В этом случае вы попали по адресу! Сегодня мы научимся создавать голосового бота на Python с использованием библиотеки SpeechRecognition. Мы не просто сделаем бота, а научим его понимать, что вы говорите! 🔊

Всё будет пошагово, с реальным кодом, который мы разобьем на части, чтобы даже новичок мог легко разобраться. Готовы? Давайте начинать!

Шаг 1: Установка необходимых библиотек

Для начала нужно установить несколько библиотек. Откроем терминал или командную строку и выполним:

pip install SpeechRecognition pyttsx3 pyaudio

SpeechRecognition — основная библиотека для распознавания речи.
pyttsx3 — библиотека для синтеза речи, чтобы бот мог вам отвечать голосом.
pyaudio — библиотека для работы с микрофоном.

После установки этих библиотек можно переходить к следующему шагу!

Шаг 2: Настройка микрофона

Чтобы наш бот мог вас слушать, нам нужно настроить микрофон. В Python для этого используется библиотека PyAudio. Однако на некоторых системах она может быть сложной для установки. Если у вас возникнут проблемы, вы можете посмотреть официальную документацию или попробовать установить зависимости вручную.

Теперь давайте создадим файл, например, voice_bot.py, и начнем кодировать!

Шаг 3: Код голосового бота

# Импортируем необходимые библиотеки
import speech_recognition as sr # Для распознавания речи
import pyttsx3 # Для синтеза речи
import time # Для задержек

# Инициализация распознавателя речи
recognizer = sr.Recognizer() # Создаем объект для распознавания речи
engine = pyttsx3.init() # Инициализируем движок для озвучивания текста

# Функция для озвучивания текста
def speak(text):
engine.say(text) # Озвучиваем переданный текст
engine.runAndWait() # Ждем завершения озвучивания

# Функция для распознавания речи с микрофона
def listen():
with sr.Microphone() as source:
print("Слушаю...") # Информируем пользователя, что бот готов слушать
recognizer.adjust_for_ambient_noise(source) # Настройка под фоновый шум
audio = recognizer.listen(source) # Слушаем звук с микрофона
try:
print("Распознаю...") # Информируем, что бот пытается распознать речь
command = recognizer.recognize_google(audio, language='ru-RU') # Распознаем команду с помощью Google API
print(f"Вы сказали: {command}") # Показываем распознанный текст
return command.lower() # Возвращаем команду в нижнем регистре
except sr.UnknownValueError:
print("Не могу распознать команду. Попробуйте снова.") # Если не удалось распознать речь
speak("Не могу распознать команду. Попробуйте снова.") # Сообщаем пользователю
except sr.RequestError:
print("Ошибка подключения к серверу Google.") # Если не удалось подключиться к серверу
speak("Ошибка подключения к серверу Google.") # Сообщаем пользователю

# Основная функция бота
def main():
speak("Привет! Я твой голосовой бот. Скажи что-нибудь.") # Заставляем бота поздороваться

while True:
command = listen() # Ждем команду от пользователя

if 'привет' in command: # Если сказано "привет"
speak("Привет! Как дела?") # Бот отвечает "Привет! Как дела?"
elif 'как дела' in command: # Если сказано "как дела"
speak("Я в порядке, спасибо!") # Бот отвечает "Я в порядке"
elif 'пока' in command: # Если сказано "пока"
speak("До свидания!") # Бот отвечает "До свидания"
break # Завершаем цикл, бот прекращает работу
else:
speak("Не понимаю, повторите.") # Если не удалось распознать команду

# Запускаем бота
if __name__ == '__main__':
main()

Пояснение к коду

Импорт библиотек:import speech_recognition as sr
import pyttsx3
import time

speech_recognition — библиотека для распознавания речи с микрофона.
pyttsx3 — библиотека для синтеза речи (чтобы бот мог говорить).
time — используем для задержек в работе бота.
Инициализация распознавателя и движка для синтеза речи:recognizer = sr.Recognizer()
engine = pyttsx3.init()

Создаем объект recognizer, который будет отвечать за распознавание речи.
Инициализируем объект engine, который будет озвучивать текст.
Функция speak():def speak(text):
engine.say(text)
engine.runAndWait()

Эта функция принимает текст и озвучивает его с помощью pyttsx3. Мы используем метод say() для передачи текста в движок, а runAndWait() заставляет его проговорить.
Функция listen():def listen():
with sr.Microphone() as source:
print("Слушаю...")
recognizer.adjust_for_ambient_noise(source)
audio = recognizer.listen(source)
try:
command = recognizer.recognize_google(audio, language='ru-RU')
return command.lower()

Эта функция слушает звук с микрофона и распознает его с помощью Google API. Если распознавание прошло успешно, возвращаем команду в нижнем регистре.
Основная логика бота:def main():
speak("Привет! Я твой голосовой бот. Скажи что-нибудь.")
while True:
command = listen()
if 'привет' in command:
speak("Привет! Как дела?")
elif 'как дела' in command:
speak("Я в порядке, спасибо!")
elif 'пока' in command:
speak("До свидания!")
break
else:
speak("Не понимаю, повторите.")

Мы запускаем цикл, в котором бот слушает команды. В зависимости от того, что сказал пользователь, бот будет отвечать разными фразами. Если команда не распознана, бот попросит повторить.
Запуск программы:if __name__ == '__main__':
main()
Это стандартная конструкция для запуска программы в Python.

Шаг 4: Запуск бота

Теперь, когда код готов, давайте запустим его! Выполните команду:

python voice_bot.py

Когда вы запустите программу, бот будет ждать ваших голосовых команд. Скажите "Привет", "Как дела", или "Пока", и он ответит вам голосом.

Шаг 5: Возможности для улучшения

Теперь, когда у нас есть базовый голосовой бот, давайте подумаем, как можно его улучшить:

Добавить больше команд: Например, бот может рассказывать анекдоты, давать погоду или отвечать на вопросы по Википедии.
Использовать другие движки для синтеза речи: Например, можно интегрировать Google Text-to-Speech для лучшего качества речи.
Обработка ошибок: Можно улучшить обработку ошибок, например, если бот не понял команду, он может повторить запрос или предложить помощь.

Заключение

Поздравляю! 🎉 Теперь у вас есть собственный голосовой бот, который может распознавать вашу речь и отвечать вам голосом. Это отличная отправная точка для создания более сложных голосовых помощников.

Не бойтесь экспериментировать с функциями, добавлять новые возможности и улучшать работу бота. Кто знает, может быть, ваш бот станет таким же популярным, как Siri или Google Assistant! 😁

Если возникнут вопросы или что-то непонятно — пишите, я всегда рада помочь! Удачи в создании ботов! 🦾