Найти в Дзене

РЕШЕНИЕ ЗАДАЧИ С ПОЛЬЗОЙ ДЛЯ ДЕЛА И МОЗГА С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННЫХ ИНТЕЛЛЕКТОВ.

Осень — это такой период, когда все летние дела сделаны, а зимние еще не наступили. А значит, самое время потратить это самое свободное время на что-то полезное и нужное. Вот я и решил решить одну интересную задачу, а заодно и немного потренировать свой мозг. В общем, для меня достаточно давно возникла актуальная потребность переводить аудиозапись разговора (лекции, сообщения, информация и прочее) в текстовый формат с возможностью сохранения в текстовом формате для последующего применения. Можно, конечно, набрать текст самому, прослушивая аудио. Но это жутко неудобно и долго. Приходится постоянно ставить запись на паузу, включать снова, делать перемотку и прочие «прелести». Значит, нужна автоматизация процесса. Конечно, сейчас много сайтов и приложений, которые предоставляют такую возможность. Но тут, когда ты не знаешь, как там это всё работает, предоставлять свою информацию сторонним сервисам не всегда разумное решение. Поэтому я решил сделать что-то свое. Я, конечно, не могу сказа
Оглавление

С ПОЛЬЗОЙ ДЛЯ ДЕЛА И МОЗГА

Осень — это такой период, когда все летние дела сделаны, а зимние еще не наступили. А значит, самое время потратить это самое свободное время на что-то полезное и нужное. Вот я и решил решить одну интересную задачу, а заодно и немного потренировать свой мозг.

Нарисовано ИИ Алиса
Нарисовано ИИ Алиса

В общем, для меня достаточно давно возникла актуальная потребность переводить аудиозапись разговора (лекции, сообщения, информация и прочее) в текстовый формат с возможностью сохранения в текстовом формате для последующего применения. Можно, конечно, набрать текст самому, прослушивая аудио. Но это жутко неудобно и долго. Приходится постоянно ставить запись на паузу, включать снова, делать перемотку и прочие «прелести».

Значит, нужна автоматизация процесса. Конечно, сейчас много сайтов и приложений, которые предоставляют такую возможность. Но тут, когда ты не знаешь, как там это всё работает, предоставлять свою информацию сторонним сервисам не всегда разумное решение. Поэтому я решил сделать что-то свое.

Я, конечно, не могу сказать, что я профессиональный программист, хотя раньше и написал пару полноценных программ, которыми пользуюсь и по сей день. И одна из них достаточно сложная, с возможностью автоматических расчетов и использованием базы данных "Access". Для меня это скорее хобби и возможность узнать для себя что-то новое и потренировать свой мозг. А с появлением и активным развитием искусственного решение подобных задач становится намного проще.

КАК РЕШАЛАСЬ ЗАДАЧА, ПО КАКОМУ ПУТИ Я ПОШЁЛ.

Скажу сразу, что для выполнения задачи я решил использовать искусственный интеллект, ну а заодно посмотреть, что они могут и как с ними вообще дружить. Ведь, по заявлениям производителей, они умеют создавать необходимые нам коды.

Первым в дело GigaChat, и на его основе я решил создать бота для телеграмм. С задачей он, конечно, справился, но сам рабочий код написал не с первого раза. Да и способ запуска бота был предложен не самый удачный. Возможно, что я делал что-то не так или давал искусственному интеллекту не совсем правильные команды. Так что говорить плохо об ИИ не стану. Ведь я этим занялся впервые. Главное, что код был написан и работал.

Вторым я решил испытать DeepSeek. Я подсунул ему готовый код для анализа, и он сообщил, что код хороший, но тут же предложил его несколько улучшить. Я согласился. В результате получился достаточно хороший код коронный, и запускать стало проще, путем одного нажатия мышкой на файл самого скрипта (а это при необходимости позволит сделать его автозапуск при старте системы). Более того, бот стал работать не только на ПК, но и на телефоне, хотя второй при этом находился совершенно в другой сети интернета (в отличие от кода, написанного GigaChat).

Тут нужно отметить один основной момент.

Я не ставил перед собой задачи сделать что-то такое, что будет работать везде и всегда. Да и писать приложение на продажу или распространение я пока не собираюсь (а там посмотрим). Мне достаточно, чтобы всё работало только на компьютере. А для работы на компьютер необходимо установить высокоуровневый язык программирования общего назначения Python.

Но вернемся к нашим изысканиям.

Повозившись с ботом для телеграмм и поняв все его плюсы и минусы (коих для моих целей оказалось больше), я решил изменить способ достижения цели. Я уточнил у DeepSee, а можно ли что-то придумать для выполнения задачи на компьютере. И я получил утвердительный ответ. При этом DeepSee сразу сказал, что нужно ещё поставить на ПК, где это скачать (с указанием ссылок), как поставить и проверить работоспособность. Выполнив все его поручения, мы приступили к работе.

ЧТО МЕНЯ ОСОБЕННО ПОРАДОВАЛО В DeepSee.

Работать с DeepSee оказалось одно удовольствие, учитывая, что я НОВИЧОК в этом деле. Он замечательно понимает общение с человеком, даже если мы пишем ему что-то на нашем иногда абстрактном языке. И он нас понимает. Я описал ему, что в итоге я хочу получить, и он мне тут же предложил код приложения, которое мы сразу можем запустить, проверить и посмотреть.

А дальше пошла рутинная работа по отладке кода. Я предлагал ему идеи. Если что-то работало не так или вообще переставало работать, то я сообщал ему об этом или отправлял код ошибки для анализа и поиска решений. Если он в ходе работы он убирал то, что мне было нужно, я просил его вернуть это обратно.

Иногда при переписывании кода DeepSee сам забывал что-то туда добавить из прошлого кода и потом извинялся за свою оплошность. Когда у него что-то долго не получалось, я начинал его журить, и, как бы это ни выглядело смешно, он снова извинялся, но ошибку находил уже куда быстрее.

В общем, он вел себя как человек. И общался так же. Поначалу было немного трудно. Нужно понять, как правильно ему поставить задачу или вопрос. Но со временем это понимание приходит. Хотя нужно отметить, что и он в процессе общения начинает лучше тебя понимать, даже когда ты сказал что-то не совсем понятно. ЭТО ПРЯМО СТАНОВИТСЯ ЗАМЕТНО.

ЧТО ПОЛУЧИЛОСЬ В ИТОГЕ.

Совместно с DeepSee нам удалось создать вполне приличное приложение, которое имеет неплохой графический интерфейс. В него можно загрузить неограниченное количество аудиофайлов различного расширения. Хотя лучше всего оно работает с расширением WAV. Также не играет роли их объём. В ходе обработки они автоматически разбиваются на части, и каждая часть обрабатывается отдельно. На выходе мы получаем распознанный текст, который можно сохранить в файл для дальнейшей работы. Имеется статус-бар для понимания процесса обработки.

DeepSee с удовольствием откликнулся на мое предложение сделать небольшую помощь о том, как работает приложение, и надо сказать, сделал ее достаточно подробной. Обработка аудио происходит с применением сервисов Гугл. Поэтому качество распознавания зависит от качества самой записи, а скорость — от интернета. Но даже на мобильном интернете 1,5 гигабайта общего объема приложение распознало за 5 минут.

Сейчас приложение распознает русский и английский язык. Но при необходимости их можно расширить.

Ну и в работе не обошлось без помощи нашей Алисы.

Хотя она у нас в этот раз больше выполняла роль второстепенной помощницы, но ее последнее обновление здорово помогало в различных вопросах.

Вот так дружным коллективом мы решили поставленную задачу, а я многое для себя освоил и усвоил. Ну и теперь у меня есть возможность заняться дополнительной автоматизацией рутинных задач.

НА ВИДЕО:

1) Искусственный интеллект помогает человеку создавать подпрограмму. Картинка создана и оживлена с помощью ИИ Алиса.

2) Демонстрация работы приложения. Без озвучки (там и так все понятно).

Учись, дерзай и побеждай! Стремись, твори и создавай!

Всем удачи в познании нового и получении необходимого.