Сегодня мы попробуем перевести в текст очень интересный материал, а именно историю от первого лица, с разрешения автора канала с ютуба.
Я работала с нейросетью https://huggingface.co/spaces/sanchit-gandhi/whisper-jax
Интуитивно понятный интерфейс, прикреплю скрины поэтапных действий:
Выбираем вкладку вверху микрофон/аудиофайл/ютубканал - ютубканал,
Далее, вставляем в строку YouTube URL нашу ссылку с канала,
( https://www.youtube.com/watch?v=LVmQD4h2Zyk ) - канал Вячеслава Муна, переводчика и преподавателя корейского языка, хорошего парня и просто интересного человека))
Нажимаем Submit:
После загрузки видео, получается вот что:
Справа внизу под роликом в окошке Transcription сгенерировался наш текст, нажимаете на квадратик справа между изображением ролика и текстом, текст копируется, вы можете вставить свой текст в чистый лист документа на компьютере, в данном случае сейчас - копируем его в Дзен.
Можно поработать над текстом и сделать текстовый пост в блог. Я с удовольствием посмотрела видео. Таким образом, вы можете любое видео или аудио за короткое время перевести в текст (нейросеть обрабатывала 30 минутный видеоролик примерно 2 минуты).
Текст получился очень большой, я опубликую часть текста, для примера, длинный текст просто нечитабелен) Но мне очень понравилась эта история, лучше - такой длинный формат посмотреть именно на ютуб канале, у Славы Муна
В итоге, нейросеть не распознала некоторые слова, причем разговорный стиль для превращения в текст требует доработки для того, чтобы он был читабельным. В данном случае, длинные видео или аудиофайлы требуется перевести в текст в какой либо профессиональной деятельности, например, ко мне обращались с просьбой перевести в текстовый формат аудио с заседания суда.
Итак, очень интересная история:
"Так, значит, я вам сегодня расскажу очень интересную и эксклюзивную историю, потому что эту историю я еще никому не рассказывал.
Значит, родился на Сахалине первенец, старший внук, и дедушка собрал всех родственников, чтобы определить имя. Потому что у корейцев по традиции есть церемония присвоения имени. Это не просто так назвался, захотел: "Иван", смотрят родословную. Потому что фамилия Мун – это аристократы, народ ученый. И дедушка написал письмо в Корею, потому что он не знал, в каждом поколении есть определенные имена, которыми нужно назвать. И из Кореи ответили, что можно назвать Хе-ун или Хе-ун. Дедушка выбрал Хе-ун. И кто не знает корейский глубоко, Хе-унг это два слова, у нас нет отчества. Хе означает океан, море, а ун означает везение. И, наверное, мне в жизни часто везет. Затем дедушка посчитал, что раз я родился в России, нужно дать еще русское имя. От того, что дедушка и бабушка приехали из России, а родители и я, и брат родились в России, получилось так, что они собрались дать мне русское имя, а имен вообще не знали ни одного русского. И мама говорит, что двоюродная сестра сказала давайте назовем Слава, а дедушка говорит почему Слава, а говорит везде "Слава" написано "Слава труду", "Слава КПСС", везде, говорит дедушка написано и дедушка говорит: " да хорошо, Слава", поэтому я все таки больше Слава, чем Вячеслав.
Когда я пошел в садик мама, говорит, что я не говорил ни капельки по-русски. А знаете почему? Потому что дедушка дома разрешал говорить только на родном языке, на корейском. Поэтому наша семья говорит все на корейском. Единственное, я стал профессиональным переводчиком. А так на бытовом все говорят. И дедушка говорил, что на улице вы можете хоть по-английски говорить. Поэтому я иногда думаю, я носитель русского или корейского. Но я думаю, что я больше носитель корейского, потому что мне по-корейски легче говорить. И когда меня нанимает Министерство Синхронного Переводчика, повезло, что с российской стороны всегда берешь на корейский, потому что мне по-корейски говорить легче. Поэтому, когда говорят, что надо изучать языки, это формулировка неправильная. Нужно говорить на языке. Я думаю, если бы я изучал, я бы его не изучил, потому что я в институте преподавал без педагогического образования, хоть у меня три диплома. Меня взяли как носителя языка, носителя коллегии. И сказали, что... Директриса была очень умная, Болотина Ольга Петровна. Она сказала, что дети не умеют говорить. И когда я пришел, я не критиковал людей, я просто сказал, что их неправильно научили. И вообще, вот запомните, это я сейчас не для пафоса говорю, в любой стране, даже английский, просто степень разная, - языки дают неправильно, потому что теоретики. Теоретики учат по книжкам. Книжки пишут тоже теоретики. Я единственный автор, который является практиком. И когда я пошел в садик, мама в первый день привела меня, а я по-русски, не бе-бе... Мама говорит, как это я буду говорить "хочу в туалет" , и когда вечером мама пришла, воспитатель спрашивает, мы, говорит все, разобрались. С русским языком я столкнулся в садике. Потом в школу пошел, в российскую, институт. И, конечно, я язык забыл. Но благодаря миссионерам, которые приехали на Сахалин, я стал изучать на их курсах, даже больше. Ходил и общался. У меня язык быстро восстановился. Мне папа всегда в детстве говорил, что если ты положил в ящик, ты в любое время откроешь, может он будет лежать. И язык у меня быстро восстановился. И когда приезжают бизнесмены, министры и так далее, когда я говорю с ними по-корейски, они не понимают, что я русскоязычный. Они говорят, а вы когда переехали в Россию? Дедушке я благодарен. Я всегда думал, почему же так получилось. И это не случайно. В советское время было запрещено слушать, значит, радио иностранное, корейское, американское. И поэтому были шумы большие. И когда мы с дедушкой ложились спать, я помню две вещи. Он всегда мне учил по-корейски. Хана, Антон, Люсет, я это помню. И еще он всегда радио слушал. Радио такое было, вот так шшшшш. Я думаю, зачем он слушает? А он, видимо, слушал и знал что южная корея, что его родина живет в достатке, то что говорили советские все это вранье, я поэтому понимаю что дедушка для себя для меня создал лингвистическую атмосферу, где не нужно было ничего учить, оно само само собой приходило. Единственное, что он говорил, они были против, потому что они учились в русской школе, и как бы по-корейски не модно было говорить, и отношений не было с Южной Кореей. И когда в 90-х случилась перестройка, киевская журналистская БС, это самое крупное радиовещание, телевещание в Корее, нашу семью показали по телевидению в Корее как-то просто то, что все говорят по-корейски. И это благодаря тому, что дедушка очень мудро сделал. Он не заставлял, он просто создал такую атмосферу. Благодаря этому, я уже, когда учился на четвертом курсе на Сахалине, у меня был уровень корейского такой, что меня приглашали все церкви переводить. Я переводил в субботней церкви, когда адвентисты, я переводил воскресные, методисты и присветерианцы. Вот, с методистами еще часто пересекались. И так случилось, что один раз в Пасху родители на неделю в Корею уехали, а я там работал переводчиком и был студентом. И он мне поручил, хотя там дьяконы есть, пресвитеры, но он мне поручил. И два раза проповедь в воскресенье в Методической церкви, в Южносахалинске, я вел на корейском с переводчиком. Вот, уже был... Языки дают большие возможности, потому что тогда я был совсем молодой, и вы даже не поверите, все церкви выстроились в очередь, чтобы... каждый хотел пригласить меня..."
Как видите, нейросеть в обработке видео не распознает некоторые слова, поэтому - необходима коррекция текста, расставление знаков препинания, но в целом, это очень удобный инструмент. Не нужно набирать весь текст вручную.
По мере возможности, буду знакомить Вас с некоторыми нейросетями, которые бесплатны или, как правило в платных нейросетях есть бесплатные функции, с ограничением. Сейчас много мест, где можно использовать чат GPT, для создания текста.