04:39
1,0×
00:00/04:39
3 месяца назад
272 читали · 1 год назад
Подготовка диалоговых датасетов для рекуррентной нейросети на Python
1)Первое, что нужно сделать это найти нужный нам датасет диалогов. Есть сайт где можно найти множество любых датасетов - это Hugging Face 2)На главной странице в правом верхнем углу будет Datasets("Датасеты") жмём на неё на этой вкладке будут датасеты для разных нейросетей , но нам нужен датасет диалогов , поэтому слева в фильтрах выбираем Conversational("Разговорный, диалоговый") там будут разные языки , но если вы хотите выбрать нужный вам язык , то просто в фильтрах добавьте тот язык, который вам будет нужен. После скачивания датасета на компьютер надо перенести данные из нейросети я выбрал...
724 читали · 2 года назад
Как вернуть кириллицу в json? REST Client в VSCode
Я часто работаю с запросами к api различных сервисов предоставляющих данные о проданных билетах, забронированных отелях и другие. А так как работаю в основном с российскими сервисами, то данные возвращаемые этими api почти всегда содержат кириллицу. По началу, когда я только начинал работать над разбором таких данных, мне очень мешали нечитаемые значения в json, в которых символы кодировались в как \uXXXX. Выглядит это примерно так: "guests": { "guest": { "firstName": "\u0410\u043b\u0435\u043a\u0441\u0435\u0439", ...