Найти тему

ПОДВИЖКИ ПО САНСКРИТУ В КОМПЬЮТЕРНОЙ ЛИНГВИСТИКЕ


🔸 Сергей Аверкиев дообучил несколько LaBSE моделей по просьбам коллег на предоставленных датасетах. На санскрите:

На санскрите получилось не очень. Возможно, что слишком вольный перевод и отсутствие родственного языка в модели сыграли свою роль. Есть задумка попробовать повторить обучение не в транслите, а в деванагари, чтобы смочь задействовать корпус текстов на хинди как подспорье.
Около минуты