В ходе исследования, которое недавно было проведено лабораторией искусственного интеллекта Amazon Web Services (AWS AI Lab), выяснилось, что большая часть текстового контента в интернете, в особенности на языках, распространённых на африканском континенте и в государствах Глобального Юга, состоит из текстов, которые были предварительно переведены с помощью машинного перевода. Как заявили аналитики, около 50% предложений в интернете сейчас переведены на два и более языков, зачастую с ошибками из-за того, что для перевода используются различные соответствующие программы. Именно это на данный момент вызывает опасения у экспертов по поводу перспектив обучения больших языковых моделей. В компании AWS подчеркнули, что интерес к этой проблеме возник после того, как специалисты корпорации Amazon, работающие в сфере машинного перевода и являющиеся носителями различных редких языков, заявили об огромном количестве контента на их родных языках, который явно был создан с использованием программ дл
Большая часть текстового контента в интернете – это некачественный машинный перевод
18 января 202418 янв 2024
9
2 мин