Найти в Дзене
НИИ Антропогенеза

Учёные из Мэриленда протестировали Ml-модели и выяснили, что задачки лучше всего писать нейронкам именно на этих языках

Учёные из Мэриленда протестировали Ml-модели и выяснили, что задачки лучше всего писать нейронкам именно на этих языках Это было удивительно: все думали, что это английский, потому что там самый большой, что очевидно, набор знаний Одна Википедия на английском — 7.000.000, а в русском — 1.500.000 "Нейронки" пылесосят информацию не только с официальных ресурсов, журналов и изучают не только литературный язык А его в англоязычном мире больше, чем в русском или польском И на русском/польском говорят в основном носители в Интернете, а в английском есть всё: от spanglish до сhinglish Славянская грамматика: да, тут ручку "приложили" наши падежи, которые дают больше информации При фиксированном лимите токенов, Ml получает больше семантических данных, чем в английском Они просто "видят" больше смысла Хуже всего нейронки справляются с задачами на китайском: дело в том, что семантика у иероглифов многозначная и контекстность высокая А это показывает нам только одно: китайские копираторы, SMM

Учёные из Мэриленда протестировали Ml-модели и выяснили, что задачки лучше всего писать нейронкам именно на этих языках

Это было удивительно: все думали, что это английский, потому что там самый большой, что очевидно, набор знаний

Одна Википедия на английском — 7.000.000, а в русском — 1.500.000

"Нейронки" пылесосят информацию не только с официальных ресурсов, журналов и изучают не только литературный язык

А его в англоязычном мире больше, чем в русском или польском

И на русском/польском говорят в основном носители в Интернете, а в английском есть всё: от spanglish до сhinglish

Славянская грамматика: да, тут ручку "приложили" наши падежи, которые дают больше информации

При фиксированном лимите токенов, Ml получает больше семантических данных, чем в английском

Они просто "видят" больше смысла

Хуже всего нейронки справляются с задачами на китайском: дело в том, что семантика у иероглифов многозначная и контекстность высокая

А это показывает нам только одно: китайские копираторы, SMM-щики и журналисты могут не волноваться, что Ml отнимет их работу вскоре