8 месяцев назад
Языковая модель Falcon 180B хочет превзойти Google, но не GPT-4 от OpenAI
Все уже знают о существовании GPT-4, а многим известны также ИИ-инструменты PaLM от Google и Llama — но есть и ряд других крупных LLM (больших языковых моделей), которые умеют генерировать тексты и другой контент. Одним из них является Falcon, который разрабатывается Институтом технологических инноваций (TII) в Абу-Даби. Теперь этот инструмент доступен в новой версии под аббревиатурой «180B». Производители, выпустившие Falcon 180B, заявляют, что он лучше, чем PaLM 2 от Google, а также LLaMA 2. Он...
06:44
1,0×
00:00/06:44
39,9 тыс смотрели · 3 года назад
6 месяцев назад
Falcon 2-11B: Первая модель ИИ семейства Falcon 2, обученная на 5,5T токенах с моделью языка для зрительного восприятия “`html Введение Falcon 2-11B: первая модель искусственного интеллекта семейства Falcon 2, обученная на 5,5 трлн токенов с моделью языкового представления Технологический институт инноваций (TII) в Абу-Даби представил Falcon, передовое семейство языковых моделей, доступных по лицензии Apache 2.0. Falcon-40B – первая “полностью открытая” модель, обладающая возможностями, сравнимыми с многими проприетарными альтернативами. Это значительное достижение, открывающее множество возможностей для практиков, энтузиастов и промышленности. Практические решения и ценность Falcon2-11B, созданный TII, является моделью только декодера, обладающей 11 миллиардами параметров. Он был тщательно обучен на огромном корпусе, превышающем 5 трлн токенов, объединяя данные RefinedWeb с тщательно отобранными корпусами. Эта модель доступна по лицензии TII Falcon License 2.0, разрешающей использование, вдохновленной Apache 2.0. Лицензия включает политику допустимого использования, способствуя ответственному использованию технологий ИИ. Falcon2-11B, модель только декодера, обучена предсказывать следующий токен в задаче причинного языкового моделирования. Он основан на архитектуре GPT-3, но включает в себя вращающиеся позиционные вложения, мультизапросное внимание, FlashAttention-2 и параллельные блоки внимания/MLP-декодера, отличающие его от оригинальной модели GPT-3. Семейство Falcon включает модели Falcon-40B и Falcon-7B, причем первая выделяется на Open LLM Leaderboard. Falcon-40B требует ~90 ГБ памяти GPU, что все еще меньше, чем у LLaMA-65B. Falcon-7B нуждается всего в ~15 ГБ, обеспечивая доступное вывод и тонкую настройку даже на оборудовании для потребителей. TII предлагает инструктивные варианты, оптимизированные для задач в стиле ассистента. Обе модели обучены на огромных наборах токенов, в основном из RefinedWeb, с публично доступными выдержками. Они используют мультизапросное внимание, улучшая масштабируемость вывода за счет снижения накладных расходов памяти. Это обеспечивает надежные оптимизации, такие как состояние, делая модели Falcon серьезными конкурентами в области языковых моделей. Исследования поддерживают использование больших языковых моделей в качестве основы для специализированных задач, таких как резюмирование и чат-боты. Однако настоятельно рекомендуется быть осторожными при использовании без должной оценки рисков. Falcon2-11B, обученный на нескольких языках, может не обобщаться хорошо за пределами них и содержать предвзятости из веб-данных. Рекомендации включают тонкую настройку для конкретных задач и внедрение мер предосторожности для ответственного использования в производстве. В заключение, представление Falcon Технологическим институтом инноваций представляет собой прорывное достижение в области языковых моделей. Falcon-40B и Falcon-7B обладают выдающимися возможностями, причем Falcon-40B лидирует на Open LLM Leaderboard. Falcon2-11B с инновационной архитектурой и обширным обучением дополняет семейство Falcon. Несмотря на огромный потенциал для различных приложений, ответственное использование имеет первостепенное значение. Бдительность против предвзятостей и рисков, наряду с добросовестной настройкой для конкретных задач, обеспечивает их этичное и эффективное применение в различных отраслях. Таким образом, модели Falcon представляют собой многообещающий фронт в инновациях ИИ, готовый... https://flycode.ru/falcon-2-11b-%d0%bf%d0%b5%d1%80%d0%b2%d0%b0%d1%8f-%d0%bc%d0%be%d0%b4%d0%b5%d0%bb%d1%8c-%d0%b8%d0%b8-%d1%81%d0%b5%d0%bc%d0%b5%d0%b9%d1%81%d1%82%d0%b2%d0%b0-falcon-2-%d0%be%d0%b1%d1%83%d1%87%d0%b5-ai/