Найти в Дзене
Создай свой ChatGPT
Давайте создадим mini-ChatGPT, который будет работать локально у вас на компьютере. В качестве базовой модели возьмем открытую LLM модель Llama3.2-vision. Что будем использовать: Начнем с метода start_chat, который вызывается, как только начинается новый чат-сеанс: Используем декоратор @cl...
1 год назад
Создание ИИ-агентов
12 мощных модулей для ИИ-агентов Если провести аналогию между Человеком и ИИ-агентом, то в качестве мозга ИИ-агент использует LLM, а в качестве рук и ног ИИ-модули. Когда дело доходит до создания ИИ-агентов,...
1 год назад
Локальные LLM
Запустить локально LLM с открытым исходным кодом проще, чем кажется. Давайте рассмотрим пошагово данную процедуру. Запускать будем модель Phi-2 от Microsoft (небольшая модель, которая займет 1,6Gb на вашем HD). Для этих целей понадобится специальный фреймворк Ollama, который, как раз предназначен для запуска открытых LLM моделей (Llama2, Llama3, Phi и др.) непосредственно на локальной машине. Перейдите на сайт ollama.com, скачайте Ollama и установите. Ollama поддерживает разные модели, которые можно найти здесь...
1 год назад
Регрессия Пуассона против линейной регрессии
Линейная регрессия имеет свой собственный набор допущений. Например, после моделирования, выходные данные могут быть отрицательными для некоторых входных величин. Порой такие результаты могут не иметь никакого смысла, например, в случаях предсказания количества забитых мячей в ворота противника или количества полученных входящих звонков и т. д. Это связано с тем, что линейная регрессия не может моделировать количественные (или дискретные) данные, кроме того, для линейной регрессии определено, как...
1 год назад
Функция активации ReLU
Из всех функций активации, сложнее всего понять, каким образом ReLU добавляет нелинейность в нейронную сеть. Как такая простая функция, помогает нейронной сети чему-то научиться. Путаница вполне очевидна, учитывая кажущуюся линейную форму, называть ее нелинейной функцией активации, как минимум странно. Возникает очевидный вопрос: «Как ReLU позволяет нейронной сети улавливать нелинейность?» Рассмотрим математическое выражение ReLU: Приведенное выше уравнение можно переписать с параметром h следующим образом: По сути, это та же функция ReLU, но со смещением...
1 год назад
ТОП-10 наиболее распространенных функций потерь
Функции потерь являются ключевым компонентом алгоритмов Машинного Обучения. Они определяют цель, к которой должна стремиться модель, оптимизируя ее во время обучения. Другими словами, функции потерь сообщает модели, что она должна минимизировать или максимизировать, чтобы улучшить качество своих результатов. Поэтому знание функций потерь имеет чрезвычайно важное значение. В таблице ниже показаны наиболее часто используемые функции потерь для задач регрессии и классификации: Mean Bias Error (MBE)...
1 год назад
Функция потерь
Функция потерь - измеряет насколько хорошо прогнозы модели соответствуют истинным результатам. Если численное значение функции потерь минимально (близко или рано нулю), то это говорит о том, что модель предсказывает качественные результаты, а если нет, то с этим надо, что-то делать. Скажем упрощенно следующим образом - в процессе обучения модели функция потерь рассчитывается каждый раз, когда данные от входа модели, доходят до выходного слоя, где формируется прогнозное значение. Далее это прогнозное...
1 год назад
Скрытые слои нейронной сети, взгляд изнутри
Большинству известно, что функция активации в нейронной сети необходима для изучения нелинейных закономерностей, но многие интуитивно не понимают, что именно пытается сделать нейронная сеть в ходе своих преобразований в скрытых слоях. В этой статье давайте попробуем понять и визуализировать, что действительно происходит внутри нейронной сети. Для простоты мы будем рассматривать случай использования бинарной классификации, т.е. на вход сети поступают какие-то данные, а на выходе сеть должна выдать...
1 год назад
Многозадачная модель обучения (MTL)
Большинство ML моделей обучаются только одной задаче, в результате, многим сложно интуитивно понять, как модель может быть обучена нескольким задачам одновременно. Многозадачное обучение (MTL) похоже на механизм человеческого обучения. Например, обучение езде на велосипеде облегчает обучение езде на мотоцикле, что основано на аналогичной концепции баланса тела. Механизмы передачи знаний позволяет людям изучать новые концепции с помощью всего нескольких примеров или вообще без них. Точно так же нейронные...
1 год назад
Обучение нейронных сетей
Большинство моделей ML обучаются независимо, без какого-либо взаимодействия друг с другом. Однако на практике, существует множество эффективных методов обучения, которые основаны на взаимодействии моделей в целях повышения производительности и обучаемости. На следующем рисунке представлены четыре хорошо адаптированные и часто используемые методики обучения: Такой метод обучения чрезвычайно полезен, когда: Вот как это работает: Обучая модель связанной задаче, сеть может уловить и запомнить основные закономерности интересующей задачи...
1 год назад