Добавить в корзинуПозвонить
Найти в Дзене
SMP-Laptops

Поговорим немного о LLM

Крупные языковые модели и прогресс исследований: вопросы и ответы Быстрое расширение возможностей крупных языковых моделей (LLM) — включая веб-поиск, выполнение кода, анализ данных, а также генерацию гипотез и экспериментальное проектирование — опережает критическое отражение того, как технология вписывается в академические исследования.
Это аргумент, который выдвинули Рикардо Винуэса, доцент аэрокосмической инженерии в Университете Мичигана, и его соавторы в журнале The Innovation.
Хотя они признают, что LLM полезны для быстрой подготовки первого черновика, внедрение LLM на каждом этапе исследовательского процесса без надлежащих ограничений создаёт риск нарушения, таких как фабрикация данных или предвзятое проектирование экспериментов.
В опросе Nature 2024 года 81% исследователей сообщили, что использовали LLM в своей работе, что подчеркнуло необходимость единых рекомендаций для ответственного использования.
Винуэса делится своими взглядами на лучшие практики использования LLM в и
Оглавление

Крупные языковые модели и прогресс исследований: вопросы и ответы

Быстрое расширение возможностей крупных языковых моделей (LLM) — включая веб-поиск, выполнение кода, анализ данных, а также генерацию гипотез и экспериментальное проектирование — опережает критическое отражение того, как технология вписывается в академические исследования.

Это аргумент, который выдвинули Рикардо Винуэса, доцент аэрокосмической инженерии в Университете Мичигана, и его соавторы в журнале The Innovation.

Хотя они признают, что LLM полезны для быстрой подготовки первого черновика, внедрение LLM на каждом этапе исследовательского процесса без надлежащих ограничений создаёт риск нарушения, таких как фабрикация данных или предвзятое проектирование экспериментов.

В опросе Nature 2024 года 81% исследователей сообщили, что использовали LLM в своей работе, что подчеркнуло необходимость единых рекомендаций для ответственного использования.

Винуэса делится своими взглядами на лучшие практики использования LLM в исследованиях, признавая как сильные стороны, так и текущие ограничения LLM.

Как LLM помогают в исследовательском процессе?

Системы, производящие текст, ускоряют создание первоначальных версий исследовательских предложений, документации методов или отчётов о прогрессе. Они также помогают автоматизировать повторяющиеся задачи, например, создание вычислительной сетки для конкретной симуляции.

В последнее время соучёные в области ИИ, которые являются многоагентными системами, призванными выступать виртуальными сотрудничеством, начинают помогать в выборе экспериментов для изучения определённых явлений. Например, она оказалась полезной в недавних исследованиях механизмов переноса генов и таргетных препаратов для лечения фиброза печени.

Сейчас существует очень широкий круг мнений, и кажется, что он меняется почти каждый день. С одной стороны, некоторые люди действительно не доверяют этим системам, а с другой — слишком им доверяют.

Чрезмерное доверие возникает, когда люди приписывают человеческие свойства LLM — предполагая, что результат — это то, что человек думает и высказывает своё мнение. На самом деле, LLM работают иначе. Они просто предсказывают следующий жетон, то есть следующий фрагмент предложения.

Главное преимущество находится в середине этих двух крайностей. Пользователи должны понимать, что LLM — это инструменты, которые могут ускорять выполнение определённых задач в данный момент, но при этом понимать, что есть большой потенциал для улучшения.

Могут ли LLM помочь с научными прорывами?

Многие великие прорывы в физике, такие как теория относительности и квантовая физика, были огромными отходами от существующих способов мышления. Люди, которые мыслили нестандартно, терпеливо развивали эти идеи годами, пока сообщество не приняло их.

LLM не обучены делать такие прыжки. Вместо этого они запрограммированы подчиняться ожиданиям человека. Если вы хотите творческое мышление, которое может привести к прорывам, нужно мыслить иначе. Будущие системы могли бы иметь такую возможность, но пока её нет.

Хотя LLM могут быть полезны с определёнными задачами, мы всё равно должны способствовать творчеству и инновационному мышлению. В противном случае научный прогресс может застопориться.

Какие меры защиты могут помочь учёным ответственно использовать LLM?

В контексте LLM возникает интересный вопрос о том, следует ли также сохранять взаимодействие между человеком и системой искусственного интеллекта как часть опубликованного набора данных как доказательство того, как произошло взаимодействие.

Пока это не распространённая практика, но в целом это хорошая практика для прозрачности. Например, если его использовали для написания раздела для обсуждения статьи, это помогает другим понять, сколько человеческого вклада было на этапе подсказки для получения конечного результата.

Публикация взаимодействий LLM, используемых для исследований, будет соответствовать принципам данных FAIR, которые делают акцент на находимости, доступности, совместимости и повторном использовании цифровых активов. Эти рекомендации касаются открытого доступа, доступных и воспроизводимых наборов данных для ускорения прогресса исследований.

При подаче и оценке заявок на гранты мы не должны исключать людей из круга. Хотя LLM могут ускорить процесс написания или резюмировать идеи во время обзора, мы хотим избежать ситуации, когда LLM используются исключительно для написания и оценки предложений. Это создало бы цикл, в котором мы застряли, когда одна и та же информация передаётся между LLM.

Ещё одна ключевая идея — объяснимость. Инструменты для достоверной объяснимости критически важны для пользователей, чтобы доверять выходам и обнаруживать возможные внешние манипуляции. Если пользователи понимают, как LLM делают то, что делают, они смогут согласовать модель с предпочтительным поведением, такими как способы рассуждения или глубина и широта изучения литературы.

Как следует указывать LLM в научных работах?

Многие журналы утверждают, что для того, чтобы быть автором исследования, нужно нести ответственность за любые этические последствия, которые может иметь статья. Например, если данные были фальсифицированы, ответственность несут авторы. Поскольку система LLM не является этическим образованием, она не может быть указана в качестве соавтора исследования.

Многие журналы начинают включать разделы, где авторы могут описать, какие LLM использовались и как именно использовались. Использовались ли LLM для доработки грамматики или для генерации полных разделов текста? Если бы я знал, что результаты полностью созданы человеком, но только LLM пишет раздел обсуждения, я бы предположил, что на этом этапе не было много творческой и интуитивной интерпретации результатов. Важно, чтобы читатель имел контекст.

Кто должен участвовать в создании рекомендаций по лучшим практикам?

Поскольку LLM затронут всех в науке, требуется глобальный диалог. Должен быть значительный вклад со стороны научного сообщества. В частности, исследователи машинного обучения должны участвовать в процессе, так как лучше всего знают, как работают разрабатываемые ими системы. Научное сообщество будет готовить предложения, статьи и рецензирование, а их мнение о том, как следует и не следует использовать LLM, поможет обеспечить качество и инновационность новых разработок.

Каких улучшений в LLM вы ждёте с нетерпением?

Есть большой потенциал для улучшения LLM, если мы сможем закрепить их на физических принципах. Если вы работаете с агентной ИИ в долгосрочной перспективе, было бы полезно, если бы физические законы были частью работы моделей, а не статистически выводили токены из базы данных. Таким образом, причинно-следственные связи сохраняются, когда вы используете результат LLM для обнаружения.

В целом, не стоит вырывать человека из круга, потому что креативность — ключ к новым идеям и прорывному мышлению, которые нам нужны.

Купите Ноутбуки в Москве в интернет магазине SMP-Laptops
SMP-LAPTOPS – купить товары в каталоге на Яндекс Маркет