Найти в Дзене
NEUROMANIA - Нейросети

ИИ-стартап Pinecone привлекает $100 млн на фоне роста рынка векторных баз данных

Стартап Pinecone, базирующийся в Нью-Йорке и специализирующийся на создании векторных баз данных для языковых моделей искусственного интеллекта (ИИ), объявил о привлечении 100 миллионов долларов финансирования серии B при оценке 750 миллионов долларов. Компания привлекла внимание благодаря своим продуктам, которые помогают разработчикам создавать быстрые и масштабируемые приложения, используя языковые модели ИИ и векторные базы данных.

Языковая модель - это статистическая модель, которая позволяет ИИ понимать и генерировать естественный язык так же, как это делают люди. Она учитывает частотность использования слов в текстах на естественном языке и прогнозирует вероятность следующего слова на основе предыдущих слов. Чтобы обучить языковые модели, требуется огромное количество данных и вычислительной мощности.

Здесь на помощь приходят векторные базы данных - специальные базы данных, которые позволяют ИИ быстро обрабатывать и искать векторы большого количества текстовой информации. Векторы могут представлять отдельные слова, предложения и целые документы. Это позволяет системам ИИ быстро находить соответствия между запросами и текстами и делать более точные прогнозы.

Pinecone представил векторную базу данных в 2021 году, управляемую услугу, которая позволяет инженерам создавать быстрые и масштабируемые приложения с использованием вкраплений из моделей ИИ и языковых моделей. Компания помогает инженерам связывать чат-ботов с данными их собственной компании, чтобы дать правильный ответ, а не галлюцинации.

Хотя компания была основана с расчетом на подъем языковых моделей, взрывной характер перехода к генеративному ИИ стал неожиданностью. Рост популярности языковых моделей прошлой осенью привел к стремительному росту Pinecone, поскольку этот инструмент быстро стал неотъемлемой частью программного стека - слоя памяти - для приложений ИИ. Компания заявляет, что ее векторные базы данных помогают инженерам создавать эффективные и быстрые приложения, которые могут обрабатывать огромные объемы текстовой информации и делать более точные прогнозы на основе языковых моделей.

В 2023 году Pinecone наблюдал взрывное увеличение числа платящих клиентов во всех отраслях и размерах, включая Gong и Zapier. Категория векторных баз данных выросла и включает в себя другие инструменты, такие как Chroma, Weaviate и Milvus.

Недавно в социальных сетях начались обсуждения новой научной работы, посвященной потенциалу новой архитектуры рекуррентного трансформатора памяти (RMT), которая позволяет языковым моделям сохранять информацию о 2 миллионах маркеров. Некоторые говорят, что RMT может уменьшить потребность в векторных базах данных, но другие утверждают, что не сможет, поскольку RMT требует гораздо большего времени на умозаключения.

Однако представители Pinecone считают, что векторные базы данных по-прежнему будут востребованы в крупномасштабных реальных приложениях, где стоимость, производительность, простота использования и инженерные накладные расходы являются важными факторами. Они также подчеркивают, что чат-боты - это прорывная технология, на которую опиралась компания Pinecone, и они продолжат искать способы расширить возможности для реальных, масштабных приложений.

Представители Pinecone отмечают, что инженеры и разработчики продолжают изучать возможности использования языковых моделей и векторных баз данных, и векторные базы данных продолжают развиваться и улучшаться. Они также добавляют, что существует большой разрыв между тем, что работает в лаборатории, и тем, что работает в реальных приложениях, и их компания нацелена на преодоление этого разрыва.

В целом, Pinecone является ярким примером того, как векторные базы данных помогают компаниям создавать эффективные приложения на основе языковых моделей

Подписывайся и ставь лайк, если хочешь больше статей на тему Нейросетей!