Как сделать API на Python #1
Пошаговое руководство по NLP: конструирование признаков текстовых данных
Источник: Nuances of Programming Курс SkillFactory Python для анализа данных. Вы научитесь за минуты обрабатывать большие файлы и создавать отчеты, автоматизируете сбор данных из интернета, освоите парсинг и работу с API. “Хорошие функции не рождаются, их разрабатывают” (технический директор Kaggle и специалист по анализу данных Бен Хамнер). Конструирование признаков (feature engineering) — процесс выбора и создания наиболее релевантных и полезных признаков для ввода в модель машинного обучения...
Пишем умный поиск по коду с Open AI
В этой статье мы кратко рассмотрим технологию, которая лежит в основе ChatGPT — эмбеддинги, и напишем простой интеллектуальный поиск по кодовой базе проекта. Эмбеддинг (от англ. embedding) — это процесс преобразования слов или текста в набор чисел – числовой вектор. Векторы можно сравнивать между собой, чтобы определить насколько два текста или слова похожи по смыслу. К примеру, возьмем два числовых вектора (эмбеддинга) слов «отдать» и «подарить». Слова разные, но смысл схож, т.е. они взаимосвязаны, и результатом обоих будет передача чего-то кому-то...