Представьте: вы заказали пиццу. Назвали адрес, сказали, что хотите, положили трубку. Дальше происходит странное. Ваш заказ остаётся у оператора. Он никуда его не передаёт. Повар варит суп, потому что не знает, что нужно тесто и сыр. Курьер сидит в машине и ждёт команды, которой нет. А вы через два часа звоните и слышите: «А вы заказывали?» Этот провал — не потому, что повар плохой или курьер ленивый. А потому, что в системе нет конвейера, который бы: В мире данных и нейросетей этот конвейер называется ETL. ETL расшифровывается как Extract, Transform, Load.
По-русски: извлечь, преобразовать, загрузить. Это три шага, которые происходят с любыми данными, когда они переезжают из одного места в другое. Данные редко лежат там, где их удобно использовать. Они могут быть: Первый шаг — забрать их оттуда.
Причём забрать так, чтобы не сломать исходник и не потерять по пути. Пример:
Вы написали промпт «нарисуй лес в тумане» в заметках. ETL-система должна найти этот текст, прочитать его и подготов