Найти тему

Python. Пакет faker

Telegram

faker - пакет для создания фейковых данных. Теоретически можно обойтись без него но есть и с ним может быть немного удобнее генерить разные датасеты. Прежде всего эта заметка будет нужна для того что бы ссылаться на на нее в будущем когда faker будет использован в каком то ноутбуке для генерации данных.

В заметке приведены основные функции для более подробного изучение можно почитать документацию
а так же, ссылка на
google colab где это можно посмотреть

ссылка на официальную документацию

Давайте разберем основные возможности пакета

Общие сведенья

Для начала как всегда импорт

Далее, на основе класса Faker, нужно будет создать объект с указанием локализации. Грубо говоря на каком языке вы будите генерировать данные.

-2

У одного объекта может быть несколько локализаций и тогда он будет случайным образом генерить данные на указанных языках.

-3

Так же, ничто не мешает создать несколько объектов что бы иметь больший контроль надо локализацией

-4

Примеры использования

Генерация имен

Тут все достаточно просто. Как и далее генерация происходит путем вызова нужного метода у созданного объекта. в данном случае этим методом будет name()

-5

Генерация названия города

-6

Генерация названия улицы

-7

Генерация дат

-8

Для дат можно задать интервал из которого эти даты будут генерироваться

-9

Собственные значения для генерации

Еще одной интересной особенностью можно считать тот факт что можно самостоятельно задавать значения для генерации

-10

Применение

Наверное, уже понятно, что эту библиотеку можно использовать для генерации данных для тестовых. что особенно актуально на начальных этапах карьеры, когда человеку еще сложно представить данные в голове и хорошо бы их потрогать руками

Ниже приведен примерный код для генерации датафрейма с 5000 строк, который можно использовать для дальнейшей работы

-11

Сам код несложный. На каждой итерации в определённый список добавляется одно значение. После этого, на основе этих списков создается датафрейм

Код

Сам код можно посмотреть в google colab, там же можно поиграться с пакетом

мой Telegram