Обновлённая версия статьи
📌 Больше полезных статей по информатике и программированию вы можете найти у нас на сайте.
📢 Следить за новостями мира информатики, а также общаться, делиться впечатлениями и готовиться к экзаменам лучше вместе, в нашем Telegram-канале.
Базы данных в задании 3 ЕГЭ по информатике
Задание 3 ЕГЭ по информатике нацелено на проверку навыков поиска и сортировки информации в реляционных базах данных. Такие базы данных представлены в формате таблиц Excel, а для работы с ними, обычно, требуется знание самых базовых функций Excel.
Для решения этой задачи выделяют несколько простых этапов:
- Анализ диаграммы связей (схемы) базы данных;
- Сопоставление диаграммы с таблицами из прилагаемого файла Excel;
- Выделение условий отбора данных;
- Отбор данных и перемещение их между таблицами встроенными функциями Excel;
- Выполнение арифметических и логических операций над отобранными данными для получения ответа на задание.
В данной статье мы разберемся, что такое базы данных, какие из них называются реляционными, как строятся диаграммы связей и как проводить их анализ.
Что такое базы данных?
Вспомните ваш электронный дневник в школе. В нём хранится множество самой разной информации: расписание уроков, оценки, домашнее задание. Для того, чтобы весь этот массив данных как-то структурировать, хранить и обрабатывать как раз и используются базы данных.
Можно сказать, что база данных — это организованное хранилище информации в электронном виде, которое помогает легко искать, обновлять и управлять данными.
Давайте разберемся с базами данных на простом примере. Представьте себе электронную таблицу в Excel, где каждая строка — это отдельная запись (например, урок в школе), а каждый столбец — это отдельная характеристика (например, оценка за этот урок или домашнее задание).
Давайте внимательно посмотрим на таблицу выше и выделим основные элементы, которые есть у баз данных:
- Каждая база данных состоит из таблиц, в которых хранятся данные. Причем в одной базе данных может быть несколько таблиц.
- Таблицы состоят из записей, которые представляются строками этих таблиц.
- В каждой записи есть поля или же столбцы, которые содержат определённые данные (здесь полями являются «название предмета», «оценка», «домашнее задание»). Причем одно из полей может быть ключом.
- Ключ — это уникальный идентификатор (ID) каждой записи, именно они позволяют связать данные между разными таблицами. В данном примере ключами у нас являются называния предметов, которые записаны в первом столбце.
Структуру таблиц принято обозначать в виде такого прямоугольника (цвета и стили могут отличаться):
Сверху написано название нашей таблицы, для примера назовём её «Занятия». Первым полем указывается уникальный идентификатор «Название предмета», который принято выделять среди других полей, например, иконкой ключа. Далее идут поля таблицы, у нас это — «Оценка» и «Домашнее задание».
Такие прямоугольники используются при построении диаграмм связей между таблицами и называются они «сущностями», а поля таблиц в них называются «атрибутами».
Реляционные базы данных
Рассмотренная выше таблица относится к реляционной модели данных, а совокупность таких таблиц с чётко заданными связями, будет называться реляционной базой данных.
Давайте немного расширим нашу базу данных, добавив информацию об учениках и разделим все данные на три таблицы: «Ученики», «Предметы» и «Оценки и домашние задания».
В первую таблицу внесём уникальные идентификаторы каждого ученика, их имена и классы:
Во второй таблице оставим только предметы и их идентификаторы:
Третья таблица будет сводной, здесь укажем идентификаторы оценки, ученика, предмета, значения оценки и домашнего задания:
В реляционной базе данных данные организованы по принципу взаимосвязанных таблиц. В нашем примере три таблицы: «Ученики», «Предметы» и «Оценки и домашние задания». Они связаны между собой с помощью уникальных идентификаторов (ID).
Например, если нужно узнать, какую оценку получил Иван по информатике, то по ID ученика (101) и ID предмета (ИН) можно найти соответствующую запись в таблице «Оценки и домашние задания».
На диаграмме наши таблицы со связями могут выглядеть так:
Графическое представление данных и связей между ними называется ER-диаграммой или диаграммой «сущность—связь» (Entity-Relationship Diagram). Такие диаграммы помогают систематизировать информацию и определить, как сущности и их атрибуты будут взаимодействовать друг с другом.
ER-диаграммы
Создание ER-диаграммы — это первый шаг в проектировании базы данных, где определяются все необходимые сущности, их атрибуты и связи. Это позволяет разработчикам и аналитикам чётко представлять структуру данных и планировать дальнейшую реализацию базы.
Также ER-диаграммы помогают визуализировать связи между сущностями и определять, какие ключи будут использоваться для их уникальной идентификации и связи с остальными таблицами. Например, можно увидеть, что в таблице «Оценки и домашние задания» должен быть атрибут (ID ученика), ссылающийся на таблицу «Ученики».
Возвращаясь же к ЕГЭ, то как раз в условии задания 3 вы можете встретить ER-диаграмму базы данных, с которой предстоит работать. Выглядит она примерно так:
Давайте проанализируем эту диаграмму и поймем структуру базы данных. Видим, что здесь нам предстоит работать с тремя таблицами «Движение товаров», «Магазин» и «Товар». Они расположены на соответствующих листах в файле Excel.
Ключами в таблицах являются «ID операции», «ID магазина» и «Артикул». Таким образом, связь между таблицами у нас возможна только через атрибуты «ID магазина» и «Артикул».
То есть переместить данные из таблицы «Магазин» в «Движение товаров» можно только по «ID магазина», а из таблицы «Товар» только по атрибуту «Артикул». Реализовать такое перемещение данных в Excel можно с помощью функции ВПР().
Функцию ВПР() мы рассмотрим в этой статье: