Реферат: Організація баз даних
Аспект обробки. У розпорядженні користувача є оператори маніпулювання даними (наприклад, вибірки інформації), які генерують нові таблиці на основі вже наявних і серед цих операторів є принаймні оператори вибірки (select), проекції (project) і об¢єднання (join).
На рис. Наведено простий приклад реляційної бази даних відділів (таблиця DEPT) і службовців (таблиця EMP).
DEPT
DEPT# | DNAME | BUDGET |
D1 | Marketing | 10M |
D2 | Development | 12M |
D3 | Research | 5M |
EMP
EMP# | ENAME | DEPT# | SALARY |
E1 | Lopez | D1 | 40K |
E2 | Cheng | D2 | 42K |
E3 | Finizi | D2 | 30K |
E4 | Satio | D2 | 35K |
Операція вибірки SELECT передбачена для вибірки певних рядків та стовпців
SELECT DEPT#, DNAME, BUDGET
FROM DEPT
WHERE BUDGET>8M
Очевидно, результат кожної з 3-х представлених операцій – це ще одна таблиця (іншими словами, ці оператори – такі що породжують таблиці). Це є реляційною властивістю замкненості. Вона має велике значення і, головним чином, через те, що результатом виконання операції є об¢єкт того ж роду, що ї об¢єкт, над яким виконується операція, а саме – таблиця. Це, крім того, означає, що над результатом операції можна виконувати знову деякі операції (вибрати стовпці). Весь інформаційний вміст бази представляється виключно одним єдиним способом, а саме – явним завданням значень, розміщених в позиціях стовпців у рядках таблиці. Цей метод представляється єдино можливим для реляційних баз даних (на логічному рівні). Зокрема, немає ніяких вказівників, які пов¢язують одну таблицю з іншою.
Якщо припустити, що реляційна база даних – це просто база даних, в якій дані зберігаються у вигляді таблиць, тоді виникає питання, чому ми називаємо таку базу реляційною , а не табличною ? Відповідь проста (вона вже колись звучала) – relation (відношення) це математична назва таблиці. Наприклад, можна сказати, що база даних робітників і відділів містить два відношення .
У даний час у неформальному контексті терміни відношення та таблиця вважаються синонімами. На практиці термін таблиця використовується частіше, ніж термін відношення .
Типи – це об¢єкти (множини об¢єктів), які можна обговорювати. Відношення – це факти (множини фактів), відносно об¢єктів, які можна обговорювати.
З концептуальної точки зору операції з представленнями фактично реалізуються через заміну посилання на ім¢я представлення, виразом,який визначає представлення (тобто виразом, збереженим у каталозі). Тому можна стверджувати, що базові змінні-відношення існують незалежно, а представлення – ні, оскільки залежать від базових змінних-відношень.
5. Основні поняття реляційної моделі даних. Тип даних, домен, кортеж, атрибут, кардинальність, степінь відношення. Схема відношення та бази даних
Найбільш поширена трактовка реляційної моделі даних належить Дейту. Згідно ньому реляційна модель характеризується трьома частинами, що описують різні аспекти реляційного підходу: Єдиною структурою даних, що використовується в реляційних БД; механізмами маніпулювання даними та цілісністю сутностей та посилань.
Реліційна модель складається з п¢яти компонентів:
1. Необмежений набір скалярних типів (включаючи, зокрема, логічний тип або значення істини);
2. Генератор типів відношень і відповідна інтерпретація для таких згенерованих типів відношень.
3. Можливість визначення змінних відношень для таких згенерованих типів відношень.
4. Операція реляційного присвоєння для присвоєння реляційних значень таким змінним відношенням;
5. Необмежений набір реляційних операторів для одержання значень відношень з інших значень відношень.
Основними термінами тут є: відношення, домен, атрибут, кортеж, первинний ключ, кардинальність, ступінь.
Формальний реляційний термін | Неформальний еквівалент |
Відношення | Таблиця |
Кортеж | Рядок або запис |
Кардинальність | Кількість рядків |
Атрибут | Стовпчик або поле |
Степень | К-ть стовпчиків |
Первинний ключ | Унікальний ідентифікатор |
Домен | Сукупність допустимих значень |
Поняття типу даних в реляційній моделі даних повністю адекватно поняттю типа даних у мовах програмування. Кожне значення даних обов¢язково повинно мати свій тип.
Поняття домена більш специфічне для баз даних, хоча і має деякі аналогії з підтипами в деяких мовах програмування. Це дещо відмінне від типу даних, що визначаються системою, подібно наведеним. Основне призначення доменів у мові SQL – дозволити надавати (присвоїти) вбудованим типам скорочених імен, які можна було б використовувати для спрощеного запису визначення деяких стовпців у базових таблицях, наприклад таким чином:
CREATE DOMAIN S# CHAR(5);
CREATE DOMAIN P# CHAR(6):
Кортеж - це множина пар {ім’я атрибуту, значення}, яка містить одне входження кожного імені атрибуту, що належить схемі відношень. "Значення" є допустимим значенням домена даного атрибута (або типу даних, якщо поняття домена не підтримується). Тому, тут t – множина компонентів виду Аі :nі , в яких nі – значення типу Ті , тобто значення атрибуту для атрибуту Аі в кортежі t (i=1, 2,…n).
Значення m та n називають відповідно кардинальністю та ступінню (арністю). У подальшому відношення степені 1 називатимемо унарним, 2 – бінарним, 3 – тернарним, n- n-арним. Тим самим, ступінь або "арність" кортежа, тобто число елементів у ньому, співпадає з "арністю" відповідної схеми відношень. Простіше кажучи, кортеж - це набір іменованих значень одного типу (рядок у відношенні). Набір кортежі складає тіло відношення.
Оскільки відношення є множинами кортежів, в них не повинні зустрічатися однакові кортежі і порядок кортежів у відношенні є несуттєвим.
Схема відношення - це іменована множина пар ім’я атрибута, ім’я домена (або типу, якщо поняття домена не підтримується). Ступінь, або "арність" схеми відношення - потужність цієї множини. Якщо всі атрибути одного відношення визначені на різних доменах, доцільно використовувати для іменування атрибутів імена відповідних доменів (пам’ятаючи при цьому, що це є лише зручним засобом іменування і не усуває різниці між поняттями домена і атрибута).