Реферат: Компьютерные данные: типы данных, обработка и управление
Структурирование - это введения соглашений о способах представления данных. Неструктурированными называют данные, записанные, например, в текстовом файле.
Архитектура информационной системы , организованной с помощью БД
Эффективность функционирования информационной системы во многом зависит от ее архитектуры. В настоящее время перспективной является архитектура клиент-сервер. В достаточно распространенном варианте она предполагает наличие компьютерной сети и распределенной базы данных, включающей БД корпоративную (БДК) и БД персональные (БДП). БДК размещается на компьютере-сервере, БДП размещаются на компьютерах сотрудников подразделений, являющихся клиентами корпоративной БД.
Сервером определенного ресурса в компьютерной сети называется компьютер (программа), управляющий этим ресурсом, клиентом — компьютер (программа), использующий этот ресурс.
В качестве ресурса компьютерной сети могут выступать, к примеру, базы данных, файловые системы, службы печати, почтовые службы. Тип сервера определяется видом ресурса, которым он управляет. Например, если управляемым ресурсом является база данных, то соответствующий сервер называется сервером базы данных.
Достоинством организации информационной системы по архитектуре клиент-сервер является удачное сочетание централизованного хранения, обслуживания и коллективного доступа к общей корпоративной информации с индивидуальной работой над персональной информацией. Структура распределенной БД, построенной по архитектуре клиент-сервер, показана на рис.
Корпоративная БД создается, поддерживается и функционирует под управлением сервера БД.
Для создания и управления функционированием персональных БД и приложений, работающих с ними, используются СУБД такие, например, как Microsoft Ассеss под ОС Windows, OpenOffice.org. Base под ОС Linux.
В зависимости от размеров организации и особенностей решаемых задач информационная система может иметь одну из следующих конфигураций:
• компьютер-сервер, содержащий корпоративную и персональные базы;
• компьютер-сервер и персональные компьютеры с БДП;
• несколько компьютеров-серверов и персональных компьютеров с БДП.
Использование архитектуры клиент-сервер дает возможность постепенного наращивания информационной системы предприятия, во-первых, по мере развития предприятия; во-вторых, по мере развития самой информационной системы.
Разделение общей БД на корпоративную БД и персональные БД позволяет уменьшить сложность проектирования БД по сравнению с централизованным вариантом, а значит, снизить вероятность ошибок при проектировании и стоимость проектирования.
Важнейшим достоинством применения БД в информационных системах является обеспечение независимости данных от прикладных программ. Это позволяет не обременять пользователей проблемами представления данных на физическом уровне: размещения данных в памяти, методов доступа к ним и т. д.
Такая независимость достигается поддерживаемым СУБД многоуровневым представлением данных в БД на логическом (пользовательском) и физическом уровнях. Иными словами, благодаря СУБД и наличию логического уровня представления данных обеспечивается отделение концептуальной (понятийной) модели БД от ее физического представления в памяти ЭВМ.
Основные шаги проектирования БД:
- Определить информационные потребности БД;
- Проанализировать объекты, которые нужно промоделироватьвБД.
Основные типы моделей данных
Ядром любой базы данных есть модель данных. Модель данных представляет собой великое множество структур данных, ограничений целостности и операций манипулирования данными. С помощью модели данных могут быть представленные объекты предметной области, взаимосвязи между ними. Модель данных - это совокупность структур данных и операций их обработки. Современная СУБД базируется на использовании иерархической, сетевой, реляционной и объектно-ориентированной моделях данных, комбинации этих моделей или на некотором их подмножестве.
Рассмотрим три основных типа моделей данных: иерархическую, сетевую, реляционнную и объектно-ориентированную.
Иерархическая модель данных. Иерархическая структура представляет совокупность элементов, связанных между собою по определенным правилам. Объекты, связанные иерархическими отношениями, образовывают ориентированный граф (перевернутое дерево), пример которого надається на рис.2. К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь. Иерархическую модель организовывает данные в виде древовидной структуры. Узел - это совокупность атрибутов данных, которые описывают некоторый объект. На схеме иерархического дерева узлы имеют вид вершин графа. Каждый узел на болеенизком уровне связан только с одним узлом, который находится на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), которая не подчинена никакой другой вершине. Зависимые (подчиненные) узлы находятся на втором, третьем и других уровнях. Количество деревьев вбазе данных определяется числом корневых записей.
Сетевая модель данных
Сетевая модель означает представление данных в виде произвольного графа. Достоинством сетевой и иерархической моделей данных является возможность их эффективной реализации по показателям затрат памяти и оперативности. Недостатком сетевой модели данных является высокая сложность и жесткость схемы БД, построенной на ее основе.
Реляционнаяна модель данных. Понятие реляционный (англ. relation - отношение) связанс разработками известного американского специалиста в области систем баз данных Э.Ф. Кодда. Эти модели характеризуются простотой структуры данных, удобной для пользователя формой представления в виде таблиц и возможностью использования аппарата алгебры отношений и реляционнного вычисления для обработки данных.
На языке математики отношение определяется таким образом. Пусть заданоn множеств D1,D2, ...,Dn. Тогда R есть отношение над этими множествами, если R есть множеством упорядоченных наборов вида <d1,d2,...,dn>, где d1 - элемент сD1 , d2 - элемент сD2 , ... , dn - элемент сDn. При этом наборы вида <d1,d2,...,dn> называются кортежами, а множества D1,D2, ...Dn - доменами. Каждый кортеж состоит из элементов, которые выбираются из своих доменов. Эти элементы называются атрибутами, а их значения - значениями атрибутов.
Итак, реляционнная модель ориентирована на организацию данных в виде двумерных таблиц, любаяиз которых имеет следующие свойства:
- каждый элемент таблицы - это один элемент данных;
- все столбцы втаблицы - однородные, т.е все элементы встолбце имеют одинаковый тип (символьный, числовой и т.п.);