Полезное:

Категории:

Архитектура Астрономия Биология География Геология Информатика Искусство История Кулинария Культура Маркетинг Математика Медицина Менеджмент Охрана труда Право Производство Психология Религия Социология Спорт Техника Физика Философия Химия Экология Экономика Электроника

Лекция 4 Основы информационных систем. Базы данных

⇐ ПредыдущаяСтр 3 из 4Следующая ⇒

1. Как сформировалось понятие «база данных»?

Ба́за да́нных — представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

В широком смысле понятие истории баз данных обобщается до истории любых средств, с помощью которых человечество хранило и обрабатывало данные. В таком контексте упоминаются, например, средства учёта царской казны и налогов в древнем Шумере (4000 г. до н. э.), узелковая письменность инков — кипу, клинописи, содержащие документы Ассирийского царства и т. п. Следует помнить, что недостатком этого подхода является размывание понятия «база данных» и фактическое его слияние с понятиями «архив» и даже «письменность».

История баз данных в узком смысле рассматривает базы данных в традиционном (современном) понимании. Эта история начинается с 1955 года, когда появилось программируемое оборудование обработки записей. Программное обеспечение этого времени поддерживало модель обработки записей на основе файлов. Для хранения данных использовались перфокарты.[10]

Оперативные сетевые базы данных появились в середине 1960-х. Операции над оперативными базами данных обрабатывались в интерактивном режиме с помощью терминалов. Простые индексно-последовательные организации записей быстро развились к более мощной модели записей, ориентированной на наборы. За руководство работой Data Base Task Group (DBTG), разработавшей стандартный язык описания данных и манипулирования данными, Чарльз Бахман получил Тьюринговскую премию.

В это же время в сообществе баз данных COBOL была проработана концепция схем баз данных и концепция независимости данных.

Следующий важный этап связан с появлением в начале 1970-х реляционной модели данных, благодаря работам Эдгара Ф. Кодда. Работы Кодда открыли путь к тесной связи прикладной технологии баз данных с математикой и логикой. За свой вклад в теорию и практику Эдгар Ф. Кодд также получил премию Тьюринга.

Сам термин база данных (англ. database) появился в начале 1960-х годов, и был введён в употребление на симпозиумах, организованных компанией SDC в 1964 и 1965 годах, хотя понимался сначала в довольно узком смысле, в контексте систем искусственного интеллекта. В широкое употребление в современном понимании термин вошёл лишь в 1970-е годы.

2. Какое место базы данных занимают в структуре информационных систем?

Основой для многих информационных систем (прежде всего, информационно-справочных систем) являются базы данных.

База данных (БД) — это совокупность специальным образом организованных данных, хранимых в памяти вычислительной системы и отражающих состояние и взаимодействие объектов в определенной предметной области.

Под вычислительной системой здесь понимается отдельный компьютер или компьютерная сеть. В первом случае база данных называется централизованной, во втором случае — распределенной.

База данных является компьютерной информационной моделью некоторой реальной системы. Например, книжного фонда библиотеки, кадрового состава предприятия, учебного процесса в школе и т. д. Такую систему называют предметной областью базы данных и информационной системы, в которую БД входит.

Описание структуры данных, хранимых в БД, называется моделью представления данных или короче — моделью данных. В теории БД известны три классические модели данных: иерархическая, сетевая и реляционная (табличная). Об этом уже шла речь в §14. По виду используемой модели данных базы данных делятся на иерархические, сетевые и реляционные (табличные).

Для управления самой базой данных в составе информационной системы может быть предусмотрена система управления базами данных (СУБД)

Система управления базами данных (СУБД) — комплекс языковых и программных средств, предназначенных для создания, ведения и использования базы данных многими пользователями.

В зависимости от вида используемой модели данных различаются иерархические, сетевые и реляционные СУБД.

Наибольшее распространение на персональных компьютерах получили так называемые полнофункциональные реляционные СУБД. Они выполняют одновременно как функцию системных средств (см. рис.5.1), так и функцию пользовательского инструмента для создания приложений. Примером СУБД такого типа является Microsoft Access.

Полноценная информационная система на компьютере состоит из трех частей:

СУБД + база данных + приложения.

Основные действия, которые пользователь может выполнять с помощью СУБД:

- создание структуры базы данных;

- заполнение базы данных информацией;

- изменение (редактирование) структуры и содержания базы данных;

- поиск информации в БД;

- сортировка данных.

3. Из каких этапов слагается проектирование баз данных?

Проектирование баз данных — процесс создания схемы базы данных и определения необходимых ограничений целостности.

Основные этапы проектирования баз данных:

1 Концептуальное (инфологическое) проектирование — построение семантической модели предметной области, то есть информационной модели наиболее высокого уровня абстракции. Такая модель создаётся без ориентации на какую-либо конкретную СУБД и модель данных. Термины «семантическая модель», «концептуальная модель» и «инфологическая модель» являются синонимами. Кроме того, в этом контексте равноправно могут использоваться слова «модель базы данных» и «модель предметной области» (например, «концептуальная модель базы данных» и «концептуальная модель предметной области»), поскольку такая модель является как образом реальности, так и образом проектируемой базы данных для этой реальности.

Конкретный вид и содержание концептуальной модели базы данных определяется выбранным для этого формальным аппаратом. Обычно используются графические нотации, подобные ER-диаграммам.

Чаще всего концептуальная модель базы данных включает в себя:

описание информационных объектов или понятий предметной области и связей между ними.

описание ограничений целостности, т.е. требований к допустимым значениям данных и к связям между ними.

2 Логическое (даталогическое) проектирование — создание схемы базы данных на основе конкретной модели данных, например, реляционной модели данных. Для реляционной модели данных даталогическая модель — набор схем отношений, обычно с указанием первичных ключей, а также «связей» между отношениями, представляющих собой внешние ключи.

Преобразование концептуальной модели в логическую модель, как правило, осуществляется по формальным правилам. Этот этап может быть в значительной степени автоматизирован.

На этапе логического проектирования учитывается специфика конкретной модели данных, но может не учитываться специфика конкретной СУБД.

3 Физическое проектирование — создание схемы базы данных для конкретной СУБД. Специфика конкретной СУБД может включать в себя ограничения на именование объектов базы данных, ограничения на поддерживаемые типы данных и т.п. Кроме того, специфика конкретной СУБД при физическом проектировании включает выбор решений, связанных с физической средой хранения данных (выбор методов управления дисковой памятью, разделение БД по файлам и устройствам, методов доступа к данным), создание индексов и т.д.

4 Нормализация – приведение базы данных к нормальной форме. Обязательна для реляционных баз данных.

- исключение некоторых типов избыточности;

- устранение некоторых аномалий обновления;

- разработка проекта базы данных, который является достаточно «качественным» представлением реального мира, интуитивно понятен и может служить хорошей основой для последующего расширения;

- упрощение процедуры применения необходимых ограничений целостности.

4. Какие принципы системного анализа используются при проектировании баз данных?

Прежде, чем создать базу данных необходимо провести системный анализ предметной области.

Системный анализ базируется на ряде общих принципов

Принцип - это обобщенные опытные данные, это закон явлений, найденный из наблюдений. Поэтому их истинность связана только с фактом, а не с какими-либо домыслами. (Слайд 6)

Принцип оптимальности. Известно, что характерной чертой современного развития (а развитие - это один из принципов диалектики!) является выбор наиболее подходящего варианта развития. В живой природе подобное совершается в виде естественного отбора, хотя имеет место и искусственный отбор, например в деятельности селекционеров. В развитии какого-либо объекта мы также должны иметь дело с отбором. В ходе практического освоения научных достижений важно выбирать такие творческие решения, которые являются лучшими по комплексу показателей для заданных условий.

Принцип системности. Чтобы действительно знать предмет, надо охватить, изучить все его стороны, все связи и опосредствования. Мы никогда не достигаем этого полностью, но требование всесторонности предостерегают нас от ошибок. Принцип системности предполагает подход к новому объекту как к комплексному объекту, представленному совокупностью взаимосвязанных частных элементов. Он предполагает исследование объекта, с одной стороны, как единого целого, а с другой стороны, как части более крупной системы, в которой анализируемый объект находится с остальными системами в определенных отношениях. Таким образом, принцип системности охватывает все стороны объекта и предмета в пространстве и во времени!

Принцип иерархии. Иерархические отношения имеют место во многих системах, для которых характерна как структурная, так и функциональная дифференциация, т.е. способность к реализации определенного круга функций. В реальных системах иерархическая структура никогда не бывает абсолютно жесткой в силу того, что иерархия сочетается с большей или меньшей автономией нижележащих уровней по отношению к вышележащим, и в управлении используются присущие каждому уровню возможности самоорганизации.

Принцип интеграции. Интегративные свойства объекта появляются в результате совмещения элементов до целого, а также в ходе совмещения функций во времени и в пространстве.

Принцип формализации (формальный - относящийся к форме, в противоположность сущности, т.е. несущественный) нацелен на получение количественных и комплексных характеристик.

Необходимо отметить, что эти классические принципы системного анализа, носят, прежде всего, философский характер, постоянно развиваются, причем в разных направлениях.

Таким образом, согласно принципам системного анализа возникающая перед обществом та или иная сложная проблема должна быть рассмотрена в целостном контексте - как система во взаимодействии всех ее компонентов, чаще всего как организация компонентов, имеющая общую цель.

5. Дайте определение иерархической, сетевой, реляционной моделям данных? В чем сходство? В чем принципиальная разница?

Реляционная модель данных (РМД) — логическая модель данных, прикладная теория построения баз данных, которая является приложением к задачам обработки данных таких разделов математики, как теория множеств и логика первого порядка.

На реляционной модели данных строятся реляционные базы данных.

Реляционная модель данных включает следующие компоненты:

Структурный аспект (составляющая) — данные в базе данных представляют собой набор отношений.

Аспект (составляющая) целостности — отношения (таблицы) отвечают определенным условиям целостности. РМД поддерживает декларативные ограничения целостности уровня домена (типа данных), уровня отношения и уровня базы данных.

Аспект (составляющая) обработки (манипулирования) — РМД поддерживает операторы манипулирования отношениями (реляционная алгебра, реляционное исчисление).

Для лучшего понимания РМД следует отметить три важных обстоятельства:

модель является логической, то есть отношения являются логическими (абстрактными), а не физическими (хранимыми) структурами;

для реляционных баз данных верен информационный принцип: всё информационное наполнение базы данных представлено одним и только одним способом, а именно — явным заданием значений атрибутов в кортежах отношений; в частности, нет никаких указателей (адресов), связывающих одно значение с другим;

наличие реляционной алгебры позволяет реализовать декларативное программирование и декларативное описание ограничений целостности, в дополнение к навигационному (процедурному) программированию и процедурной проверке условий.

Иерархическая модель данных — это модель данных, где используется представление базы данных в виде древовидной (иерархической) структуры, состоящей из объектов (данных) различных уровней.

Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект более близкий к корню) к потомку (объект более низкого уровня), при этом возможна ситуация, когда объект-предок не имеет потомков или имеет их несколько, тогда как у объекта-потомка обязательно только один предок. Объекты, имеющие общего предка, называются близнецами (в программировании применительно к структуре данных дерево устоялось название братья).

Основными информационными единицами в иерархической модели данных являются сегмент и поле. Поле данных определяется как наименьшая неделимая единица данных, доступная пользователю. Для сегмента определяются тип сегмента и экземпляр сегмента. Экземпляр сегмента образуется из конкретных значений полей данных. Тип сегмента — это поименованная совокупность входящих в него типов полей данных.

Как и сетевая, иерархическая модель данных базируется на графовой форме построения данных, и на концептуальном уровне она является просто частным случаем сетевой модели данных. В иерархической модели данных вершине графа соответствует тип сегмента или просто сегмент, а дугам — типы связей предок — потомок. В иерархических структуpax сегмент — потомок должен иметь в точности одного предка.

Иерархическая модель представляет собой связный неориентированный граф древовидной структуры, объединяющий сегменты. Иерархическая БД состоит из упорядоченного набора деревьев.

(из лекций Проф. Дубова И.Р. Базы данных)

Поле – минимальная неделимая единица данных доступная СУБД

Тип сегмента – именованная совокупность полей

Экземпляр сегмента – совокупность значений полей

Связь между сегментами: логически исходный сегмента – логически подчиненный сегмент

Каждый тип сегмента образует набор однородных данных (древовидный граф)

База данных – совокупность отдельных деревьев, каждое называется физической базой данных

Исходный сегмент имеет произвольное количество подчиненных сегментов

У подчиненного сегмента – ровно один исходный сегмент

Непосредственная поддержка связей 1:1 и 1:N.

Трудность моделирования связей N:M, моделируются с помощью декомпозиции и дублирования

Рекурсивные связи реализуются только с помощью декомпозиции и дублирования

Экземпляры дочерних сегментов не могут существовать без родительских экземпляров сегментов. При удалении экземпляра сегмента удаляется все его поддерево

Доступ к записям осуществляется путем перемещения (навигации) от корневого типа сегмента к подчиненным сегментам

Сетевая модель данных — логическая модель данных, являющаяся расширением иерархического подхода, строгая математическая теория, описывающая структурный аспект, аспект целостности и аспект обработки данных в сетевых базах данных.

Разница между иерархической моделью данных и сетевой состоит в том, что в иерархических структурах запись-потомок должна иметь в точности одного предка, а в сетевой структуре данных у потомка может иметься любое число предков.

Сетевая БД состоит из набора экземпляров определенного типа записи и набора экземпляров определенного типа связей между этими записями.

Тип связи определяется для двух типов записи: предка и потомка. Экземпляр типа связи состоит из одного экземпляра типа записи предка и упорядоченного набора экземпляров типа записи потомка. Для данного типа связи L с типом записи предка P и типом записи потомка C должны выполняться следующие два условия:

каждый экземпляр типа записи P является предком только в одном экземпляре типа связи L;

каждый экземпляр типа записи C является потомком не более чем в одном экземпляре типа связи L.

⇐ Предыдущая 1 234 Следующая ⇒

Date: 2016-06-09; view: 524; Нарушение авторских прав; Помощь в написании работы --> СЮДА...

mydocx.ru - 2015-2024 year. (0.005 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию