Тема 3. Общие принципы построения моделей данных. Модели данных в ГИС
Использование моделей данных необходимо для обеспечения их анализа и управления ими. Именно модели данных составляют информационную основу ГИС. В процессе функционирования ГИС все многообразие входных данных - характеристики объектов, формы и связи между объектами, различные описательные сведения - преобразуется в единую общую модель (набор моделей), хранимую в БД.
Базовые модели данных, используемые в ГИС, включают целый ряд моделей.
Инфологическая модель дает формализованное описание предметной области независимо от структур данных, исключая неоднозначность за счет использования средств формальной логики. Одним из главных понятий является понятие объекта. Инфологическая модель позволяет выделить три категории фактов: истинные, значимые и ложные. Таким образом, инфологическая модель предполагает возможность представления любого сообщения с какой-то долей вероятности в виде аналога мнения. Целью инфологического моделирования является формализация объектов реального мира предметной области и методов обработки информации в соответствии с поставленными задачами обработки и требованиями представления данных естественными для человека способами сбора и представления информации. Основными компонентами инфологической модели являются: описание предметной области; описание методов обработки; описание информационных потребностей пользователя.
Иерархическая модель является одной из наиболее простых структурно определенных. В этой модели данных связи между ее частями жесткие, а структурная диаграмма - упорядоченное дерево. В качестве одного из важных понятий для этой модели следует определить уровень. Граф иерархической модели представляет собой дерево и включает два типа элементов: дуги (ребра) и узлы (вершины). Дуги, соответствующие функциональным связям, всегда должны быть направлены от корня в листья, т.е. граф имеет ориентацию (орграф). Рассматривая последовательность связей, можно определить родительскую и дочернюю вершины (записи) и таким образом определить иерархический путь записей. Примером является структура файловой системы. Иерархические модели достаточно широко применяются при составлении различного рода классификаторов.
Реляционная модель данных основана на математической теории отношений, опирается на систему понятий: таблица, отношение, строка, столбец, ключ, домен.
Определение 14.
Столбец соответствует некоторому элементу данных - атрибуту, который представляет простейшую структуру данных.
Определение 15.
Столбец таблицы со значениями соответствующего атрибута называется доменом.
Определение 16.
Строка со значениями разных атрибутов называется кортежем.
Таблица состоит из строк и столбцов и имеет имя, отражает тип объекта реального мира (сущность), а каждая строка - конкретный объект.
Сущности, атрибуты и связи хранятся в таблицах как данные определенной структуры.
Основным средством структурирования данных является отношение. Таблица имеет столбцы и строки (записи). Запись есть совокупность атрибутов (кортеж). Записи каждого типа образуют таблицу или отношение.
Модель "сущность - связь" дает представление о предметной области в виде объектов, называемых сущностями, между которыми фиксируются связи. В основе модели лежит представление о том, что предметная область состоит из отдельных объектов, находящихся друг с другом в определенных связях.
В качестве других моделей могут быть рассмотрены сетевые модели, использующие чаще всего табличные и графовые представления (вершинам графов сопоставляют некоторые типы сущностей в виде таблиц, а дугам - типы связей). Многие типы сетевых моделей данных используют для описания экономических и организационных систем.
Организация данных в ГИС имеет свои особенности, которые прежде всего заключаются в использовании картографических данных.
Геометрически информация, содержащаяся на карте, может быть определена как совокупность наборов точек линий, контуров и площадей, имеющих метрические значения. Эта информация образует класс координатных данных ГИС.
Основные типы координатных моделей ГИС: точка (узлы, вершины), линия (незамкнутая), контур (замкнутая линия), полигон (ареал, район) группы примыкающих друг к другу замкнутых участков. Приведенные понятия носят концептуальный характер. На практике для построения реальных объектов используют большее число координатных моделей. Простейший тип пространственного объекта задают точечные данные, к которым относятся не только точки, но и все точечные условные знаки. Выбор объектов, представляемых в виде точек, зависит от масштаба карты или цели исследования. Информацию о наборе точек можно представить в виде таблицы, содержащей кроме координат наборы атрибутов. В таких таблицах каждая строка соответствует конкретной точке.
Линейные объекты широко применяются для описания сетей, для которых в отличие от точечных объектов характерно присутствие топологических признаков. Линейные объекты имеют свои атрибуты, разные для дуг и звеньев. Например, атрибутами для дуг являются направление движения, интенсивность, количество полос, диаметр трубы, направление движения газа, напряжение в ЛЭП, высота опор, количество путей, уклон, ширина тоннеля, мощность компрессора и т.д. Некоторые атрибуты (названия пересекающихся улиц) служат для связи одного типа объектов с другими.
Ареалы могут быть нескольких типов в зависимости от приложения: зоны окружающей среды или природных ресурсов, социально-экономические зоны, данные об угодьях и др. Границы для ареальных объектов определяются либо свойством, либо явлением, а также могут быть установлены искусственно (для микрорайонов).
С использованием координатных данных непосредственно связаны особенности инструментальных средств ГИС.
Инструментальные пакеты программного обеспечения в отличие от жестко функциональных систем позволяют настраивать систему с учетом особенностей работы, вида информации, методов ее обработки, хранения, представления.
Серия модулей, составляющих большинство инструментальных пакетов ГИС, обеспечивает, с одной стороны, определенную свободу выбора технологии обработки, с другой - решение достаточно общих задач: цифрование карт, обмен данными в различных форматах, работа с реляционной БД, визуализация и наложение карт и др.
Существует целый ряд ГИС, включая отечественные разработки, которые достаточно широко распространяются и используются в информационных системах соответствующего назначения. Среди них следует, в первую очередь, назвать мировых лидеров пакеты ARCINFO, ARCVIEW, пакеты фирмы ERDAS, а также пакеты ИГ РАН GEODRAW/GEOGRAPH. При выборе программного обеспечения необходимо предварительно тщательно проанализировать перспективы развития информационной системы в плане решаемых задач, необходимости использования различных аналитических методов, а также технические возможности. Именно эти моменты играют решающую роль в обеспечении эффективного использования системы управления на основе ГИС.