Булатов А. Н., г. Пермь

ПАРАМЕТРИЗАЦИЯ РАЗМЕРНОСТЕЙ МНОГОМЕРНОЙ МОДЕЛИ ДАННЫХ В СИСТЕМАХ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ И ХРАНИЛИЩАХ ДАННЫХ

В данной статье описываются проблемы, возникающие при использовании многомерной модели данных в процессе построения хранилищ данных, и предлагается оригинальная авторская модель параметрических измерений для их решения.

Многомерная модель данных возникла достаточно давно, но всеобщее признание получила относительно недавно, когда задача анализа данных начала преобладать над задачей хранения. Реляционные СУБД, превосходно проявляющие себя в задачах оперативной транзакционной обработки и хранения данных, оказались неспособными эффективно решать задачи оперативного анализа данных. Пробел в этой области был заполнен благодаря работам таких авторов как Кодд [2], Инмон [4, 5, 6], Демарест [3], которые определили новое направление в создании информационных систем аналитической обработки информации. В настоящее время все большее число предприятий и организаций осознают необходимость создания упорядоченных информационных потоков внутри организации и эффективного информационного взаимодействия с внешним миром. Решение этого вопроса требует внедрения новых технологий, таких как Хранилища Данных (ХД).

ХД может быть определено как «предметно-ориентированная, интегрированная, инвариантная по времени, не разрушаемая совокупность данных, предназначенная для поддержки принятия управленческих решений» [1]. Центральное место в технологии ХД занимает многомерная модель данных (ММД), базирующаяся на трех основных типах объектов: измерение, куб и показатель. Измерение – это иерархический набор элементов, имеющих определенную общность. В качестве примера можно привести: измерение «Субъекты РФ», измерение «Отрасли», измерение «Календарь». Куб – это  совокупность показателей, значения которых однозначно определяются фиксированным набором измерений.

При неоспоримых достоинствах технологий ММД и ХД возникают проблемы, носящие черты характерных общих затруднений, с которыми сталкиваются разработчики ХД:

–     пользователи быстро пришли к пониманию того, что статичные измерения не всегда подходят для описания непрерывно меняющихся условий реальной жизни;

–     непрерывный рост количества элементов измерений;

–    представление сложно структурированной информации;

–    медленно меняющиеся размерности, имеющие особое значение в технологии ХД. Любой признак измерения может зависеть от даты: набор и значения атрибутов, отношения порядка и иерархии.

Для решения этих проблем была разработана и реализована в рамках аналитического комплекса «Прогноз» оригинальная модель параметрических измерений. Суть данной модели заключается в следующем: любое измерение системы может иметь список управляющих параметров, причем в качестве параметров могут выступать элементы других измерений.

Подобная модель измерений позволяет решить озвученные выше проблемы. Параметрические измерения позволяют представить одно измерение с разных «точек обзора». Диапазон применения этой возможности чрезвычайно широк, начиная с представления календарного измерения в виде двух иерархий «годы-месяцы-дни» и «годы-недели-дни» (совместно их отобразить невозможно) и заканчивая формированием списка отчетных форм таким образом, чтобы конкретный пользователь видел только те отчеты, которые ему необходимы для работы.

При росте числа элементов измерение может быть разбито по некоторому признаку на обозримые области и пользователь получит возможность работать только с той частью измерения, которая ему реально требуется.

Параметризация измерений позволяет получать экземпляры измерений, имеющих древовидную структуру, даже в случае, когда реальные данные представляют собой граф (сеть).

Таим образом, параметрические измерения органично расширяют возможности классических измерений. Любое измерение легко может быть сделано управляемым через параметры. Это существенно упрощает процесс развертывания ХД на предприятии или организации независимо от используемой схемы построения ХД.

Технология параметрических измерений показала свою эффективность, пройдя успешное внедрение на многих предприятиях и организациях, таких как ОАО «Газпром», Счетная Палата РФ, Центральный Банк РФ и других.

Литература

1.    Спирли Э. Корпоративные хранилища данных: Планирование, разработка, реализация. –  Т. 1 / Пер. с англ. – М.: Издательский дом «Вильямс», 2001.

2.    Codd E.F., Codd S.B., Salley C.T. Providing OLAP (On-Line Analytical Processing) to User-Analysts: An IT Mandate. – N.Y.: John Wiley & Sons, 1993.

3.    Demarest M. Building the Data Mart // DBMS. – 1994. – July.

4.    Inmon W.H. Building the Data Warehouse. – N.Y.: John Wiley Sons, 1993.

5.    Inmon W.H. What is Data Warehouse. – N.Y.: John Wiley & Sons, 1995.

6.    Inmon W.H., Hackathorn R.D. Using the Data Warehouse. – N.Y.: John Wiley Sons, 1994.