Трусов А.В., г. Пермь

Категорийно-функторная концепция в задачах моделирования информационно-поисковых систем

Категорийно-функторная концепция, широко обобщающая и развивающая концепцию математической структуры и отражающая новый революционный процесс в математике, является одним из наиболее ярких проявлений системного мышления. В то же время она глубоко проникает в прикладные направления системного подхода в связи с реализацией принципа многомодельности, иллюстрируя тем самым удивительную гармонию в развитии науки [1].

Моделями универсума знаний, накопленных человечеством, являются системы классификаций типа универсальной десятичной классификации (УДК). Подобная система, в свою очередь, может быть описана категорией R, состоящей из класса объектов ObR, составленного на базе множества дескрипторов (устойчивых словосочетаний) D, и класса морфизмов MorR (стрелок):

1)     для каждой упорядоченной пары объектов d1 и d2 определено множество морфизмов Mor(d1, d2) с элементами f:d1®d2, где d1 – область определения или начало морфизма, а d2 – область значений или конец морфизма (в частности множество может быть пустым, если еще не создана описывающая парой d1, d2 область знаний);

2)     для любой упорядоченной тройки объектов d1, d2, d3 и морфизмов f:d1® d2, g:d2®d3 определена операция композиции (произведения) морфизмов g ° f:d1 ® d3;

3)     для любой упорядоченной четверки объектов d1, d2,, d3 , d4 и морфизмов f:d1®d2, g:d2®d3 , h:d3®d4 выполняется закон ассоциативности морфизмов h ° (g ° f)=(h ° g) ° f;

4)     для каждого объекта d в множестве морфизмов Mor(d, d) выделен тождественный морфизм 1d:d®d, для которого и любой пары морфизмов f:d1®d2 и g:d3®d1 выполняется закон тождества f ° 1d=f, 1d ° g=g.

Отдельно взятый документ Zi во всем множестве записей Z распределенных информационных систем (РИС) глобальной вычислительной сети (ГВС) при информационном поиске обычно представлен моделью (тегом), которую можно считать подкатегорией rZ категории R'(rZÌR), так как каждый ее объект, морфизм и композиция являются соответственно объектом, морфизмом и композицией категории R.

Подкатегорией Rk категории R следует считать систему классификации, например RУДК, с ее основными и вспомогательными таблицами, включающие общие и специальные определители.

Объекты d1, d2 категории Rk непосредственно связаны, если множество морфизмов MorRk(d1, d2) не пусто или не пусто множество морфизмов MorRk(d2, d1). Если же имеет место MorRk(d1, d2)¹0 и MorRk(d2, d1)¹0 одновременно, то объекты d1, d2 являются непосредственно сильно связанными. В силу требования выполнения правила композиции морфизмов, сильно связанными (но не обязательно непосредственно) оказываются любые объекты d1, d2, для которых найдена такая последовательность объектов d1, d11, d12, ,d2, при которой выполняется условия MorRk(d1i, d1(i+1))¹0 и MorRk(d1(i+1), d1i) ¹ 0. Если же выполняется лишь одно из этих условий, то объекты называются связанными (слабо связанными). Характеристика связности объектов переносится на характеристику категории (подкатегории).

Связную подкатегорию RkoÌRk с началом морфизма d0, заданным основным элементом Rk, будем называть областью знаний, подкатегорию rIÌRko с началом морфизма I, индексом (классификатором) алфавитно-предметного указателя (АПУ) УДК, – простой предметной областью. Совокупность простых предметных областей, связанных синтаксическими морфизмами (знаками), образуют составные (сложные) предметные области.

Подборкой соответствующих морфизмов можно построить подкатегории синонимии, полисемии и омонимии.

Посредством функторов можно установить связи между различными категориями математических моделей областей знаний и предметных областей.

Одноместным ковариантным функтором F:R®Q из категории R в категорию Q определим пару отображений F:ObR®ObQ, F:MorR®MorQ, сопоставляющую каждому объекту dÎObR объект F(d)ÎObQ, каждому морфизму fÎMorR(d1, d2) морфизм F(f)ÎMorQ(F(d1), F(d2)) и сохраняющую операцию умножения (композиции) морфизмов F(f ° g)=F(f) ° F(g) и тождественный морфизм (F(1d))=1F(d).

В целом одноместный ковариантный функтор характеризуется как отображения из одной категории в другую, сохраняющий категорийную структуру.

Род-видовые отношения, общие и специальные определители УДК реализуют пренебрегающие ковариантные функторы, посредством которых осуществляется переход от категорий, описывающих более богатые, более сложные предметные области к более бедным категориям. При этом точность отображения поисковых предписаний возрастает, жертвуя полнотой описания.

Определение одноместного контравариантного функтора отличается от ковариантного введением следующих двойственных условий:

–     каждому морфизму fÎMorR(d1, d2) сопоставляется морфизм F(f)ÎMorQ(F(d2), F(d1)) и произведение морфизмов инвертируется F(f ° g)=F(g) ° F(f).

Символы присоединения, распространения, группирования, простых и закрепленных отношений реализуют конструктивные контравариантные функторы (восстанавливающие, обогащающие) определяющие обратные по сравнению с ковариантными переходами, позволяющие целенаправленно наращивать сложность, богатство объектов категорий.

Наряду с одноместными функторами в интересах повышения релевантности и пертенентности информационного поиска могут рассматриваться n-местные функторы как отображение декартового произведения категорий в некоторую категорию. Так типовые (скользящие) окончания, параллельное подразделение и другие позволяют представлять предметную область в многомерном (n-мерном) виде.

Установление связей между категориями посредством функторов может преследовать разные цели, такие как:

–     выявление свойств различных предметных областей и областей знаний;

–     сведение исследований одних предметных областей к исследованию других, в том числе в различных областях знаний;

–     совместное изучение и формирование новых моделей данного класса;

–     построение методологий некомпрометирующего предметную область поиска.

Основанная на этих идеях категорийно-функторная модель поиска информации в распределенных информационных системах представлена на рис.1.

Предметные области посредством предложенной концепции могут формироваться и подвергаться селекции в неявном виде, обеспечивая конфиденциальность поиска, что иллюстрируется примерами различной сложности на рис.2. В простейшем случае (рис.2а.) пертенентность достигается отношением

(1)

во втором (рис.2б.), выражением

(2)

в третьем (рис.2в.), выражением

(3)

Идентификация предметной области может производиться на основе категорий и искусственного интеллекта как категорий обобщенных описаний ситуаций, так называемых образцов.

Категория образцов формируется как некоторая подкатегория категории множеств дескрипторов, где выделяется базовый объект D (поисковое предписание) и в качестве образцов рассматриваются пары (d, f), где d - объект данной подкатегории, f:d®D – морфизм (fÎMor(d,D)). В общем случае не все виды морфизмов, входящих в данное множество, привлекаются для построения образцов. Данная подкатегория может служить выявлению сопоставимости с образцами некоторой новой ситуации, задаваемой новым поисковым предписанием D'. Задача решается при условии упорядочения образцов по отношению друг к другу и по отношению к рассматриваемой ситуации.

Литература

1.     Резников Б.Л. Системный анализ и методы системотехники. – МО СССР, 1990. – 522 с.