Онтология
Онтология
Онтология (Ontology) – одна из моделей представления знаний предметной области. Под онтологией предметной области традиционно понимается семантическое описание этой предметной области. Термины «онтологическое описание», «онтологическая модель», «онтология предметной области» используются как синонимы. Онтология описывает основные концепции (положения) предметной области и определяет отношения между ними.
В настоящее время для семантического моделирования преимущественно используется объектная онтология, описывающая текущее состояние некоторой предметной области как множества объектов, связанных друг с другом отношениями. Онтология вместе с набором индивидуальных экземпляров образует базу знаний (анг. Knowledge Base).
Обычно онтологию представляют в виде ациклического ориентированного графа, вершинами которого являются объекты онтологии, а дугами – отношения между ними (свойства). Часто такую структуру из объектов и значений их свойств, построенную для определенной предметной области, называют графом знаний (анг. Knowledge Graph).
Определение онтологии
В настоящее время все еще не существует единого общепризнанного определения понятия "онтология", в научной литературе встречается множество различных определений, многие из которых противоречат друг другу.
Среди исследователей, занимающихся проблемами компьютерной лингвистики, наиболее традиционным (классическим) считается определение, данное в 1993 году Томом Грубером (Gruber T.A), американским учёным в области информатики, проделавшим фундаментальную работу по разработке онтологий:
- Онтология – это явная (формальная) спецификация концептуализации, которая имеет место в некотором контексте предметной области. Концептуализация представляет собой описание концепций (понятий), а также всю информацию, имеющую отношение к этим понятиям (свойства, отношения, ограничения, аксиомы, утверждения), необходимую для описания и решения задач в избранной предметной области. Формально онтология состоит из понятий (терминов, организованных в таксономию), их описаний и правил вывода.
Другое, часто используемое определение онтологии в информатике, представленное в Википедии, формулируется следующим образом:
- Онтология предметной области – это попытка всеобъемлющей и детальной формализации некоторой области знаний с помощью концептуальной схемы (модели). Обычно такая модель состоит из иерархической структуры данных, содержащей все релевантные классы объектов, взаимосвязи и правила (ограничения), принятые в этой области. Концептуальная модель – система концептов (понятий) и отношений (связей) предметной области. Концепт – понятие, отражающее некоторый конкретный или абстрактный объект реального мира.
И еще одно из часто встречающихся в научной литературе определений онтологии:
- Онтология – формальное явное описание понятий (или классов) в рассматриваемой предметной области, свойств (или слотов, ролей) каждого понятия, описывающих различные свойства и атрибуты понятия, и ограничений (или фацетов, ограничений ролей), наложенных на слоты.
Модель онтологии
Классическая модель онтологии O формально определяется как упорядоченная тройка вида:
O = <X,R,F>, где
- X – конечное множество концептов (понятий, терминов) предметной области, которую определяет онтология О;
- R – конечное множество отношений между концептами (понятиями, терминами) заданной предметной области;
- F – конечное множество функций интерпретации (аксиоматизация), заданных на концептах и/или отношениях онтологии О.
На множества X, R, F накладываются следующие ограничения: X – непустое конечное множество (X ≠ 0), а R и F – конечные множества.
Множества R и F могут быть пустыми, что соответствует частным видам онтологии:
1. При R = 0 и F = 0 онтология трансформируется в простой словарь, то есть, набор терминов, используемый в некоторой предметной области, без объяснений значений данных терминов. К примеру, простым словарем является любой орфографический словарь. Поскольку в таких простейших онтологиях явно не определяется смысл терминов, их использование ограничено. Представление онтологии в виде простого словаря достаточно эффективно лишь в тех случаях, когда определенные в онтологии термины принадлежат очень узкой области знаний, и их смысл уже заранее хорошо согласован в рамках определенного сообщества, например, индексы поисковых систем в Интернете.
2. При R = 0 и F ≠ 0 онтология преобразуется в глоссарий, или набор терминов с толкованием, в этом случае каждому элементу множества терминов из X ставится в соответствие функция (аксиома) и интерпретация (одна или несколько). К примеру, глоссарием является толковый словарь, позволяющий интерпретировать, уточнять и объяснять значения одних терминов на основе других, имеющихся в словаре.
3. При R ≠ 0 и F = 0 и множество отношений на концептах онтологии включает одно из отношений типа иерархии, этот случай соответствует специальному подклассу онтологий, называемыми простыми таксономиями. Под таксономической структурой понимается иерархическая система понятий, связанных между собой одним из отношений «класс-подкласс», «род-вид», «часть-целое» и т.п. При этом не приводится интерпретации понятий, смысл любого понятия раскрывается через указание его взаимосвязи с другими понятиями «вверх» и «вниз» относительно заданной таксономической структуры. Математически таксономией является древовидная структура классификаций определенного набора объектов. В отличие от онтологий, задача таксономий чётко определена в рамках иерархической классификации объектов. Например, таксономиями являются используемые в библиографии классификационные системы, которые задают отношения иерархии между понятиями.
Структура онтологии
Большинство современных онтологий описывают экземпляры (индивиды), классы (понятия), атрибуты и отношения.
В общем случае, основными компонентами онтологий являются:
Экземпляры (анг. instances) или индивиды (анг. individuals) относятся к базовым компонентам самого нижнего уровня онтологии и представляют собой конкретные физические и абстрактные объекты. В литературе они также называются объектами, элементами, терминами. Экземпляры – это отдельные представители класса сущностей или явлений, то есть конкретные элементы какого-либо класса. Экземпляр может принадлежать одному или нескольким классам, или не принадлежать ни одному. Класс может иметь любое количество экземпляров. Главной целью онтологий является именно классификация экземпляров, и хотя их наличие в онтологии не обязательно, но, как правило, они присутствуют.
Классы (анг. classes) или понятия (анг. concepts) – это абстрактные наборы, коллекции или группы объектов (экземпляров). Также они называются множествами, коллекциями, категориями, типами. Классы могут включать в себя экземпляры, другие классы, либо сочетания и того, и другого. Классы или понятия используются в широком смысле, понятием может быть любая сущность, о которой может быть дана какая-либо информация. Понятия рассматриваются как концептуализации классов всех представителей некой сущности или явления. Каждый класс описывает группу индивидуальных сущностей, которые объединены на основании наличия общих свойств.
Класс может быть определен либо экстенсиональным способом – указанием представителей класса, либо интенсиональным способом – указанием условий. Соответственно, онтология подразделяется на экземпляры, которые являются объектами или событиями реального мира, и классы, которые являются наборами объектов реального мира. Определения класса задают свойства, которым должны соответствовать экземпляры, чтобы быть членами класса. А индивиды, которые удовлетворяют этим свойствам, называются экземплярами.
Классы (или понятия) являются общими категориями, которые могут быть упорядочены иерархически. Обычно классы организованы в таксономию, иерархическую классификацию понятий по отношению включения, при этом класс может быть подклассом другого класса, наследующим все его свойства. В качестве таксономического отношения используется отношение общее-частное, обладающее свойствами транзитивности и наследования.
Атрибуты (анг. attributes)
Отношения или связи (анг. relations)
Функции (анг. functions)
Аксиомы (ограничения, правила)
Типы онтологий
Языки описания онтологий
Построение онтологий
Применение онтологий
Литература
- Gruber Thomas R. A translation approach to portable ontology specifications // Knowledge Acquisition. 1993. V.5. P. 199–220.
- Gruber Thomas R. Toward principles for the design of ontologies used for knowledge sharing // International Journal of Human-Computer Studies. 1995. Vol.43, № 5-6. P. 907–928.
- Gruber T. Ontology // Encyclopedia of Database Systems, Ling Liu and M. Tamer Özsu (Eds.), Springer-Verlag, 2009.
- Gascuena J.M., Fernandez-Caballero A., Gonzalez P. Domain ontology for personalized e-learning in educational systems // Proc. of the Sixth IEEE International Conference on Advanced Learning Technologies. 2006. P. 456–458.
- Guarino N. Formal Ontology and Information Systems // Proceedings of the 1st International Conference on Formal Ontologies in Information Systems, FOIS'98, Trento, Italy. IOS Press, Amsterdam, 1998. P. 3-15
- Guriano N. Understanding, Building, and Using Ontologies // International Journal of Human and Computer Studies. 1997. Vol. 46. P. 293–310.
- Smith M.K., Welty C., McGuinness D. OWL Web Ontology Language Guide. 10.02.2004. [Электронный ресурс]. URL: http://www.w3.org/TR/owl-guide/
- Uschold M., Gruninger M. Ontologies: Principles, Methods and Applications // Knowledge Engineering Review. 1996. Vol.11, № 2. P. 93–155.
- Болдачёв А.В. Событийная онтология vs объектная. 21.12.2022. [Электронный ресурс]. URL: https://habr.com/ru/post/706916/
- Добров Б.В., Иванов В.В., Лукашевич Н.В., Соловьев В.Д. Онтологии и тезаурусы: модели, инструменты, приложения. М.: Бином. Лаборатория знаний, 2009. 173 с.
- Горшков C. Введение в онтологическое моделирование. ООО ТриниДата, 2018. 165 с.
- Муромцев Д.И. Онтологический инжиниринг знаний в системе PROTÉGÉ. СПб: СПб ГУ ИТМО, 2007. 62 с.
- Лапшин В.А. Онтологии в компьютерных системах. М.: Научный мир, 2010. 247 с.