ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ПсковГУ |
||
Актуальность темы. Методы теории распознавания (классификации) образов широко применяются для решения практических задач во многих областях (социология, экономика, биология, геология, медицина и т.д.). Одним из наиболее применимых для решения практических задач распознавания является комбинаторно-логический подход, основу которого заложили работы академика РАН Ю.И. Журавлёва. Возникновение этого подхода связано с применением теории распознавания в плохо формализованных областях, где не удаётся построить адекватную математическую модель. Логические алгоритмы распознавания хорошо зарекомендовали себя на практике и, как правило, могут быть использованы даже при недостатке информации. Их синтез основан на выделении в описаниях объектов (ситуаций) подописаний, которые содержат информацию о различиях классов – выделение элементарных классификаторов. Построение множества всевозможных элементарных классификаторов или части этого множества, обеспечивающей высокую надёжность логического алгоритма, связано с вычислительными трудностями переборного характера. Задачу построения элементарных классификаторов можно формально записать с помощь языка теории дизъюнктивных нормальных форм (ДНФ). Сокращённой ДНФ характеристической функции класса (равна единице на описаниях эталонных объектов выделенного класса, нулю – на описаниях эталонных объектов других классов) соответствует множество всевозможных элементарных классификаторов. Поскольку построение сокращённой ДНФ трудоёмко и не гарантирует хорошего качества распознавания, необходимо уметь строить произвольные, но не очень сложные ДНФ. В случае плохого качества распознавания их можно «пополнять» операциями обобщённого склеивания. С.В. Яблонским, Ю.И. Журавлёвым и А.Ю. Коганом было показано, что задача эффективного построения простых ДНФ по перечню нулей разрешима. Однако до сих пор не было разработано «быстрых» алгоритмов построения ДНФ, учитывающих специфику задач распознавания. Кроме того, задача ДНФ-реализации по перечню нулей рассматривалась, главным образом, только для булевых функций, т.е. исследования имели приложения только в задачах распознавания с бинарной информацией. Поэтому представляется актуальным рассмотреть случай целочисленной информации и разработать алгоритмы, ориентированные на применение в теории распознавания. Отметим, что в последние годы после некоторого перерыва появилось значительное число публикаций, посвящённых задачам минимизации функций в классе нормальных форм и их аналогов. Это связано, в первую очередь, с широким применением результатов этих работ в теории распознавания и для решения практических задач классификации. Целью работы является: 1. Разработка эффективных алгоритмов построения ДНФ характеристических функций классов для синтеза логических распознающих процедур. 2. Исследование возможности решения задач классификации логическими алгоритмами распознавания, работающими с бинарной информацией. Проведение численных экспериментов на модельных и реальных данных. Научная новизна. В диссертации предложены новые методы синтеза ДНФ булевых функций и бинарных функций k-значной логики по перечню их нулевых точек. Впервые рассмотрена задача ДНФ-реализации бинарных функций по матрице нулей для нормальных форм произвольного типа. Доказана сводимость этой задачи к аналогичной задаче с бинарной матрицей, что позволяет применять в k-значном случае весь арсенал методов, разработанных для бинарной информации. Тестовый подход к проблеме ДНФ-реализации, описанный в диссертации, позволяет в явном виде выписывать ДНФ-формулы функций из некоторых важных классов. Отметим, что многие формулы уже были получены другими исследователями, но их вывод был громоздок и требовал привлечения специального математического аппарата. Здесь же вывод формул – простое (стандартное) приложение тестового подхода. Также впервые поставлена и решена задача синтеза ДНФ характеристических функций классов, обладающих специальными свойствами. Методика исследования: методы дискретной математики, теории множеств и отображений, численные эксперименты на ЭВМ. Практическая ценность. Предложенные в диссертации методы позволяют синтезировать элементарные классификаторы для логических алгоритмов распознавания за приемлемое время. С помощью модели алгоритмов, реализованной на ЭВМ, были решены задачи классификации, в том числе и практическая задача медицинской диагностики. Разработанные алгоритмы синтеза нормальных форм могут применяться во всех областях, где требуется быстрая ДНФ-реализация булевых функций и бинарных функций k-значной логики по перечню нулей. Апробация работы. Материалы, изложенные в диссертации, докладывались на - Международных конференциях студентов и аспирантов по фундаментальным наукам «Ломоносов 2001», «Ломоносов 2002», «Ломоносов 2003» (Москва, МГУ); - Всероссийской конференции «Математические методы распознавания образов – 10» (Москва, ВЦ РАН); - Международной конференции «Интеллектуализация обработки информации – 2002» (Симферополь, ТНУ); - кафедре «Математические методы прогнозирования» факультета вычислительной математики и кибернетики МГУ. Разработанные алгоритмы применялись в работах по проектам РФФИ 09-01-00433, 00-15-96064. Личный вклад. Выносимые на защиту результаты получены соискателем лично. Публикации. По теме диссертации опубликовано 8 работ [1–8], в том числе 2 в ЖВМиМФ, 1 в ДАН. Описания отдельных результатов, полученных в диссертации, включались в научные отчёты по проектам РФФИ 09-01-00433, 00-15-96064. Структура и объём работы. Диссертация состоит из введения, пяти глав, разбитых на параграфы, списка литературы (49 наименований) и приложения. Нумерация теорем, лемм, утверждений, примеров и формул своя в каждой главе. Основной текст занимает 118 страниц, приложение – 5 страниц.