Пример построения дерева решений на основе фрагмента таблицы примеров

Классообр. признак Признаки классификации
Цена Спрос Конкуренция Издержки Качество
Низкая Низкий Маленькая Маленькие Низкое
высокая Низкий Маленькая Большие Высокое
Высокая Высокий Маленькая Большие Низкое
Высокая Высокий Маленькая Маленькие Высокое
Высокая Высокий Маленькая Маленькие Низкое
Высокая Высокий Маленькая Большие Высокое

Анализ новой ситуации сводится к выбору ветви дерева, которая полностью определяет эту ситуацию. Поиск решения осуществляется в результате последовательной проверки признаков классификации. Каждая ветвь дерева соответствует одному правилу решения:

ЕСЛИ Спрос = «низкий» и ИЗДЕРЖКИ = «маленькие»

ТО ЦЕНА = «низкая»

Примерами инструментальных средств, поддерживающих индуктивный вывод знаний, являются lst Class (Programs in Motion), Rulemaster (Radian Corp.), KAD (ИПС Переяславль-Залесский), ИЛИС (ArgusSoft).

Нейронные сети.

X1

Пример построения дерева решений на основе фрагмента таблицы примеров - №1 - открытая онлайн библиотека

W1

X2 W2

Выход=f (∑wixi)

W3

X3

В результате обучения на примерах строятся математические решающие функции, которые определяют зависимости между входными (xi) и выходными (yi) признаками (сигналами).

Каждая такая функция, называемая по аналогии с элементарной единицей человеческого мозга-нейроном, отображает зависимость значения выходного признака (y) от взвешенной суммы (u) значений входных признаков (xi), в которой вес входного признака (wi) показывает степень влияния входного признака на выходной:

Y=f (∑ Wi*Xi)

i

Решающие функции используются в задачах классификации на основе сопоставления их значений при различных комбинациях значений входных признаков с некоторым пороговым значением. В случае превышения заданного порога считается, что нейрон сработал и таким образом распознал некоторый класс ситуаций. Нейроны используются и в задачах прогнозирования, когда по значениям входных признаков после их подстановки в выражение решающей функции получается прогнозное значение выходного признака.

Функциональная зависимость может быть линейной, но, как правило, используется сигмоидальная форма, которая позволяет вычленять более сложные пространства значений выходных признаков. Такая функция называется логистической.

 
  Пример построения дерева решений на основе фрагмента таблицы примеров - №2 - открытая онлайн библиотека

f(u)=1/(1+exp(-u)) 1

Нейрон “вкл”

Нейрон “выкл.”

0 u

Логистическая функция

Нейроны могут быть связаны между собой, когда выход одного нейрона является входом другого. Т.о., строится нейронная сеть, в которой нейроны, находящиеся на одном уровне, образуют слои.

Выходной

слой Взвешенные

связи

Скрытый

слой

Пример построения дерева решений на основе фрагмента таблицы примеров - №3 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №4 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №5 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №6 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №7 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №8 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №9 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №10 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №11 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №12 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №13 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №14 - открытая онлайн библиотека Пример построения дерева решений на основе фрагмента таблицы примеров - №15 - открытая онлайн библиотека Узлы

Входной слой

Обучение нейронной сети сводится к определению связей (синапсов) между нейронами и установлению силы этих связей (весовых коэффициентов). Алгоритмы обучения нейронной сети упрощенно сводятся к определению зависимости весового коэффициента связи двух нейронов от числа примеров, подтверждающих эту зависимость.

Достоинство нейронных сетей перед индуктивным выводом заключается в решении не только классифицирующих, но и прогнозных задач. Возможность нелинейного характера функциональной зависимости выходных и входных признаков позволяет строить более точные классификации.

Сам процесс решения задач в силу проведения матричных преобразований проводится очень быстро. Фактически имитируется параллельный процесс прохода по нейронной сети в отличие от последовательного в индуктивных системах. Нейронные сети могут быть реализованы и аппаратно в виде нейрокомпьютеров с ассоциативной памятью.

Инструментальные средства:

NeuroSolution, NeuralWorks Professional 2/Plus, Process Advisor? NeuroShell 2, BrainMaiker Pro, NeurOn-line и др.

Системы основанные на прецедентах. В этих системах БЗ содержит описания не обобщенных ситуаций, а особенно сами ситуации или прецеденты. Тогда поиск решения проблемы сводится к поиску по аналогии (выводу от частного к частному):

1. получение подробной информации о текущей проблеме,

2. сопоставление полученной информации со значениями признаков прецедентов из БЗ,

3. выбор прецедента из БЗ, наиболее близкого к рассматриваемой проблеме,

4. в случае необходимости выполняется адаптация выбранного прецедента к текущей проблеме

5. проверка корректности каждого полученного решения,

6. занесение детальной информации о полученном решении в БЗ.

Также как и для индуктивных систем, прецеденты описываются множеством признаков, по которым строятся индексы быстрого поиска. Но в отличие от индуктивных систем допускается поиск с получением множества допустимых альтернатив, каждая из которых оценивается некоторым коэффициентом уверенности.

Далее наиболее подходящие решения адаптируются по специальным алгоритмам к реальным ситуациям. В качестве методов адаптации в основном применяют методы повторной конкретизации переменных, уточнения параметров, замены одних компонентов решения другими. Обучение системы сводится к запоминанию каждой новой обработанной ситуации с принятыми решениями в базе прецедентов.

Пример инструментальных средств поддержки БЗ прецедентов:

CBR-Express, REMIND, ReCall, KATE tools и др.

Извлечение знаний на основе информационных хранилищ.В отличие от интеллектуальной базы данных информационное хранилище представляет собой хранилище извлеченной значимой информации из оперативных баз данных, которое предназначено, в первую очередь, для оперативного анализа данных (реализации OLAP - технологии). Формулирование запроса осуществляется в результате применения интеллектуального интерфейса, позволяющего в диалоге гибко определять значимые признаки анализа для произвольной группировки данных. Наиболее известными инструментальными средствами поддержки информационных хранилищ и OLAP - технологий являются такие инструментальные средства, как статистический пакет прикладных программ SAS, специализированные программы Business Objects, Oracle Express, отечественные программные продукты Poly Analyst, Контур Стандарт и др.

Типичными задачами оперативного ситуационного анализа, решаемых на основе информационных хранилищ, являются:

· Определение профиля потребителей конкретного товара;

· Предсказание изменений ситуации на рынке;

· Анализ зависимостей признаков ситуаций (корреляционный анализ) и др.

Для решения перечисленных задач требуется применение методов извлечения знаний из баз данных (Оа(:а Мшш§ или Кпо\у(О1зсоуегу), основанные на применении методов многомерного статистического анализа, индуктивных методов построения дерев] решений, нейронных сетей, генетических алгоритмов.

Рассмотрим сущность применения ранее не рассмотренного метода, основанного на применении генетических алгоритмов. Пусть требуется определить набор экономических показателей, которые в наибольшей степени влияют на положительную динамику поведения рынка. Тогда набор показателей можно рассматривать как набор хромосом, определяющих качества индивида, то есть решения поставленной задачи. Значения показателей, определяющих решение при этом соответствуют генам.

Генетические алгоритмы имеют ряд недостатков. Критерий отбора хромосом и сама процедура являются эвристическими и далеко не всегда гарантируют нахождения лучшего решения. Как и в реальной жизни, эволюция может остановиться на какой-либо непродуктивной ветви. С другой стороны можно подобрать примеры, когда из эволюции генетическим алгоритмом исключаются перспективные продолжения. Это особенно становится заметно при решении задач большой размерности со сложными внутренними связями.

В качестве примера разработки систем на основе генетических алгоритмов можно привести систему GeneHunter фирмы WardSystems Group.