Методи класифікації економічної інформації

План

1. Методи класифікації ЕІ.

2. Ієрархічний метод

3. Фасетний метод.

Система класифікації визначається і характеризується:

- використаним методом класифікації,

- ознаками класифікації (покладеними в основу виділення класифікаційних угруповань), їх пос­лідовністю

- кількістю рівнів (ступенів) класифікації,

- кіль­кістю угруповань (ємність).

Загалом ознака класифікації - це властивість об'єкта класифікованої множини.

Ознаки класифікації можуть мати кількісне (стаж, оклад, вік) або якісне (професія, посада, галузь) значення. Кількість значень ознаки класифікації визначає кількість класифікаційних угруповань, які можуть бути створені при розподілі множини об'єктів за цією ознакою.

Розрізняють два основних методи класифікації:

1) ієрархічний

2) фасетний.

Метод класифікації - це по суті сукупність правил створення системи класифікаційних угруповань і їх зв'язки між собою.

2. Ієрархічний метод класифікації характеризується тим, що початкова множина об'єктів техніко-економічної інформації послідовно поділяється на угруповання (класи) першого рівня поділу, далі - на угруповання наступного рівня і т.ін.

Сукупність угруповань утворює при цьому ієрархічну деревоподібну структуру, яку часто зображають у вигляді розгалуженого (гіллястого) графа; вузлами цього графа є угруповання, як це по­казано на рис.

На цьому рисунку початкова множина С поділяється на пер­шому рівні (ступені) на т угруповань першого рівня (СІ, С2, ... Cm).

Методи класифікації економічної інформації - №1 - открытая онлайн библиотека Методи класифікації економічної інформації - №2 - открытая онлайн библиотека Методи класифікації економічної інформації - №3 - открытая онлайн библиотека Методи класифікації економічної інформації - №4 - открытая онлайн библиотека РС

1-й рівень поділу

Методи класифікації економічної інформації - №5 - открытая онлайн библиотека Методи класифікації економічної інформації - №6 - открытая онлайн библиотека Методи класифікації економічної інформації - №7 - открытая онлайн библиотека Методи класифікації економічної інформації - №8 - открытая онлайн библиотека --------------С1--------С2-----С3----------Сm------------------------------------------

2-й рівень поділу

Методи класифікації економічної інформації - №9 - открытая онлайн библиотека Методи класифікації економічної інформації - №10 - открытая онлайн библиотека Методи класифікації економічної інформації - №11 - открытая онлайн библиотека Методи класифікації економічної інформації - №12 - открытая онлайн библиотека -C11-------C12-------C13-----C1n--------------------------------------------------------

3-й рівень поділу

----С111---С112---------------С11p------------------------------------------------------

Рис. Схема угрупувань ієрархічного методу класифікації

Потім кожне угруповання поділяється на угруповання наступного рівня і т.д. Так, угруповання СІ поділяється на п угрупо­вань другого рівня (С11, С12, ... Сіп), а угруповання С11 на р уг­руповань третього рівня (СІ 11, СІ 12, ... СІІр) і т.п. Кількість рів­нів ступенів класифікації визначає глибину класифікації. Загалом кожне угруповання може поділятися на угруповання нижчого рів­ня з використанням своєї ознаки; глибина класифікації у кожній гілці ієрархічної структури може бути різною.

В ієрархічній класифікації в частинному випадку на кожному рівні поділу може бути використана одна ознака. Це означає, що об'єкти початкової множини характеризуються однаковим набо­ром ознак.

При використанні ієрархічного методу класифікації для віднесення конкретного об'єкта класифікації на кожному ступені лише до одного класифікаційного угруповання необхідно додержувати таких основних правил:

¾ поділ кожного угруповання виконується лише за однією ознакою нового поділу;

¾ здобуті на кожному рівні класифікації угруповання не повин­ні повторюватися;

¾ класифікації мають виконуватися так, аби сума частин становила множину, яку поділили.

Найбільш суттєвими і складними питаннями, що постають при використанні ієрархічного методу класифікації, є вибір сис­теми ознак, що стануть основою поділу, а також їх послідовність.

Вибрані ознаки мають бути визначальними в розв'язуванні конкретних техніко-економічних задач, для яких створюється ця система класифікації. При цьому формовані в угрупованні об'єкти повинні мати найбільшу кількість однакових ознак. Вибір послідовності ознак залежить передусім від характеру техніко-економічної інформації. В інформації з природним розміщенням ознак це не становить труднощів. Наприклад, в інформації про органи управління, територіально-адміністративний поділ і т.ін. послі­довність ознак відповідає ієрархії підпорядкованості об'єктів. При застосуванні ієрархічного методу класифікації для об'єктів з незалежними ознаками (наприклад, кадрів, продукції тощо) вибір послідовності ознак залежить від статистичних характеристик частоти та ймовірності звертання до тієї чи іншої ознаки (най­частішим звертанням мають відповідати вищі рівні класифікації).

Ієрархічний метод класифікації характеризується

1. кількістю рівнів (ступенів) класифікації

2. глибиною,

3. ємністю

4. гнучкістю.

1. Кількість рівнів визначає глибину класифікації, яка встановлюєть­ся залежно від міри необхідної конкретизації угруповань і кіль­кості ознак, які беруть участь у розв'язуванні відповідних задач.

2. Від глибини класифікації та кількості створених на кожному рівні угруповань залежить ємність. Як правило, найбільша кіль­кість послідовних угруповань, на які може поділятися попереднє угруповання на кожному рівні класифікації, встановлюють сталим або для всієї класифікації, або для даного рівня.

Застосування ієрархічного методу класифікації пояснюється його доброю пристосованістю ручної обробки, звичністю, вели­кою інформативністю кодів, які несуть змістове навантаження.

Проте цей метод класифікації має ряд недоліків, які іноді утруднюють його використання.

1. жорсткість структури, зумовлена фіксованістю ознак і їхньою послідовністю.

2. Через це зміна хоча б однієї ознаки призводить до перерозподілу класифікаційних угруповань.

Тому в класифікаторах, побудованих за ієрархічним методом, мають передбачатися значні резервні ємності крім того, ієрархічний метод класифікації не дає змоги агрегувати об'єкти за будь-яким раніше не передбаченим довільним по­єднанням ознак, а також у деяких випадках ускладнює автоматизовану обробку, оскільки утворюється нестандартний розподіл по­слідовності ознак.

Перелічені недоліки ієрархічного методу класифікації компенсуються фасетним методом, при якому початкова множина об'єктів може незалежно поділятися на класифікаційні угрупован­ня щоразу з використанням однієї з обраних ознак.

4. Кожна ознака фасетної класифікації відповідає фасеті, що являє собою список значень найменованої ознаки класифікації.

Наприклад, ознака «колір» містить такий список значень: черво­ний, білий, чорний, блакитний ... зелений; ознака - «професія» містить такий список значень: апаратник, автослюсар ... токар і т. ін.

Отже, система класифікації може бути подана переліком не­залежних фасетів (списків), які містять значення ознак класифі­кації. Множинне описання об'єктів техніко-економічної інформа­ції відбувається в кожній конкретній задачі на основі завдання фа­сетної формули, яка утворюється з послідовності ознак класи­фікації, використовуваних у задачі. Кількість фасетних формул визначається можливим поєднанням ознак. Для кожної фасетної формули може бути утворена ієрархічна класифікація, в якій на кожному рівні поділу використовується одна ознака, що відпові­дає окремій фасеті, а послідовність ознак визначається фасетною формулою.

Розглянемо як гіпотетичний приклад фасетну класифікацію одягу в разі використання трьох ознак (фасетів): вид тканини, се­зонність, призначення.

З використанням цих трьох ознак шляхом переставленої послідовності можна побудувати шість різних ієрархічних класи­фікацій (з трьома рівнями розподілу). Один приклад наведено на рис.

Для цього прикладу одержаної ієрархічної класифікації три угрупування нижчого рівня містять відповідно такий одяг:

1) чоловічий, зимовий, вовняний;

2) жіночий, зимовий, вовняний;

3) дитячий, зимовий, вовняний.

Методи класифікації економічної інформації - №13 - открытая онлайн библиотека Фасети 1 2 3

Назва ознаки Вид тканини Сезонність Призначення одягу
Значення ознаки Вовна   Шовк   Бавовна   Трикотаж Зимова   Літня   Демісезонна     Чоловічій   Жіночій   Дитячий

Рис. Фасети ознак і їх значення

Методи класифікації економічної інформації - №14 - открытая онлайн библиотека


Й рівень

Й рівень

3-й рівень1 2 3

Рис. Можливий варіант ієрархічної класифікації для заданої послідовності фасетів

Якщо використати номери фасетів, наведених на рис. 14, і поданій на рис. 14 ієрархічній класифікації відповідає фасетна

формула: 1-2-3, яка відображує склад і послідовність ознак роз­поділу.

Крім наведених схем класифікації ці три ознаки дають змогу створити ще три схеми з використанням однієї ознаки і шість схем класифікації з використанням двох ознак.

Отже, будь-яке угруповання у системі класифікації визнача­ється набором значень ознак об'єктів класифікації (може бути од­на або кілька ознак). Оскільки, як легко помітити з прикладу, на­веденого на рис., кількість можливих класифікацій швидко зростає зі зростанням кількості незалежних ознак, у ряді випадків краще мати перелік окремих фасетів - ознак; будь-яка комбінація фасетів визначає одну ієрархічну класифікацію, кожне угруповання якої визначається комбінацією значень ознак. Загалом вся множина об'єктів класифікації може описуватися досить великою кількістю дескрипторів, які відповідають значенням різних ознак множини об'єктів. Кожний об'єкт може описуватись якоюсь частиною цих значень. Очевидно, що будь-яка комбінація дескрипторів зі словника-тезауруса, який описує розглядувану множину, визначає можливий клас об'єктів. Цей клас містить певні частини об'єктів; у деяких випадках ця частина може бути порожньою.

При застосуванні фасетного методу класифікації слід додер­жувати таких основних правил:

§ ознаки, які використовуються в різних фасетах, не повинні повторюватися (принцип взаємного виключення фасетів);

§ із усіляких ознак, які характеризують множину об'єктів кла­сифікації, відбираються і фіксуються лише істотні, які забезпечу­ють розв'язування конкретних економічних задач.

Фасетний метод класифікації не має недоліків ієрархічного методу. Він особливо ефективний при функціонуванні комп'ютерних інформаційних систем.