Метод расчета числа кластеров для алгоритма k-means

Автор(ы):  В.В. Фролов, Доктор наук, Доцент, Харьковский национальный университет имени В.Н. Каразина, г. Харьков, Украина, профессор кафедры теоретической и прикладной информатики, vvicfrol@rambler.ru

С.Е. Слипченко, НТУ «ХПИ», г. Харьков, Украина, старший преподаватель кафедры технологии машиностроения и металлорежущих станков, serg.slip@gmail.com,

О.Ю. Приходько, Kандидат наук, Доцент, БГТУ им. В.Г. Шухова, г. Белгород, Россия, доцент кафедры электроэнергетики и автоматики, prihodko.o.u@gmail.com

Журнал:  Том 47, № 1

Рубрика:  Инфокоммуникационные технологии

Аннотация:  В статье предложен метод оценки оптимального числа кластеров для алгоритма k-средних. Метод обеспечивает расчет оптимального количества кластеров для разделения исходного множества на основе анализа нескольких критериев оценки. Основным критерием является динамика перераспределения объектов в кластерах при переходе от одного разбиения к другому. Оценка динамики проводится при расчете нормы матрицы перехода. В качестве дополнительного критерия используется оценка изменения потенциальной энергии объектов внутри кластеров одного и того же разбиения. Вспомогательный критерий определяет количество кластеров в соответствии с характерными точками графиков основного и дополнительного критериев. Суть метода заключается в наборе правил использования основных, дополнительных и вспомогательных критериев. Последовательность выполнения правил реализована в виде функции системы Matlab. Сравнительный анализ показывает, что метод комплексной оценки позволяет повысить точность определения оптимального количества кластеров на 40 %.

Ключевые слова:  кластерный анализ, кластер, устойчивость кластеризации, разбиение множества, критерий качества разбиения, k-means, центр кластера, центроид

Полный текст (PDF):  Загрузить

Количество скачиваний:  288


Нашли ошибку? Выделите фрагмент текста и нажмите Ctrl+Enter.
Сообщение об ошибке автоматически отправится в редакцию.