Метод расчета числа кластеров для алгоритма k-means
Автор(ы):
В.В. Фролов, Доктор наук, Доцент, Харьковский национальный университет имени В.Н. Каразина, г. Харьков, Украина, профессор кафедры теоретической и прикладной информатики,
vvicfrol@rambler.ruС.Е. Слипченко, НТУ «ХПИ», г. Харьков, Украина, старший преподаватель кафедры технологии машиностроения и металлорежущих станков,
serg.slip@gmail.com,О.Ю. Приходько, Kандидат наук, Доцент, БГТУ им. В.Г. Шухова, г. Белгород, Россия, доцент кафедры электроэнергетики и автоматики,
prihodko.o.u@gmail.com Журнал:
Том 47, № 1
Рубрика:
Инфокоммуникационные технологии
Аннотация:
В статье предложен метод оценки оптимального числа кластеров для алгоритма k-средних. Метод обеспечивает расчет оптимального количества кластеров для разделения исходного множества на основе анализа нескольких критериев оценки. Основным критерием является динамика перераспределения объектов в кластерах при переходе от одного разбиения к другому. Оценка динамики проводится при расчете нормы матрицы перехода. В качестве дополнительного критерия используется оценка изменения потенциальной энергии объектов внутри кластеров одного и того же разбиения. Вспомогательный критерий определяет количество кластеров в соответствии с характерными точками графиков основного и дополнительного критериев. Суть метода заключается в наборе правил использования основных, дополнительных и вспомогательных критериев. Последовательность выполнения правил реализована в виде функции системы Matlab. Сравнительный анализ показывает, что метод комплексной оценки позволяет повысить точность определения оптимального количества кластеров на 40 %.
Ключевые слова:
кластерный анализ, кластер, устойчивость кластеризации, разбиение множества, критерий качества разбиения, k-means, центр кластера, центроид
Полный текст (PDF):
Загрузить
Количество скачиваний:
288