Исследование методов нечеткой кластеризации для определения типов руды

18/12/2014 11:10am

Автор: Моркун В.С., Цвиркун С.Л.

Категории: автоматизация

В статье рассмотрены методы кластерного анализа для определения типов крупнокусковой руды в потоке на конвейерной ленте, для последующей сортировки отдельных кусков с высоким содержанием железа

Ключевые слова: железорудное сырье, кластер, алгоритм классификации, нечеткая кластеризация.

Исследование методов нечеткой кластеризации для определения типов руды

Моркун Владимир  Станиславович

 

 

 Моркун Владимир Станиславович

д.т.н., проф. и.о. проректора с научной работы ГВУЗ "Криворожский национальный университет"

 

 

 

 

Цвиркун Сергей Леонидович

 

 

Цвиркун Сергей Леонидович

"Криворожский национальный университет"

 

 

 

 

Для обеспечения высоких технико-экономических показателей добычи и переработки минерального сырья необходимо управлять качеством еще в стадии планирования, добычи и транспортировки руд. Поскольку принадлежность рудного материала к определенной разновидности может быть определена по нескольким характеристикам, то для выполнения этой операции целесообразно использовать операцию кластеризации.
Большинство алгоритмов кластеризации не опираются на традиционные для статистических методов допущения; они могут использоваться в условиях почти полного отсутствия информации о законах распределения данных [1].
Исходной информацией для кластеризации является матрица измерения косвенных признаков технологических разновидностей руды, состоящая из n строк, каждая из которых содержит значения признаков отдельной пробы:
                                                (1)
где n – количество признаков; M – количество проб руды. В данном случае, задачей является разбиение проб руды, представленной несколькими технологическими разновидностями на несколько кластеров, схожесть проб в которых позволяет выделить определенную технологическую разновидность.
Для осуществления кластеризации характеристик проб руды рассмотрим методы нечеткой кластеризации.
В реальной ситуации разделение рудного материала на технологические разновидности сложно представить двумя степенями принадлежности 0 или 1. Более естественным является использование частичной принадлежности в диапазоне от 0 до 1, что позволит пробам руды, характеристики которых находятся на границах между несколькими кластерами, принадлежать им с разной степенью. [1]
Алгоритм кластеризации Fuzzy C-means, использовавшийся для кластеризации характеристик проб руды, основан на минимизации функционала C-means [1, 3]
                                      (2)
вектор центров кластеров
                                    (3)
Результат кластеризации проб железорудного сырья, выполненной по алгоритму Fuzzy C-means, рис. 1, показал правильное, в сравнении с эталоном определение центров кластеров, что позволяет сделать вывод о перспективности использования данного метода.
Также, для классификации характеристик железорудного сырья был использован алгоритм Густафсона-Кесселя (Gustafson-Kessel), который совершенствует Fuzzy C-means алгоритм, используя адаптивную норму расстояния [4] для каждого кластера

Результат Fuzzy C-means кластеризации  проб железорудного сырья
Рис. 1. Результат Fuzzy C-means кластеризации проб железорудного сырья

Целевая функция алгоритма определяется следующим образом
                                            (4)
Результат кластеризации проб железорудного сырья для определения типов руды, выполненной по алгоритму Густафсона-Кесселя приведен на рис. 2.

Результат кластеризации Густафсона-Кесселя  проб железорудного сырья
Рис. 2. Результат кластеризации Густафсона-Кесселя проб железорудного сырья

В развитие работы [4] Гас и Гева (Gath, Geva) в работе [5] сформировали новую функцию расстояния на основе нечетких оценок максимального правдоподобия
                               (5)
Результат кластеризации проб железорудного сырья, выполненной по алгоритму Гаса-Гева приведен на рис. 3.

Результат кластеризации  Гаса-Гева проб железорудного сырья
Рис. 3. Результат кластеризации Гаса-Гева проб железорудного сырья

Оценка качества кластеризации была проведена с использованием следующих скалярных мер достоверности.
Коэффициент распределения (РС): измеряет величину «перекрытия» между кластерами [3]
                                                  (6)
где mij – функция принадлежности точки данных j в кластере i. Максимальному значению функционала соответствует оптимальное количество кластеров.
Энтропия классификации (CE) является мерой нечеткости распределения
                                                      (7)
Показатель распределения (SC) представляет собой отношение суммы компактности и разделения кластеров [6].
                                                 (8)
Меньшее значение SC соответствует лучшему результату кластеризации.
Показатель разделение (S) [6].
                                                 (9)
Показатель Xie-Beni (XB) определяет количественную оценку соотношения полной вариации в кластерах и разделение кластеров [7]
                                             (10)
Оптимальному количеству кластеров для определения типов руды соответствует минимальное значение показателя.
Показатель Данна (Dunn's Index, DI): используют для выявления «компактных и хорошо разделенных кластеров» [2]
                        (11)
Альтернативный показатель Данна (Alternative Dunn Index, ADI)
               (12)
Результаты сравнения методов кластеризации по рассмотренным выше показателям для определения типов руды приведены в табл. 1
Таблица 1
Результаты сравнения методов кластеризации

 

PC

CE

SC

S

XB

DI

ADI

FCM

0.6984

0.6996

0.5178

0.0044

4.5559

0.2443

0.0003

GK

0.7111

0.6681

0.5034

0.0043

5.5842

0.2443

0,0001

GG

0.9940

0.0118

1.1264

0.0098

1.7113

0.2443

0.0090

Наилучшие показатели имеют методы Густафсона-Кесселя и Гаса-Гева. Однако, недостатком алгоритма Гаса-Гева является необходимость предварительной обработки исходных данных путем кластеризации с использованием, например, метода нечеткой кластеризации FCM. Таким образом, наиболее целесообразным представляется использование метода нечеткой кластеризации Густафсона-Кесселя.
References
1. Shtovba S.D. Vvedeniye v teoriyu nechetkikh mnozhestv i nechetkuyu logiku / S.D. Shtovba . - Rezhim dostupa: // HTTP : MATLAB / exponenta.ru / fuzzylogic / book1.
2. Balasko B. Fuzzy Clustering and Data Analysis Toolbox / Balasko B., Abonyi J., Feil B. – 74 p.
3. Bezdek J. C. Pattern Recognition with Fuzzy Objective Function Algorithms. Plenum Press, 1981.
4. Gustafson D.E., Kessel W.C. Fuzzy clustering with a fuzzy covariance matrix // Proc. IEEE CDC, San Diego, CA. — 1979. — P. 761 - 766. - Vol. 7. - P. 773 - 781.
5. Gath I., Geva A.B. Unsupervised optimal fuzzy clastering// IEEE Trans. Pattern Anal. Machine Intell., 1989. — Vol. 7. - P. 773 - 781.
6. Bensaid A.M., Hall L.O., Bezdek J.C., Clarke L.P., Silbiger M.L., Arrington J.A., Murtagh R.F. Validity-guided (Re)Clustering with applications to imige segmentation. IEEE Transactions on Fuzzy Systems, 4:112-123, 1996.
7. Xie X. L. and Beni G. A. Validity measure for fuzzy clustering. IEEE Trans. PAMI, 3(8):841{846, 1991.


Презентация

Контакты

 

 

Контакты

НАШІ КОНТАКТИ:

[email protected]

[email protected]

м. Дніпро

моб. +38 (050) 320 69 72

ISSN 20760507

Керівник проекту - Гриньов Володимир Анатолійович

Партнеры