ОСНОВНІ МЕТОДИ КЛАСТЕРИЗАЦІЇ ДАНИХ

  Вікторія Галіцька (Київ, Украіна) |    Download article

Головною задачею кластеризації даних (або кластерного аналізу) є розбиття множини об’єктів на групи (або кластери). Кожна група об’єднує в собі об’єкти за певною ознакою, при чому об’єкти з різних груп повинні максимально відрізнятися один від одного. В якості об’єктів (елементів) може виступати будь-що, наприклад, дані або вектори характеристик. Слід також розрізняти поняття кластеризації та класифікації: у випадку кластеризаціїї немає заданого чіткого переліку груп, він формується в процесі роботи алгоритму. Тобто, можна сказати, що кластеризація – це класифікація об’єктів на основі їх подібності, коли не задається приналежність об’єктів будь-яким класам. У кластеризації існує дуже велика кількість застосувань як в інформатиці так і в інших галузях. Прикладами застосування можуть слугувати аналіз даних, вилучення та пошук інформації, групування та розпізнавання об’єктів.