Содержание
- 2. Кластеризация (или кластерный анализ) - это задача разбиения множества объектов на группы, называемые кластерами. Внутри каждой
- 3. Главное отличие кластеризации от классификации состоит в том, что перечень групп чётко не задан и определяется
- 4. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя (один
- 5. Спектр применений кластерного анализа очень широк: его используют в археологии, медицине, психологии, химии, биологии, государственном управлении,
- 6. Однако универсальность применения привела к появлению большого количества несовместимых терминов, методов и подходов, затрудняющих однозначное использование
- 7. Кластерный анализ выполняет следующие основные задачи: Разработка типологии или классификации. Исследование полезных концептуальных схем группирования объектов.
- 8. Независимо от предмета изучения применение кластерного анализа предполагает следующие этапы: Отбор выборки для кластеризации. Подразумевается, что
- 9. Можно встретить описание двух фундаментальных требований, предъявляемых к данным - однородность и полнота. Однородность требует, чтобы
- 10. Если кластерному анализу предшествует факторный анализ, то выборка не нуждается в «ремонте» - изложенные требования выполняются
- 11. Применение метода кластеризации: Биология и биоинформатика (в области экологии кластеризация используется для выделения пространственных и временных
- 12. Кластеризация – объединение в группы схожих объектов – является одной из фундаментальных задач в области анализа
- 13. Кластеризация в Data Mining приобретает ценность тогда, когда она выступает одним из этапов анализа данных, построения
- 14. Таким приёмом постоянно пользуются в маркетинге, выделяя группы клиентов, покупателей, товаров и разрабатывая для каждой из
- 15. Очень часто данные, с которыми сталкивается технология Data Mining, имеют следующие важные особенности: высокая размерность (тысячи
- 16. Все атрибуты или признаки объектов делятся на числовые и категорийные. Числовые атрибуты – это такие, которые
- 17. Например, атрибут «возраст» – числовой, а «цвет» – категорийный. Приписывание атрибутам значений происходит во время измерений
- 18. Большинство алгоритмов кластеризации предполагают сравнение объектов между собой на основе некоторой меры близости (сходства). Мерой близости
- 19. Потребность в обработке больших массивов данных в Data Mining привела к формулированию требований, которым, по возможности,
- 20. Алгоритм, удовлетворяющий данным требованиям (особенно второму), называется масштабируемым. Масштабируемость – важнейшее свойство алгоритма, зависящее от его
- 21. Таким образом, не существует единого универсального алгоритма кластеризации. При использовании любого алгоритма важно понимать его достоинства
- 22. Список использованной литературы Барсегян и др. Методы и модели анализа данных: OLAP и Data Mining. -
- 24. Скачать презентацию