MaterStudiorum.ru - домашняя страничка студента.
Минимум рекламы - максимум информации.


Авиация и космонавтика
Административное право
Арбитражный процесс
Архитектура
Астрология
Астрономия
Банковское дело
Безопасность жизнедеятельности
Биографии
Биология
Биология и химия
Биржевое дело
Ботаника и сельское хоз-во
Бухгалтерский учет и аудит
Валютные отношения
Ветеринария
Военная кафедра
География
Геодезия
Геология
Геополитика
Государство и право
Гражданское право и процесс
Делопроизводство
Деньги и кредит
Естествознание
Журналистика
Зоология
Издательское дело и полиграфия
Инвестиции
Иностранный язык
Информатика
Информатика, программирование
Исторические личности
История
История техники
Кибернетика
Коммуникации и связь
Компьютерные науки
Косметология
Краткое содержание произведений
Криминалистика
Криминология
Криптология
Кулинария
Культура и искусство
Культурология
Литература и русский язык
Литература(зарубежная)
Логика
Логистика
Маркетинг
Математика
Медицина, здоровье
Медицинские науки
Международное публичное право
Международное частное право
Международные отношения
Менеджмент
Металлургия
Москвоведение
Музыка
Муниципальное право
Налоги, налогообложение
Наука и техника
Начертательная геометрия
Новейшая история, политология
Оккультизм и уфология
Остальные рефераты
Педагогика
Полиграфия
Политология
Право
Право, юриспруденция
Предпринимательство
Промышленность, производство
Психология
Психология, педагогика
Радиоэлектроника
Разное
Реклама
Религия и мифология
Риторика
Сексология
Социология
Статистика
Страхование
Строительные науки
Строительство
Схемотехника
Таможенная система
Теория государства и права
Теория организации
Теплотехника
Технология
Товароведение
Транспорт
Трудовое право
Туризм
Уголовное право и процесс
Управление
Управленческие науки
Физика
Физкультура и спорт
Философия
Финансовые науки
Финансы
Фотография
Химия
Хозяйственное право
Цифровые устройства
Экологическое право
Экология
Экономика
Экономико-математическое моделирование
Экономическая география
Экономическая теория
Эргономика
Этика
Юриспруденция
Языковедение
Языкознание, филология
    Начало -> Информатика, программирование -> Методы Data Mining

Название:Методы Data Mining
Просмотров:145
Раздел:Информатика, программирование
Ссылка:none(0 KB)
Описание: Содержание Что такое Data Mining Классификация задач Data Mining Задача классификации и регрессии Задача поиска ассоциативных правил Задача кластеризации Возможности Data Miner в Statistica 8 Средства анализа STATISTICA Data

Часть полного текста документа:

Содержание

Что такое Data Mining

Классификация задач Data Mining

Задача классификации и регрессии

Задача поиска ассоциативных правил

Задача кластеризации

Возможности Data Miner в Statistica 8

Средства анализа STATISTICA Data Miner

Пример работы в Data Minin

Создание отчетов и итогов

Сортировка информации

Анализ цен жилищных участков

Анализ предикторов выживания

Заключение


Что такое Data Mining

Современный компьютерный термин Data Mining переводится как «извлечение информации» или «добыча данных». Нередко наряду с Data Mining встречаются термины Knowledge Discovery («обнаружение знаний») и Data Warehouse («хранилище данных»). Возникновение указанных терминов, которые являются неотъемлемой частью Data Mining, связано с новым витком в развитии средств и методов обработки и хранения данных. Итак, цель Data Mining состоит в выявлении скрытых правил и закономерностей в больших (очень больших) объемах данных.

Дело в том, что человеческий разум сам по себе не приспособлен для восприятия огромных массивов разнородной информации. В среднем человек, за исключением некоторых индивидуумов, не способен улавливать более двух-трех взаимосвязей даже в небольших выборках. Но и традиционная статистика, долгое время претендовавшая на роль основного инструмента анализа данных, так же нередко пасует при решении задач из реальной жизни. Она оперирует усредненными характеристиками выборки, которые часто являются фиктивными величинами (средней платежеспособностью клиента, когда в зависимости от функции риска или функции потерь вам необходимо уметь прогнозировать состоятельность и намерения клиента; средней интенсивностью сигнала, тогда как вам интересны характерные особенности и предпосылки пиков сигнала и т. д.).

Поэтому методы математической статистики оказываются полезными главным образом для проверки заранее сформулированных гипотез, тогда как определение гипотезы иногда бывает достаточно сложной и трудоемкой задачей. Современные технологии Data Mining перерабатывают информацию с целью автоматического поиска шаблонов (паттернов), характерных для каких-либо фрагментов неоднородных многомерных данных. В отличие от оперативной аналитической обработки данных (OLAP) в Data Mining бремя формулировки гипотез и выявления необычных (unexpected) шаблонов переложено с человека на компьютер. Data Mining — это не один, а совокупность большого числа различных методов обнаружения знаний. Выбор метода часто зависит от типа имеющихся данных и от того, какую информацию вы пытаетесь получить. Вот, например, некоторые методы: ассоциация (объединение), классификация, кластеризация, анализ временных рядов и прогнозирование, нейронные сети и т. д.

Рассмотрим свойства обнаруживаемых знаний, данные в определении, более подробно.

Знания должны быть новые, ранее неизвестные. Затраченные усилия на открытие знаний, которые уже известны пользователю, не окупаются. Поэтому ценность представляют именно новые, ранее неизвестные знания.

Знания должны быть нетривиальны. Результаты анализа должны отражать неочевидные, неожиданные закономерности в данных, составляющие так называемые скрытые знания. Результаты, которые могли бы быть получены более простыми способами (например, визуальным просмотром), не оправдывают привлечение мощных методов Data Mining.

Знания должны быть практически полезны. ............







Похожие работы:

Название:Некоторые новые данные анализа сил и потерь на советско-германском фронте
Просмотров:645
Описание: Г.Ф.Кривошеев (Доклад на заседании Ассоциации историков Второй мировой войны 29.12.1998 г.) Уже не раз в выступлениях президента, членов правительства, в средствах массовой информации сообщалось число потерь как вое

Название:Методические аспекты построения и анализа электродинамических уравнений Максвелла
Просмотров:607
Описание: В.В. Сидоренков, МГТУ им. Н.Э. Баумана На основе первичных фундаментальных соотношений электромагнетизма - закона Кулона взаимодействия неподвижных электрических точечных зарядов и закона сохранения электричес

Название:Проблема классификации падежей
Просмотров:588
Описание: Курилович Е. § 1 Неправильный анализ предложных оборотов до сих пор является, по нашему мнению, основным препятствием для анализа категории падежа. В последних работах, посвященных падежу (Л. Ельмслева2, Р. Якобсо

Название:История дискурс-анализа
Просмотров:624
Описание: Среди предшественников дискурсивного анализа как особой научной дисциплины следует упомянуть, по крайней мере, две исследовательских традиции. Во-первых, это традиция этнолингвистических исследований, ориентиро

Название:Кластерный подход в стратегии инновационного развития зарубежных стран
Просмотров:342
Описание: Е.Б. Ленчук, Г.А. Власкин Сценарий долгосрочного развития отечественной экономики предполагает рост ее конкурентоспособности как в традиционных, так и новых наукоемких секторах, прорыв в повышении качества чело

 
     

Вечно с вами © MaterStudiorum.ru