План на курса
Предварителна обработка на данни Data Cleaning Интеграция и трансформация на данни Намаляване на данни Дискретизация и генериране на концептуална йерархия
Статистически изводи Вероятностни разпределения, Случайни променливи, Централна гранична теорема
Вземане на пробиДоверителни интервалиСтатистически изводТестване на хипотезиСпецификация на многомерна линейна регресияИзбор на подмножество
ОценкаВалидиранеПрогнозаМетоди за класификация Логистична регресияЛинеен дискриминантен анализK-най-близки съседи
Наивен БейсСравнение на методите за класификацияNeural Networks Напасване на невронни мрежиПроблеми с обучението на невронни мрежиДървета на решения Регресионни дърветаКласификационни дървета
Дървета срещу линейни моделиТорбички, Random Forests, Усилване на торбичкитеRandom Forestс
ПодсилванеПоддръжка на векторни машини и класификатор за максимален марж на гъвкав дискПоддържайте векторни класификаториПоддържащи векторни машини
2 и повече класа SVMВръзка с логистичната регресияАнализ на основните компонентиГрупиране K-означава групиране
Групиране на K-medoidsЙерархично групиранеГрупиране на базата на плътностОценка на модела и пристрастия при избора, дисперсия и сложност на моделаГрешка при прогнозиране в извадкатаБайесовият подход
Кръстосано валидиранеBootstrap методи