Uniwersytet Marii Curie-Skłodowskiej w Lublinie - Centralny System Uwierzytelniania
Strona główna

Data mining (AI) F-K.149
Laboratorium (LB) Semestr letni 2024/2025

Informacje o zajęciach (wspólne dla wszystkich grup)

Strona zajęć: https://kampus.umcs.pl/
Liczba godzin: 30
Limit miejsc: (brak limitu)
Sposób weryfikacji efektów kształcenia: Efekty kształcenia będą weryfikowane w oparciu o dwa obszary:
1. Obszar hurtowni danych oraz big data: zbudowanie hurtowni danych w oparciu o wskazówki prowadzącego, oczyszczenie danych (redukcja szumów oraz błędów), zaawansowane przekształcenia danych, łączenie danych z różnych źródeł, zapytania w języku M - wykorzystanie stworzonej przez studenta hurtowni danych (bug data) na potrzeby projektu własnego.
2. Obszar data mining - wykonanie projektu głębokiej eksploracji danych, poszukiwanie prawidłowości w opracowanej hurtowni danych, analizy statystyczne danych, analityka decyzyjna oraz predykcyjna z wykorzystaniem dedykowanego oprogramowania data minig - samodzielne przygotowanie projektu przez studentów na podstawie zaleceń prowadzącego,

Uwagi: Dostęp do kursu na https://kampus.umcs.pl/ jest udostępniany grupom w wykorzystaniem USOSMaila.
Literatura:

Literatura podstawowa:

1. Power query w Excelu i Power BI, Zbieranie i przekształcania danych, Gil Raviv

2. POWER BI I POWER PIVOT DLA EXCELA. ANALIZA DANYCH, Ferrari Alberto, Russo Marco, Wydawnictwo Helion

3. Big data, nauka o danych i AI bez tajemnic?, David Stephenson, 2019

4. Introduction to Data Mining, Global Edition; Pang-Ning Tan, Michael Steinbach; Pearson Education Limited, 2018

Literatura uzupełniająca:

1. https://docs.biolab.si/2/ - dokumentacja do Orange 2.7

2. Data science od podstaw. Analiza danych w Pythonie, Grus Joel, 2020

3. Data Mining, czyli wyszukiwanie informacji w zbiorach danych, Marcin Urbański, Wiedza i Praktyka, 2015,

4. Data Mining for Business Analytics; Galit Shmueli, Nitin R. Patel, Peter C. Bruce; John Wiley & Sons, 2016

Efekty uczenia się:

WIEDZA. Absolwent zna i rozumie:

1. Pojęcia, terminologię oraz zaawansowane zagadnienia z zakresu analityki gospodarczej, w tym prawidłowości w kształtowaniu się wielowymiarowych zjawisk i procesów gospodarczy, współzależności występujące między nimi oraz kierunki rozwoju i powiązania analityki gospodarczej z dyscyplinami pokrewnymi, w szczególności z ekonomią oraz możliwościami zastosowania zaawansowanych technik statystycznych, z perspektywy ich właściwego doboru do poruszanej problematyki. K_W02.

2. W pogłębionym stopniu - zagadnienia dotyczące pomiaru zjawisk ekonomicznych, wybrane metody statystyczne i ekonometryczne oraz

narzędzia gromadzenia, analizy, przetwarzania i prezentacji danych ekonomicznych i gospodarczych oraz możliwości ich zastosowania w

praktyce z perspektywy głębokiej eksploracji danych (data mining). K_W02.

3. W pogłębionym stopniu - metody oceny efektywności poszczególnych obszarów funkcjonowania podmiotu gospodarczego (analiza finansowa, analiza przedsiębiorstwa) , a także zaawansowane metody ilościowe i jakościowe pozwalające na opis i analizę tych procesów, w szczególności z perspektywy predykcji (data mining predykcyjny). K_W10.

UMIEJĘTNOŚCI. Absolwent potrafi:

1. Identyfikować, opisywać, modelować i interpretować zjawiska i procesy gospodarcze, wykorzystując zaawansowane metody ilościowe z wykorzystaniem dedykowanego oprogramowania wspierającego zastosowanie technik data minig'u. K_U02 +K_U05

2. Wykorzystać różne źródła informacji z zakresu nauk ekonomicznych i metod analizy danych do szczegółowego opisu zjawisk i procesów

zachodzących w przedsiębiorstwie i w jego otoczeniu branżowym, a następnie dokonać oceny, krytycznej analizy i syntezy tych informacji. Umiejętność ta jest szczególnie ważna w budowie hurtowni danych, gdzie dane pochodzą z wielu różnych źródeł, są w odmiennej formie oraz strukturze. Umiejętność ich scalenia, "oczyszczenia" oraz redukcji, a także krytycznej analizy tak przygotowanego zbioru danych jest wysoce pożądana. K_U01.

3. Zaproponować, uzasadnić i wdrożyć znane zaawansowane lub opracować nowe metody ilościowe adekwatne do rozwiązywania

konkretnych problemów ekonomicznych - w szczególności wykorzystaniem różnych metod data mining'u. K_U06.

KOMPETENCJE SPOŁECZNE: Absolwent jest gotów do:

1. Myślenia i działania w sposób przedsiębiorczy, w szczególności z wykorzystaniem predykcyjnego data minin'gu, który ma wspierać podejmowanie słusznych decyzji biznesowych. K_K01.

2. Uznawania znaczenia analiz gospodarczych dla rozwiązywania problemów praktycznych oraz korzystania z wiedzy eksperckiej w

przypadku trudności z samodzielnym znalezieniem rozwiązania - w szczególności uznania analiz gospodarczych opracowanych na podstawie wspomagania komputerowego uczenia się, sieci neuronowych, sztucznej inteligencji, czyli technik wspieranych przez data mining. K_K02.

3. Krytycznej oceny własnej wiedzy oraz odpowiedzialnego przygotowania się do swojej pracy poprzez ciągłe uzupełnianie wiedzy i

doskonalenie nabytych umiejętności, przy wykorzystaniu różnorodnych źródeł, metod i technik samokształcenia. Wysoce pożądaną cechą jest uznanie ograniczeń ludzkiego umysłu oraz uznanie wsparcia jakie oferują współczesne, zaawansowane metody data mining'u, które nieustanie się rozwijają oraz są ulepszane. Zaleca się zatem ciągłe doskonalenia nabytych umiejętności, ale także obserwacja aktualnych trendów w data mining'u. Ważne jest przy tym zachowanie umiejętności krytycznej oceny rezultatów analiz prowadzonych z wykorzystaniem technik data mining'u. K_K05.

Metody i kryteria oceniania:

Końcowa ocena będzie składową z dwóch obszarów:

• Budowa hurtowni danych - big data ( zbudowanie hurtowni danych w oparciu o wskazówki prowadzącego, oczyszczenie danych (redukcja szumów oraz błędów), zaawansowane przekształcenia danych, łączenie danych z różnych źródeł, zapytania w języku M).

• Przygotowanie i prezentacja własnego projektu ( wykonanie projektu głębokiej eksploracji danych, poszukiwanie prawidłowości w opracowanej hurtowni danych, analizy statystyczne danych, analityka decyzyjna oraz predykcyjna z wykorzystaniem dedykowanego oprogramowania data minig - samodzielne przygotowanie projektu przez studentów na podstawie zaleceń prowadzącego).

Oceny i punktacja (podana w procentach):

90 - 100 - bardzo dobry

80 - 89 - dobry plus

70 - 79 - dobry

60 - 69 - dostateczny plus

50 - 59 - dostateczny

0 - 49 - niedostateczny

Zakres tematów:

Ćwiczenie 1 – praca z oprogramowaniem

Ćwiczenie 2 – przepływy danych

Ćwiczenie 3 – widgety i kanały

Ćwiczenie 4 – praca z danymi

Ćwiczenie 5 – hierarchiczna analiza skupień (Hierarchical Clustering)

Ćwiczenie 6 – prognozowanie

Ćwiczenie 7 – ocena i scoring modeli predykcyjnych

Ćwiczenie 8 – dodatki (add-ons)

Ćwiczenie 9 – analiza (głównych) składowych

Ćwiczenie 10 – rangowanie i ocena zmiennych

Ćwiczenie 11 – k-Średnia (k-Means)

Ćwiczenie 12 – k-Średnia - wyjaśnienie

Ćwiczenie 13 – sylwetki

Ćwiczenie 14 – analiza obrazów – klastrowanie

Ćwiczenie 15 – Text Preprocessing

Ćwiczenie 16 – analiza danych tekstowych – Twitter Analysys

Ćwiczenie 17 – Covid 19

Ćwiczenie 17 – Covid 19 Data in Time

Ćwiczenie 17 – Covid 19 Data with Maps

Ponadto: praca z Power Query w zakresie budowy hurtowni danych w tym w zakresie importu danych zewnętrznych, łączenia się z nimi, a następnie kształtowania danych w sposób spełniający potrzeby analityka. Zaawansowana praca z danymi. W dalszej kolejności załadowanie zapytania do programu Excel celem późniejszej automatyacji budowy hurtowni oraz importu danych do oprogramowania Data Mining celem głębokiej eksploracji. Okresowe odświeżanie danych.

Metody dydaktyczne:

• prezentacja multimedialna

• symulacje praktyczne

• metoda projektów

• dyskusje grupowe

• praca na materiałach źródłowych

• praca samodzielna - przygotowanie hurtowni danych oraz opracowanie analizy wybranego problemu z wykorzystaniem technik data minig'u

• prezentacja wyników przeprowadzonych analiz wraz z omówieniem zastosowanych technik

Grupy zajęciowe

zobacz na planie zajęć

Grupa Termin(y) Prowadzący Miejsca Liczba osób w grupie / limit miejsc Akcje
1 każda środa, 13:00 - 14:30, sala 345
Łukasz Kański 15/15 szczegóły
Wszystkie zajęcia odbywają się w budynku:
Wydział Filozofii i Socjologii
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Marii Curie-Skłodowskiej w Lublinie.
kontakt deklaracja dostępności mapa serwisu USOSweb 7.1.1.0