Data mining (AI) F-K.149
Laboratorium (LB)
Semestr letni 2024/2025
Informacje o zajęciach (wspólne dla wszystkich grup)
Strona zajęć: | https://kampus.umcs.pl/ |
Liczba godzin: | 30 |
Limit miejsc: | (brak limitu) |
Sposób weryfikacji efektów kształcenia: | Efekty kształcenia będą weryfikowane w oparciu o dwa obszary: 1. Obszar hurtowni danych oraz big data: zbudowanie hurtowni danych w oparciu o wskazówki prowadzącego, oczyszczenie danych (redukcja szumów oraz błędów), zaawansowane przekształcenia danych, łączenie danych z różnych źródeł, zapytania w języku M - wykorzystanie stworzonej przez studenta hurtowni danych (bug data) na potrzeby projektu własnego. 2. Obszar data mining - wykonanie projektu głębokiej eksploracji danych, poszukiwanie prawidłowości w opracowanej hurtowni danych, analizy statystyczne danych, analityka decyzyjna oraz predykcyjna z wykorzystaniem dedykowanego oprogramowania data minig - samodzielne przygotowanie projektu przez studentów na podstawie zaleceń prowadzącego, |
Uwagi: | Dostęp do kursu na https://kampus.umcs.pl/ jest udostępniany grupom w wykorzystaniem USOSMaila. |
Literatura: |
Literatura podstawowa: 1. Power query w Excelu i Power BI, Zbieranie i przekształcania danych, Gil Raviv 2. POWER BI I POWER PIVOT DLA EXCELA. ANALIZA DANYCH, Ferrari Alberto, Russo Marco, Wydawnictwo Helion 3. Big data, nauka o danych i AI bez tajemnic?, David Stephenson, 2019 4. Introduction to Data Mining, Global Edition; Pang-Ning Tan, Michael Steinbach; Pearson Education Limited, 2018 Literatura uzupełniająca: 1. https://docs.biolab.si/2/ - dokumentacja do Orange 2.7 2. Data science od podstaw. Analiza danych w Pythonie, Grus Joel, 2020 3. Data Mining, czyli wyszukiwanie informacji w zbiorach danych, Marcin Urbański, Wiedza i Praktyka, 2015, 4. Data Mining for Business Analytics; Galit Shmueli, Nitin R. Patel, Peter C. Bruce; John Wiley & Sons, 2016 |
Efekty uczenia się: |
WIEDZA. Absolwent zna i rozumie: 1. Pojęcia, terminologię oraz zaawansowane zagadnienia z zakresu analityki gospodarczej, w tym prawidłowości w kształtowaniu się wielowymiarowych zjawisk i procesów gospodarczy, współzależności występujące między nimi oraz kierunki rozwoju i powiązania analityki gospodarczej z dyscyplinami pokrewnymi, w szczególności z ekonomią oraz możliwościami zastosowania zaawansowanych technik statystycznych, z perspektywy ich właściwego doboru do poruszanej problematyki. K_W02. 2. W pogłębionym stopniu - zagadnienia dotyczące pomiaru zjawisk ekonomicznych, wybrane metody statystyczne i ekonometryczne oraz narzędzia gromadzenia, analizy, przetwarzania i prezentacji danych ekonomicznych i gospodarczych oraz możliwości ich zastosowania w praktyce z perspektywy głębokiej eksploracji danych (data mining). K_W02. 3. W pogłębionym stopniu - metody oceny efektywności poszczególnych obszarów funkcjonowania podmiotu gospodarczego (analiza finansowa, analiza przedsiębiorstwa) , a także zaawansowane metody ilościowe i jakościowe pozwalające na opis i analizę tych procesów, w szczególności z perspektywy predykcji (data mining predykcyjny). K_W10. UMIEJĘTNOŚCI. Absolwent potrafi: 1. Identyfikować, opisywać, modelować i interpretować zjawiska i procesy gospodarcze, wykorzystując zaawansowane metody ilościowe z wykorzystaniem dedykowanego oprogramowania wspierającego zastosowanie technik data minig'u. K_U02 +K_U05 2. Wykorzystać różne źródła informacji z zakresu nauk ekonomicznych i metod analizy danych do szczegółowego opisu zjawisk i procesów zachodzących w przedsiębiorstwie i w jego otoczeniu branżowym, a następnie dokonać oceny, krytycznej analizy i syntezy tych informacji. Umiejętność ta jest szczególnie ważna w budowie hurtowni danych, gdzie dane pochodzą z wielu różnych źródeł, są w odmiennej formie oraz strukturze. Umiejętność ich scalenia, "oczyszczenia" oraz redukcji, a także krytycznej analizy tak przygotowanego zbioru danych jest wysoce pożądana. K_U01. 3. Zaproponować, uzasadnić i wdrożyć znane zaawansowane lub opracować nowe metody ilościowe adekwatne do rozwiązywania konkretnych problemów ekonomicznych - w szczególności wykorzystaniem różnych metod data mining'u. K_U06. KOMPETENCJE SPOŁECZNE: Absolwent jest gotów do: 1. Myślenia i działania w sposób przedsiębiorczy, w szczególności z wykorzystaniem predykcyjnego data minin'gu, który ma wspierać podejmowanie słusznych decyzji biznesowych. K_K01. 2. Uznawania znaczenia analiz gospodarczych dla rozwiązywania problemów praktycznych oraz korzystania z wiedzy eksperckiej w przypadku trudności z samodzielnym znalezieniem rozwiązania - w szczególności uznania analiz gospodarczych opracowanych na podstawie wspomagania komputerowego uczenia się, sieci neuronowych, sztucznej inteligencji, czyli technik wspieranych przez data mining. K_K02. 3. Krytycznej oceny własnej wiedzy oraz odpowiedzialnego przygotowania się do swojej pracy poprzez ciągłe uzupełnianie wiedzy i doskonalenie nabytych umiejętności, przy wykorzystaniu różnorodnych źródeł, metod i technik samokształcenia. Wysoce pożądaną cechą jest uznanie ograniczeń ludzkiego umysłu oraz uznanie wsparcia jakie oferują współczesne, zaawansowane metody data mining'u, które nieustanie się rozwijają oraz są ulepszane. Zaleca się zatem ciągłe doskonalenia nabytych umiejętności, ale także obserwacja aktualnych trendów w data mining'u. Ważne jest przy tym zachowanie umiejętności krytycznej oceny rezultatów analiz prowadzonych z wykorzystaniem technik data mining'u. K_K05. |
Metody i kryteria oceniania: |
Końcowa ocena będzie składową z dwóch obszarów: • Budowa hurtowni danych - big data ( zbudowanie hurtowni danych w oparciu o wskazówki prowadzącego, oczyszczenie danych (redukcja szumów oraz błędów), zaawansowane przekształcenia danych, łączenie danych z różnych źródeł, zapytania w języku M). • Przygotowanie i prezentacja własnego projektu ( wykonanie projektu głębokiej eksploracji danych, poszukiwanie prawidłowości w opracowanej hurtowni danych, analizy statystyczne danych, analityka decyzyjna oraz predykcyjna z wykorzystaniem dedykowanego oprogramowania data minig - samodzielne przygotowanie projektu przez studentów na podstawie zaleceń prowadzącego). Oceny i punktacja (podana w procentach): 90 - 100 - bardzo dobry 80 - 89 - dobry plus 70 - 79 - dobry 60 - 69 - dostateczny plus 50 - 59 - dostateczny 0 - 49 - niedostateczny |
Zakres tematów: |
Ćwiczenie 1 – praca z oprogramowaniem Ćwiczenie 2 – przepływy danych Ćwiczenie 3 – widgety i kanały Ćwiczenie 4 – praca z danymi Ćwiczenie 5 – hierarchiczna analiza skupień (Hierarchical Clustering) Ćwiczenie 6 – prognozowanie Ćwiczenie 7 – ocena i scoring modeli predykcyjnych Ćwiczenie 8 – dodatki (add-ons) Ćwiczenie 9 – analiza (głównych) składowych Ćwiczenie 10 – rangowanie i ocena zmiennych Ćwiczenie 11 – k-Średnia (k-Means) Ćwiczenie 12 – k-Średnia - wyjaśnienie Ćwiczenie 13 – sylwetki Ćwiczenie 14 – analiza obrazów – klastrowanie Ćwiczenie 15 – Text Preprocessing Ćwiczenie 16 – analiza danych tekstowych – Twitter Analysys Ćwiczenie 17 – Covid 19 Ćwiczenie 17 – Covid 19 Data in Time Ćwiczenie 17 – Covid 19 Data with Maps Ponadto: praca z Power Query w zakresie budowy hurtowni danych w tym w zakresie importu danych zewnętrznych, łączenia się z nimi, a następnie kształtowania danych w sposób spełniający potrzeby analityka. Zaawansowana praca z danymi. W dalszej kolejności załadowanie zapytania do programu Excel celem późniejszej automatyacji budowy hurtowni oraz importu danych do oprogramowania Data Mining celem głębokiej eksploracji. Okresowe odświeżanie danych. |
Metody dydaktyczne: |
• prezentacja multimedialna • symulacje praktyczne • metoda projektów • dyskusje grupowe • praca na materiałach źródłowych • praca samodzielna - przygotowanie hurtowni danych oraz opracowanie analizy wybranego problemu z wykorzystaniem technik data minig'u • prezentacja wyników przeprowadzonych analiz wraz z omówieniem zastosowanych technik |
Grupy zajęciowe
Grupa | Termin(y) | Prowadzący |
Miejsca |
Akcje |
---|---|---|---|---|
1 |
każda środa, 13:00 - 14:30,
sala 345 |
Łukasz Kański | 15/15 |
|
Wszystkie zajęcia odbywają się w budynku: Wydział Filozofii i Socjologii |
Właścicielem praw autorskich jest Uniwersytet Marii Curie-Skłodowskiej w Lublinie.