Data mining (AI)
Informacje ogólne
Kod przedmiotu: | F-K.149 |
Kod Erasmus / ISCED: |
(brak danych)
/
(0619) Komputeryzacja (inne)
|
Nazwa przedmiotu: | Data mining (AI) |
Jednostka: | Instytut Filozofii |
Grupy: |
Kognitywistyka I st. prz. wybieralne blok #AI (sem. 4,6) |
Strona przedmiotu: | https://kampus.umcs.pl |
Punkty ECTS i inne: |
4.00
|
Język prowadzenia: | polski |
Wymagania wstępne: | Posiadanie podstawowej wiedzy z zakresu obsługi komputera oraz pakietu office. Posiadanie wiedzy z zakresu statystyki i procesów analitycznych zgodnie z programem studiów. |
Godzinowe ekwiwalenty punktów ECTS: | a) godziny kontaktowe (z udziałem nauczyciela akademickiego): Łącznie 30h, w tym 30h konwersatorium. 1 ECTS b) godziny niekontraktowe (praca własna studenta): Łącznie 75h , w tym: studiowanie literatury przedmiotu 25h, wykonanie analizy i przygotowanie raportu 35h, przygotowanie do zaliczenia 15h. 3 ECTS Sumaryczna ilość godzin dla przedmiotu: 105h Sumaryczna ilość punktów ECTS dla przedmiotu: 4 ECTS |
Sposób weryfikacji efektów kształcenia: | Efekty kształcenia będą weryfikowane w oparciu o dwa obszary: 1. Obszar hurtowni danych oraz big data: zbudowanie hurtowni danych w oparciu o wskazówki prowadzącego, oczyszczenie danych (redukcja szumów oraz błędów), zaawansowane przekształcenia danych, łączenie danych z różnych źródeł, zapytania w języku M - wykorzystanie stworzonej przez studenta hurtowni danych (bug data) na potrzeby projektu własnego. 2. Obszar data mining - wykonanie projektu głębokiej eksploracji danych, poszukiwanie prawidłowości w opracowanej hurtowni danych, analizy statystyczne danych, analityka decyzyjna oraz predykcyjna z wykorzystaniem dedykowanego oprogramowania data minig - samodzielne przygotowanie projektu przez studentów na podstawie zaleceń prowadzącego, |
Pełny opis: |
Duża część obecnie wytwarzanych danych ma specyficzne właściwości: są wysoce zróżnicowane, złożone i zazwyczaj słabo ustrukturyzowane. Wstępnie uporządkowane są zazwyczaj cyfrowe dane gromadzone przez instytucje publiczne, korporacje i organizacje pozarządowe. Natomiast dane generowane przez media społecznościowe, logowania na serwery, zakupy w sieci, systemy geolokacji czy odczyty sensorów są słabo ustrukturyzowane. Celem kursu jest zapoznanie uczestników z zasadami budowania dużych zbiorów danych (hurtownie danych, big data) oraz sposobami automatycznego czyszczenia i porządkowania tych zbiorów. Możliwości wykorzystania big data rosną wraz z rozwojem sztucznej inteligencji i opartych na niej nowych narzędziach i technologiach analizy, w tym: uczenia maszynowego (machine learning) i uczenia głębokiego (deep learning). W rezultacie dane są pozyskiwane, przetwarzane, analizowane i wizualizowane coraz szybciej i efektywniej. Możliwości jakie dają nam hurtownie danych coraz częściej wykorzystywane są data mining'u. Zgłębianie danych (data mining) to proces analityczny, przeznaczony do badania dużych zasobów danych (zazwyczaj powiązanych z zagadnieniami gospodarczymi lub rynkowymi) w poszukiwaniu regularnych wzorców oraz systematycznych współzależności pomiędzy zmiennymi, a następnie do oceny wyników poprzez zastosowanie wykrytych wzorców do nowych podzbiorów danych. Finalnym celem data mining jest najczęściej przewidywanie (zachowań klientów, wielkości sprzedaży, prawdopodobieństwa utraty klienta itp.), dlatego też predykcyjny data mining jest bardzo popularny. Predykcyjny data mining daje bezpośrednie korzyści biznesowe. W trakcie kursu studenci zostaną zapoznani z zasadami realizacji zadań z wykorzystaniem technik data mining'u, a także z wybranym oprogramowaniem wspierającym wykorzystanie technik głębokiej eksploracji danych. |
Literatura: |
Literatura podstawowa: 1. Power query w Excelu i Power BI, Zbieranie i przekształcania danych, Gil Raviv 2. POWER BI I POWER PIVOT DLA EXCELA. ANALIZA DANYCH, Ferrari Alberto, Russo Marco, Wydawnictwo Helion 3. Big data, nauka o danych i AI bez tajemnic?, David Stephenson, 2019 4. Introduction to Data Mining, Global Edition; Pang-Ning Tan, Michael Steinbach; Pearson Education Limited, 2018 Literatura uzupełniająca: 1. https://docs.biolab.si/2/ - dokumentacja do Orange 2.7 2. Data science od podstaw. Analiza danych w Pythonie, Grus Joel, 2020 3. Data Mining, czyli wyszukiwanie informacji w zbiorach danych, Marcin Urbański, Wiedza i Praktyka, 2015, 4. Data Mining for Business Analytics; Galit Shmueli, Nitin R. Patel, Peter C. Bruce; John Wiley & Sons, 2016 |
Efekty uczenia się: |
WIEDZA. Absolwent zna i rozumie: 1. Pojęcia, terminologię oraz zaawansowane zagadnienia z zakresu analityki gospodarczej, w tym prawidłowości w kształtowaniu się wielowymiarowych zjawisk i procesów gospodarczy, współzależności występujące między nimi oraz kierunki rozwoju i powiązania analityki gospodarczej z dyscyplinami pokrewnymi, w szczególności z ekonomią oraz możliwościami zastosowania zaawansowanych technik statystycznych, z perspektywy ich właściwego doboru do poruszanej problematyki. K_W02. 2. W pogłębionym stopniu - zagadnienia dotyczące pomiaru zjawisk ekonomicznych, wybrane metody statystyczne i ekonometryczne oraz narzędzia gromadzenia, analizy, przetwarzania i prezentacji danych ekonomicznych i gospodarczych oraz możliwości ich zastosowania w praktyce z perspektywy głębokiej eksploracji danych (data mining). K_W02. 3. W pogłębionym stopniu - metody oceny efektywności poszczególnych obszarów funkcjonowania podmiotu gospodarczego (analiza finansowa, analiza przedsiębiorstwa) , a także zaawansowane metody ilościowe i jakościowe pozwalające na opis i analizę tych procesów, w szczególności z perspektywy predykcji (data mining predykcyjny). K_W10. UMIEJĘTNOŚCI. Absolwent potrafi: 1. Identyfikować, opisywać, modelować i interpretować zjawiska i procesy gospodarcze, wykorzystując zaawansowane metody ilościowe z wykorzystaniem dedykowanego oprogramowania wspierającego zastosowanie technik data minig'u. K_U02 +K_U05 2. Wykorzystać różne źródła informacji z zakresu nauk ekonomicznych i metod analizy danych do szczegółowego opisu zjawisk i procesów zachodzących w przedsiębiorstwie i w jego otoczeniu branżowym, a następnie dokonać oceny, krytycznej analizy i syntezy tych informacji. Umiejętność ta jest szczególnie ważna w budowie hurtowni danych, gdzie dane pochodzą z wielu różnych źródeł, są w odmiennej formie oraz strukturze. Umiejętność ich scalenia, "oczyszczenia" oraz redukcji, a także krytycznej analizy tak przygotowanego zbioru danych jest wysoce pożądana. K_U01. 3. Zaproponować, uzasadnić i wdrożyć znane zaawansowane lub opracować nowe metody ilościowe adekwatne do rozwiązywania konkretnych problemów ekonomicznych - w szczególności wykorzystaniem różnych metod data mining'u. K_U06. KOMPETENCJE SPOŁECZNE: Absolwent jest gotów do: 1. Myślenia i działania w sposób przedsiębiorczy, w szczególności z wykorzystaniem predykcyjnego data minin'gu, który ma wspierać podejmowanie słusznych decyzji biznesowych. K_K01. 2. Uznawania znaczenia analiz gospodarczych dla rozwiązywania problemów praktycznych oraz korzystania z wiedzy eksperckiej w przypadku trudności z samodzielnym znalezieniem rozwiązania - w szczególności uznania analiz gospodarczych opracowanych na podstawie wspomagania komputerowego uczenia się, sieci neuronowych, sztucznej inteligencji, czyli technik wspieranych przez data mining. K_K02. 3. Krytycznej oceny własnej wiedzy oraz odpowiedzialnego przygotowania się do swojej pracy poprzez ciągłe uzupełnianie wiedzy i doskonalenie nabytych umiejętności, przy wykorzystaniu różnorodnych źródeł, metod i technik samokształcenia. Wysoce pożądaną cechą jest uznanie ograniczeń ludzkiego umysłu oraz uznanie wsparcia jakie oferują współczesne, zaawansowane metody data mining'u, które nieustanie się rozwijają oraz są ulepszane. Zaleca się zatem ciągłe doskonalenia nabytych umiejętności, ale także obserwacja aktualnych trendów w data mining'u. Ważne jest przy tym zachowanie umiejętności krytycznej oceny rezultatów analiz prowadzonych z wykorzystaniem technik data mining'u. K_K05. |
Zajęcia w cyklu "Semestr letni 2022/2023" (zakończony)
Okres: | 2023-02-27 - 2023-06-25 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin
|
|
Koordynatorzy: | (brak danych) | |
Prowadzący grup: | (brak danych) | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Zajęcia w cyklu "Semestr letni 2023/2024" (zakończony)
Okres: | 2024-02-26 - 2024-06-23 |
Przejdź do planu
PN WT ŚR CZ LB
PT |
Typ zajęć: |
Laboratorium, 30 godzin
|
|
Koordynatorzy: | Łukasz Kański | |
Prowadzący grup: | Łukasz Kański | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Właścicielem praw autorskich jest Uniwersytet Marii Curie-Skłodowskiej w Lublinie.