Uniwersytet Jagielloński w Krakowie - Punkt LogowaniaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Analiza danych w języku PYTHON

Informacje ogólne

Kod przedmiotu: WZ.KLK-ADP Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Analiza danych w języku PYTHON
Jednostka: Katedra Lingwistyki Komputerowej
Grupy: Przedmioty dla programu WZKS-123-0-UD-4
stacjonarne II stopnia, rok 1, sem. letni, obowiązkowy
Punkty ECTS i inne: 2.00
zobacz reguły punktacji
Język prowadzenia: polski

Zajęcia w cyklu "Semestr letni 2018/2019" (zakończony)

Okres: 2019-02-23 - 2019-06-14
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Koordynatorzy: Joanna Świebocka-Więk
Prowadzący grup: Joanna Świebocka-Więk
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Cele kształcenia:

Rozwinięcie podstawowych umiejętności języka Python do eksploracji różnych typów danych i ich analizy, np. w planowaniu strategii biznesowej. Nauczenie przygotowywania surowych informacji do analizy naukowej i ich przetwarzania. Pokazanie: jak przeprowadzić analizę statystyczną lub zastosować inne metody matematyczne do analizy danych; oraz jak odpowiednio wizualizować wyniki i przewidzieć przyszłe trendy danych.

Efekty kształcenia:

Wiedza:

– student zna powszechnie stosowane matematyczne metody analizy danych i informacji oraz potrafi je odpowiednio zastosować (K_W02_Ś, K_W03_ŚH)

– student zna obecnie stosowane pakiety komputerowe i biblioteki do przetwarzania danych w języku Python (K_W05_Ś)


Umiejętności:

– student potrafi pozyskać i przygotować surowe dane do analizy (K_U07_Ś, K_U18_ŚH)

– student potrafi używać obecnie stosowane pakiety komputerowe i biblioteki do przetwarzania danych w języku Python (K_U02_H)

– student potrafi przetworzyć, przeanalizować i zwizualizować dane w odpowiednim celu, np.: predykcji, klastrowania, wnioskowania (K_U14_Ś, K_U18_ŚH)


Wymagania wstępne:

Kurs "Zaawansowane techniki programowania 1" oraz podstawowa wiedza ze statystyki matematycznej.

Forma i warunki zaliczenia:

Na zaliczenie przedmiotu składają się zadania laboratoryjne, projekt oraz kolokwium zaliczeniowe.

Warunkiem dopuszczenia do kolokwium jest zaliczenie co najmniej połowy zadań laboratoryjnych oraz pozytywna ocena z projektu zaliczeniowego.

Skala ocen zgodna z Regulaminem Studiów UJ.

Warunki zaliczenia przedmiotu i kryteria oceny podawane na początku zajęć.


Metody sprawdzania i kryteria oceny efektów kształcenia uzyskanych przez studentów:

• Cotygodniowe zestawy zadań laboratoryjnych

• Projekt zaliczeniowy polegający na zastosowaniu prezentowanych metod w praktyce dla rzeczywistych danych

• Kolokwium zaliczeniowe


Metody dydaktyczne:

• Praca w laboratorium

• Indywidualne, nieobowiązkowe, cotygodniowe konsultacje pomagające w realizacji projektu.


Bilans punktów ECTS:

Udział w ćwiczeniach laboratoryjnych: 30 godz.

Praca z zestawami zadań w domu: 15 godz.

Przygotowanie projektu: 5 godz.

Przygotowania do kolokwium zaliczeniowego: 10 godz.

Łączny nakład pracy studenta: 60 godz., co odpowiada 2 pkt. ECTS.


Pełny opis:

• Porównanie plusów i minusów języka Python w ujęciu analizy danych do innych języków programowania

• Środowisko Anaconda i wprowadzenie do głównych bibliotek analizy danych: Nupy, Scipy oraz Matplotlib

• Interaktywna analiza kodu za pomocą IPython/Jupyter

• Dobre nawyki w analizie danych: kontrola wersji, współdzielenie kodu

• Sposoby importu i eksportu danych w języku Python

• Przetwarzanie danych tekstowych

• Przetwarzanie i struktury danych w pakiecie pandas

• Metody parsowania (agregacja, ...)

• Weryfikacja i sanityzacja: szukanie anomalii i brakujących wartości

• Wizualizacja graficzna danych w Pythonie

• Podstawowe wnioskowanie statystyczne

• Przegląd pakietów Pythona do analizy rozszerzonych danych (szeregi czasowe, modelowanie bayesoskie, analiza geoprzestrzenna)

• Wprowadzenie do "scikit-learn"

• Selekcja cech

• Klasyfikacja i regresja

• Dekompozycja danych i klastrowanie

Literatura:

• Marek Gągolewski, Maciej Bartoszuk, Anna Cena, „Przetwarzanie i analiza danych w języku Python”, Wydawnictwo Naukowe PWN, Warszawa 2018

• Joel Grus, „Data science od podstaw. Analiza danych w Pythonie”, Helion 2018

• Wes McKinney, "Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython", II Edycja, O'Reilly Media, Inc, USA 2017

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Jagielloński w Krakowie.