- Oggetto:
- Oggetto:
Informatica per le scienze naturali (II SEM)
- Oggetto:
Informatics for natural science
- Oggetto:
Anno accademico 2020/2021
- Codice dell'attività didattica
- INT 1415
- Docenti
- Prof. Matteo Baldoni (Referente)
Prof.ssa Elena Grassi
Luca Anselma - Corso di studi
- Corso SSST
- Periodo didattico
- Secondo semestre
- Tipologia
- A scelta dello studente
- Crediti/Valenza
- 6 (36 ore)
- SSD dell'attività didattica
- INF/01 - informatica
- Modalità di erogazione
- Tradizionale
- Lingua di insegnamento
- Italiano
- Modalità di frequenza
- Obbligatoria
- Tipologia d'esame
- Prova pratica
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Il corso ha l’obiettivo di introdurre lo studente alla programmazione orientata agli oggetti con Python e all’utilizzo di Python nella bioinformatica e nella data science.
Le modalità di svolgimento dell’attività didattica potranno subire variazioni in base alle limitazioni imposte dalla crisi sanitaria in corso.The course aims at introducing the student to the object-oriented programming with Python and the use of Python for bioinformatics and data science.
- Oggetto:
Modalità di insegnamento
3 moduli di insegnamento3 teaching modules- Oggetto:
Modalità di verifica dell'apprendimento
Esonero e breve orale.
Le modalità di verifica dell’attività didattica potranno subire variazioni in base alle limitazioni imposte dalla crisi sanitaria in corso.
Written exoneration and short oral exam.
- Oggetto:
Programma
Modulo 1 - Programmazione (OO) con Python
Docenti: Matteo Baldoni (14 ore)
Python: variabili, espressioni e istruzioni. Funzioni. Espressioni condizionali. Ricorsione e iterazione. Classi e oggetti
Modulo 2 - Elementi di Bioinformatica
Docenti: Elena Grassi (10 ore)
Elementi base di bioinformatica.
Breve storia della bioinformatica e basi di biologia. Sfide recenti: sequenziamento a singola cellula. Python base: implementazione di un algoritmo di clustering da zero. Confronto con approcci basati su librerie (pands/scikit). Pipeline scalabili e riproducibili con Snakemake.
Modulo 3 - Tecniche di data science con Python
Docenti: Luca Anselma (12 ore)
Notebook Jupyter, DataFrame pandas per gestire i dati, NumPy per array, scikit-learn per apprendimento automatico.
Module 1 - (OO) Programming with Python
Teaching staff: Matteo Baldoni (14 hours)
Python: variables, expressions, and instructions. Conditional expressions. Recursion and iteration. Classes and objects.
Module 2 - Fundamentals of Bioinformatics
Teaching staff: Elena Grassi (10 hours)
Fundamentals of Bioinformatics
Brief historical overview of bioinformatics and biology. Recent challenges: single cell sequencing. Vanilla python: from scratch
implementation of a clustering algorithm. Comparison with a library (pandas/scikit)
based approach. Reproducible and scalable pipelines with Snakemake.Module 3 - Data science techniques with Python
Teaching staff: Luca Anselma (12 hours)
Jupyter notebooks, pandas Dataframe for managing data, NumPy for arrays, scikit-learn for machine learning.
Testi consigliati e bibliografia
- Oggetto:
- - Allen B. Downey. Think Python 2nd edition – How to Think Like a Computer Scientist. O’Reilly, 2015.
- Allen B. Downey. Think Python 2nd edition – How to Think Like a Computer Scientist. O’Reilly, 2015.
- Oggetto: