- Oggetto:
- Oggetto:
Informatica per le scienze naturali (II SEM)
- Oggetto:
Informatics for natural science
- Oggetto:
Anno accademico 2021/2022
- Codice dell'attività didattica
- INT 1415
- Docenti
- Prof. Matteo Baldoni (Referente)
Luca Anselma
Ivan Molineris - Corso di studi
- Corso SSST
- Periodo didattico
- Secondo semestre
- Tipologia
- A scelta dello studente
- Crediti/Valenza
- 6 (36 ore)
- SSD dell'attività didattica
- INF/01 - informatica
- Modalità di erogazione
- Tradizionale
- Lingua di insegnamento
- Italiano
- Modalità di frequenza
- Obbligatoria
- Tipologia d'esame
- Prova pratica
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Il corso ha l’obiettivo di introdurre lo studente alla programmazione orientata agli oggetti con Python e all’utilizzo di Python nella bioinformatica e nella data science.
Le modalità di svolgimento dell’attività didattica potranno subire variazioni in base alle limitazioni imposte dalla crisi sanitaria in corso.The course aims at introducing the student to the object-oriented programming with Python and the use of Python for bioinformatics and data science.
- Oggetto:
Modalità di insegnamento
3 moduli di insegnamento3 teaching modules- Oggetto:
Modalità di verifica dell'apprendimento
Esonero e breve orale.
Le modalità di verifica dell’attività didattica potranno subire variazioni in base alle limitazioni imposte dalla crisi sanitaria in corso.
Written exoneration and short oral exam.
- Oggetto:
Programma
Modulo 1 - Programmazione (OO) con Python
Docenti: Matteo Baldoni (14 ore)
Python: variabili, espressioni e istruzioni. Funzioni. Espressioni condizionali. Ricorsione e iterazione. Classi e oggetti
Modulo 2 - Elementi di Bioinformatica
Docenti: Ivan Molineris(10 ore)
Elementi base di bioinformatica.
Breve storia della bioinformatica e basi di biologia. Sfide recenti: sequenziamento a singola cellula. Python base: implementazione di un algoritmo di clustering da zero. Confronto con approcci basati su librerie (pands/scikit). Pipeline scalabili e riproducibili con Snakemake.
Modulo 3 - Tecniche di data science con Python
Docenti: Luca Anselma (12 ore)
Introduzione alla data science. Concetti e tecniche di base per l’apprendimento automatico. Notebook Jupyter. DataFrame pandas. Scikit-learn.
Module 1 - (OO) Programming with Python
Teaching staff: Matteo Baldoni (14 hours)
Python: variables, expressions, and instructions. Conditional expressions. Recursion and iteration. Classes and objects.
Module 2 - Fundamentals of Bioinformatics
Teaching staff: Ivan Molineris (10 hours)
Fundamentals of Bioinformatics
Brief historical overview of bioinformatics and biology. Recent challenges: single cell sequencing. Vanilla python: from scratch
implementation of a clustering algorithm. Comparison with a library (pandas/scikit)
based approach. Reproducible and scalable pipelines with Snakemake.Module 3 - Data science techniques with Python
Teaching staff: Luca Anselma (12 hours)
Introduction to data science. Basic concepts and techniques for machine learning. Jupyter notebooks. Pandas dataframes. Scikit-learn.
Testi consigliati e bibliografia
- Oggetto:
- Libro
- Titolo:
- Think Python 2nd edition – How to Think Like a Computer Scientist
- Anno pubblicazione:
- 2015
- Editore:
- O’Reilly
- Autore:
- Allen B. Downey
- Obbligatorio:
- Si
- Oggetto:
- - Allen B. Downey. Think Python 2nd edition – How to Think Like a Computer Scientist. O’Reilly, 2015.
- Jake VanderPlas. Python Data Science Handbook. O’Reilly, 2016.
- Allen B. Downey. Think Python 2nd edition – How to Think Like a Computer Scientist. O’Reilly, 2015.
- Jake VanderPlas. Python Data Science Handbook. O’Reilly, 2016.
- Oggetto: