## page was renamed from Scienza/AppChimicaBiologia
## page was renamed from ProveAppBiologia
## page was renamed from jeremie2/Prove12
#LANGUAGE it
#format wiki
<<BR>>
<<Indice(depth=2)>>
<<Informazioni(forum="https://forum.ubuntu-it.org/viewtopic.php?f=46&t=644949")>>

= Introduzione =

Questa pagina presenta una lista di software, librerie e pacchetti utilizzabili su Ubuntu utili nell'ambito della biologia. I contenuti sono divisi in due categorie principali: [[https://it.wikipedia.org/wiki/Bioinformatica|bioinformatica]] e [[https://it.wikipedia.org/wiki/Chimica_computazionale|chimica computazionale]]. Nonostante questa sia una estrema semplificazione degli approcci informatici adottati in biologia, viene assunta questa divisione in filoni principali di ricerca per mere esigenze di semplicità.

{{{#!wiki note
Si fa presente che:
 * L'elenco proposto di seguito non è esaustivo e necessita di aggiornamenti frequenti. Le informazioni, pertanto, potrebbero essere obsolete. Si invitano quindi gli utenti ad effettuare eventuali segnalazioni.
 * È fortemente consigliato consultare sempre i siti web dei singoli progetti, oppure alcuni portali istituzionali quali quelli di '''EMBL''' e  '''NCBI''', riportati in questo [[#UlterioriRisorse|paragrafo]].
}}}

= Bioinformatica =

== BBMap ==

 * '''Sito''': https://sourceforge.net/projects/bbmap/
 * '''Descrizione''': programma per l'allineamento di frammenti (reads) contro una sequenza di riferimento, supporta l'allineamento delle reads prodotte dai principali metodi di ''[[https://it.wikipedia.org/wiki/Next_Generation_Sequencing|sequenziamento di nuova generazione]]''.
 * '''Licenza''': Free

== BioConda ==

 * '''Sito''': https://bioconda.github.io/
 * '''Descrizione''': Bioconda è un repository di software per la bioinformatica distribuito sul package manager Conda.
 * '''Licenza''': MIT License (più licenze specifiche per i singoli pacchetti)

== BioconductoR ==

 * '''Sito''': https://www.bioconductor.org/ 
 * '''Descrizione''': collezione di librerie, pacchetti e dataframe sviluppati per [[https://it.wikipedia.org/wiki/R_(software)|R]] allo scopo di effettuare calcoli e analisi di dati in ambito [[https://it.wikipedia.org/wiki/-omica|omico]] (principalmente genomica e proteomica, ma non solo).
 * '''Licenza''': Artistic License 2.0

== BioPerl ==
 * '''Sito''': https://bioperl.org/
 * '''Descrizione''': repository di moduli per linguaggio Perl dedicati alla bioinformatica.
 * '''Licenza''': GNU Free Documentation License 1.2

== Biopython ==

 * '''Sito''': https://biopython.org/
 * '''Descrizione''': insieme di tool di programmazione sviluppati in Python. È un progetto collaborativo distribuito per sviluppare librerie e applicazioni Python che soddisfino le esigenze del lavoro del bioinformatico. 
 * '''Licenza''': il cpdice sorgente viene distribuito con licenza [[https://github.com/biopython/biopython/blob/master/LICENSE.rst|Biopython License]]

== Bowtie ==

 * '''Sito''': http://bowtie-bio.sourceforge.net/index.shtml
 * '''Descrizione''': pacchetto software comunemente utilizzato per l'allineamento di frammenti (provenienti da metodi di sequenziamento) contro assembly genomici di riferimento. 
 * '''Licenza''': Artistic License 2.0

== CytoScape ==

 * '''Sito''': https://cytoscape.org/
 * '''Descrizione''': piattaforma open source per la visualizzazione di network di interazioni molecolari e [[https://en.wikipedia.org/wiki/Biological_pathway|pathways biologici]]. Consente di integrare i network con annotazioni funzionali (ad esempio [[https://it.wikipedia.org/wiki/Gene_Ontology|Gene Ontology]]), profili di espressione genica e molto altro.
 * '''Licenza''': GNU LGPL (Lesser General Public License)

== FastQC ==

 * '''Sito''': https://www.bioinformatics.babraham.ac.uk/projects/fastqc/
 * '''Descrizione''': tool per il controllo qualità di raw data provenienti da pipeline di sequenziamento high throughput.
 * '''Licenza''': GNU GPL v3

== GATK ==
 * '''Sito''': https://gatk.broadinstitute.org/hc/en-us
 * '''Descrizione''': suite di strumenti per analisi genomiche e caratterizzazione di varianti a partire da dataset di sequenziamento.
 * '''Licenza''': Apache 2.0

== HMMER ==

 * '''Sito''': http://hmmer.org/
 * '''Descrizione''': programma di allineamento di sequenze per la ricerca di sequenze omologhe, l'algoritmo si basa sul ''[[https://it.wikipedia.org/wiki/Modello_di_Markov_nascosto|modello di Markov nascosto]]''.
 * '''Licenza''': BSD-3

== ImageJ ==

 * '''Sito''': https://imagej.net/Welcome
 * '''Descrizione''': software per la rielaborazione analitica di immagini acquisite da strumenti di laboratorio (microscopia, fluorescenza, etc.).
 * '''Licenza''': BSD-2

== MaxQuant/Perseus ==

 * '''Sito''': https://maxquant.net/
 * '''Descrizione''': piattaforma per l’analisi di dati di proteomica quantitativa, in particolare !MaxQuant è disegnato specificamente per l’analisi di dataset da spettrometria di massa.
 * '''Licenza''': Freeware

== Muscle ==

 * '''Sito''': http://www.drive5.com/muscle/
 * '''Descrizione''': tool per [[https://en.wikipedia.org/wiki/Multiple_sequence_alignment|allineamento multiplo]] di sequenze. Questo software è particolarmente indicato per eseguire allineamenti strutturali con strutture 3D.
 * '''Licenza''': Public Domain

== PHYLIP ==

 * '''Sito''': https://evolution.genetics.washington.edu/phylip.html
 * '''Descrizione''': pacchetto di programmi per inferire alberi evolutivi e fare analisi [[https://it.wikipedia.org/wiki/Filogenesi|filogenetiche]]. 
 * '''Licenza''': FOSS

== Prokka ==
 * '''Sito''': https://vicbioinformatics.com/software.prokka.shtml
 * '''Descrizione''': software per l'annotazione di genomi virali e batterici.
 * '''Licenza''': GNU GPL v2

== psort ==
 * '''Sito''': http://psort.org/
 * '''Descrizione''': famiglia di programmi per la predizione della localizzazione subcellulare di proteine.
 * '''Licenza''': FOSS

== Seaview ==

 * '''Sito''': http://doua.prabi.fr/software/seaview
 * '''Descrizione''': semplice editor per la manipolazione di allineamenti multipli.
 * '''Licenza''': GNU GPL

== T-Coffee ==

 * '''Sito''': http://www.tcoffee.org/
 * '''Descrizione''': piattaforma integrata tool per [[https://en.wikipedia.org/wiki/Multiple_sequence_alignment|allineamento multiplo]] di sequenze. Questo software è noto per le sue performance, permette di usare anche profili di [[https://it.wikipedia.org/wiki/Struttura_secondaria|struttura secondaria]].
 * '''Licenza''': GNU GPL, Creative Commons Attribution-!NonCommercial-!ShareAlike 3.0 Unported License

== UGENE ==

 * '''Sito''': http://ugene.net/
 * '''Descrizione''': piattaforma integrata per l'analisi di dati biologici come sequenze, annotazioni, allineamenti multipli, alberi filogenetici, [[https://en.wikipedia.org/wiki/Sequencing|assembly NGS]] e molto altro.
 * '''Licenza''': GNU GPL v2.0

= Chimica Computazionale =

== AMBER ==

 * '''Sito''': https://ambermd.org
 * '''Descrizione''': software per simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]], molto impiegato per la robustezza e l’affidabilità dei [[https://it.wikipedia.org/wiki/Force_field|force field]] che implementa.
 * '''Licenza''': il core principale di AMBER viene rilasciato sotto licenza proprietaria, i tool di analisi e sviluppo (''AMBERTools'') vengono rilasciati con licenze GPL o FOSS.

== AutoDock ==

 * '''Sito''': http://autodock.scripps.edu/
 * '''Descrizione''': suite di tool per eseguire calcoli di [[https://it.wikipedia.org/wiki/Docking_(chimica)|docking]], predice pose strutturali su come piccole molecole possano legarsi a recettori la cui struttura 3D è nota sperimentalmente.
 * '''Licenza''': GNU General Public License, Licenza Apache

== Bioblender ==

 * '''Sito''': http://www.bioblender.org/
 * '''Descrizione''': estensione di '''Blender''' per la visualizzazione e il rendering di biomolecole.
 * '''Licenza''': GNU GPL

== ccp4 ==

 * '''Sito''': https://www.ccp4.ac.uk/
 * '''Descrizione''': il ''Collaborative Computational Project Number 4'' ('''ccp4''') è un progetto istituito nel 1979 per supportare la collaborazione tra ricercatori che lavorano nello sviluppo di software e assemblare una raccolta completa di software per la biologia strutturale. Esiste un progetto derivato (''Collaborative Computational Project for Electron cryo-Microscopy'' - [[https://www.ccpem.ac.uk|ccp-em]]) dedicato alla [[https://it.wikipedia.org/wiki/Microscopia_crioelettronica|microscopia crioelettronica]].
 * '''Licenza''': dipenda dai singoli pacchetti della raccolta.

== Chimera ==

 * '''Sito''': https://www.cgl.ucsf.edu/chimera/
 * '''Descrizione''': software per la visualizzazione e l'analisi interattiva di strutture molecolari e dati correlati, tra cui mappe di densità, complessi supramolecolari, allineamenti di sequenze, risultati di docking, traiettorie e ensemble conformazionali.
 * '''Licenza''': Free per uso non commerciale

== GROMACS ==

 * '''Sito''': https://www.gromacs.org/ 
 * '''Descrizione''': software per simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]], molto utile per i numerosi tool di analisi post-produzione che offre.
 * '''Licenza''': GNU Lesser General Public License (LGPL), version 2.1

== Modeller ==

 * '''Sito''': https://salilab.org/modeller/ 
 * '''Descrizione''': Software per la creazione di modelli strutturali di proteine usando l’approccio del [[https://en.wikipedia.org/wiki/Homology_modeling|homology modeling]]
 * '''Licenza''': Software proprietario: academic nonprofit freeware, Software commerciale

== NAMD ==

 * '''Sito''': https://www.ks.uiuc.edu/Research/namd/
 * '''Descrizione''': software per simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]], particolarmente adatto per simulazioni avanzate di meta-dinamica (ad esempio [[https://www.ks.uiuc.edu/Research/namd/2.9/ug/node63.html|Accelerated Molecular Dynamics]]).
 * '''Licenza''': Software proprietario, freeware for noncommercial use

== Open Babel ==

 * '''Sito''': http://openbabel.org/wiki/Main_Page
 * '''Descrizione''': toolbox per la conversione di formati di file chimici.
 * '''Licenza''': GNU GPL v2.0

== PyMOL ==

 * '''Sito''': https://pymol.org/
 * '''Descrizione''': viewer molecolare di alto livello, ideale per la produzione di materiale da pubblicare o presentare.
 * '''Licenza''': la versione attuale di '''PyMOL''' è chiusa e a pagamento rilasciata da Schrodinger.
 {{{#!wiki important
Esistono [[https://it.wikipedia.org/wiki/PyMOL|progetti open e free]] ma potrebbero riguardare vecchie versioni forse non più mantenute.
}}}

== Quantum ESPRESSO ==

 * '''Sito''': https://www.quantum-espresso.org/
 * '''Descrizione''': suite per i calcoli della struttura elettronica la modellazione di materiali, si basa sulla teoria del funzionale della densità ([[https://it.wikipedia.org/wiki/Teoria_del_funzionale_della_densit%C3%A0|DFT]]).
 * '''Licenza''': GNU GPL

== Rosetta ==
 * '''Sito''': https://www.rosettacommons.org/
 * '''Descrizione''': software per la modellazione [[https://it.wikipedia.org/wiki/Metodo_ab_initio|ab initio]] di macromolecole, punto di riferimento per la predizione di strutture proteiche. Considerato l'intensivo sforzo di calcolo richiesto '''Rosetta''' viene distribuito anche come servizio online.
 * '''Licenza''': Commerciale, liberamente disponibile per uso accademico

== ViennaRNA ==

 * '''Sito''': https://www.tbi.univie.ac.at/RNA/
 * '''Descrizione''': pacchetto di tools per la predizione e l'analisi di strutture secondarie di RNA.
 * '''Licenza''': FOSS

== VMD ==

 * '''Sito''': http://www.ks.uiuc.edu/Research/vmd/
 * '''Descrizione''': viewer molecolare particolarmente versatile per la visualizzazione grafica di simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]]
 * '''Licenza''': Distribution specific

<<Anchor(UlterioriRisorse)>>
= Ulteriori risorse online =

 * [[http://www.cathdb.info/|CATH]]: banca dati per la classificazione strutturale di domini proteici.
 * [[https://david.ncifcrf.gov/|DAVID]]: database di annotazioni funzionali su dati provenienti da [[https://it.wikipedia.org/wiki/Microarray_di_DNA|microarray]].
 * [[https://www.ebi.ac.uk/|EMBL-EBI]]: portale dell'European Bioinformatics Institute, gestito dall'European Molecular Biology Laboratory. Tra i diversi servizi che offre citiamo:
   * [[https://www.ensembl.org/|Ensembl]]: browser genomico.
   * [[https://www.ebi.ac.uk/interpro/|InterPro]]: banca dati per la classificazione di famiglie di proteine.
   * [[https://www.ebi.ac.uk/Tools/msa/|MSA tools]]: tools online di allineamento multiplo di sequenze.
   * [[https://www.ebi.ac.uk/thornton-srv/databases/cgi-bin/pdbsum/GetPage.pl?pdbcode=index.html|PDBsum]]: database che colleziona informazioni e annotazioni su strutture 3D (file PDB).
 * [[https://www.embnet.org/wp/|EMBnet]]: l'European Molecular Biology network è una rete scientifica internazionale e un gruppo di interesse che mira a migliorare i servizi di bioinformatica riunendo competenze e capacità di bioinformatica. 
 * [[https://www.embo.org/|EMBO]]: l'European Molecular Biology Organization è un'organizzazione che riunisce scienziati e ricercatori scientifici sulla base dell'"eccellenza nella ricerca" nell'area delle scienze biologiche e in particolare della biologia molecolare.
 * [[https://usegalaxy.org/|Galaxy]]: piattaforma integrata per l'analisi di dati genomici, offre numerosi tool da combinare in workflow customizzabili.
 * [[https://www.genecards.org|GeneCards]]: questo portale rappresenta il punto di partenza per reperire una grande quantità di informazioni e annotazioni sui geni umani.
 * [[https://www.genepattern.org/|GenePattern]]: piattaforma per l'analisi dell'espressione genica (RNA-seq and microarray), copy number variation, proteomica, citometria di flusso e network analysis.
 * [[http://geneontology.org/|Gene Ontology]]: progetto bioinformatico atto a unificare la descrizione delle caratteristiche dei prodotti dei geni in tutte le specie viventi attraverso lo sviluppo di un vocabolario controllato i cui termini sono interconnessi gli uni agli altri attraverso un grafo ad albero.
 * [[https://www.genome.jp/kegg/pathway.html|KEGG Pathway Database]]: database di pathway metabolici.
 * [[https://www.iedb.org/|Immune Epitope DataBase]]: database che raccoglie antigeni ed [[https://it.wikipedia.org/wiki/Epitopo|epitopi]] isolati e carratterizzati, contiene pure annotazioni di natura immunologica.
 * [[https://meme-suite.org/meme/|MEME]]: raccolta di tool online per individuare motivi e fare inferenza su sequenze amminoacidiche o di acidi nucleici che non risultano note da allineamenti.
 * [[https://www.ncbi.nlm.nih.gov/|NCBI]]: portale del National Center for Biotechnology Information, gestito dal National Institute of Health (NIH). Tra i diversi servizi che offre citiamo:
   * [[https://blast.ncbi.nlm.nih.gov/Blast.cgi|BLAST]]: metodi per l'[[https://it.wikipedia.org/wiki/Allineamento_di_sequenze|allineamento locale di sequenze]].
   * [[https://www.ncbi.nlm.nih.gov/gene|(Entrez)Gene]]: banca dati di geni isolati e caratterizzati.
   * [[https://pubmed.ncbi.nlm.nih.gov/|PubMed]]: portale per la ricerca bibliografica di articoli scientifici peer reviewed.
   * [[https://www.ncbi.nlm.nih.gov/refseq/|RefSeq]]: banca dati di sequenze amminoacidiche risolte sperimentalmente.
 * [[https://www.nextflow.io/|Nextflow]]: piattaforma per gestire workflow e pipeline scientifiche usando software containers.
 * [[https://www.omim.org/|OMIM]]: banca dati sulle malattie ereditarie e disordini genetici.
 * [[https://www.pathwaycommons.org/|Pathway Commons]]: portale per la ricerca di pathways metabolici.
 * [[https://www.rcsb.org/|Protein Data Bank]]: repository di strutture 3D di macromolecole (proteine, acidi nucleici) risolte sperimentalmente.
 * [[https://predictioncenter.org/|Protein Structure Prediction Center]]: questo sito raccoglie i risultati dei CASP (Critical Assessment of protein Structure Prediction), un contest internazionale per la valutazione di metodi innovativi di predizione di strutture 3D.
 * [[https://reactome.org/|Reactome]]: database di pathway metabolici.
 * [[http://scop.mrc-lmb.cam.ac.uk/|SCOP]]: database per la classificazione strutturale delle proteine.
 * [[https://snakemake.readthedocs.io/en/stable/|Snakemake]]: sistema di gestione di workflow per creare analisi riproducibili e scalabili, sviluppato in Python.
 * [[https://string-db.org/|STRING]]: tool per l'analisi di network di interazioni proteina-proteina.
 * [[https://www.ibi.vu.nl/programs/sympredwww/|SYMPRED]]: metaserver che colleziona i risultati e restituisce un consensus dei principali metodi di predizione di struttura secondaria delle proteine.
 * [[https://taverna.incubator.apache.org/|Taverna]]: piattaforma per la progettazione e l'esecuzione di workflow.
 * [[https://www.proteinatlas.org/|The Human Protein Atlas]]: database utile per valutare dove e in che modo sono espresse le proteine umane, basato su dati di evidenze sperimentali.
 * [[https://genome-euro.ucsc.edu/cgi-bin/hgGateway|UCSC Genome Browser]]: browser genomico per visualizzare dove mappano i geni sui genomi di diversi organismi.
 * [[https://www.uniprot.org/uniprot|UniProtKB]]: repository di annotazioni funzionali di proteine (sperimentali e computazionali).
 * [[https://varsome.com/|Varsome]]: bancadati che raccoglie mutazioni e varianti genetiche umane.

= Ulteriori risorse =

 * [[https://help.ubuntu.com/community/UbuntuScience/Biology|UbuntuScience/Biology]]: pagina con ulteriori voci sul wiki internazionale, dalla quale questa guida prende spunto.

 * [[https://en.wikipedia.org/wiki/Comparison_of_software_for_molecular_mechanics_modeling|Molecular mechanics]]: pagina di Wikipedia con i principali software, e relativo confronto, per calcoli di meccanica molecolare.

----
CategoryScienza