## page was renamed from Scienza/AppChimicaBiologia ## page was renamed from ProveAppBiologia ## page was renamed from jeremie2/Prove12 #LANGUAGE it #format wiki <
> <> <> = Introduzione = Questa pagina presenta una lista di software, librerie e pacchetti utilizzabili su Ubuntu utili nell'ambito della biologia. I contenuti sono divisi in due categorie principali: [[https://it.wikipedia.org/wiki/Bioinformatica|bioinformatica]] e [[https://it.wikipedia.org/wiki/Chimica_computazionale|chimica computazionale]]. Nonostante questa sia una estrema semplificazione degli approcci informatici adottati in biologia, viene assunta questa divisione in filoni principali di ricerca per mere esigenze di semplicità. {{{#!wiki note Si fa presente che: * L'elenco proposto di seguito non è esaustivo e necessita di aggiornamenti frequenti. Le informazioni, pertanto, potrebbero essere obsolete. Si invitano quindi gli utenti ad effettuare eventuali segnalazioni. * È fortemente consigliato consultare sempre i siti web dei singoli progetti, oppure alcuni portali istituzionali quali quelli di '''EMBL''' e '''NCBI''', riportati in questo [[#UlterioriRisorse|paragrafo]]. }}} = Bioinformatica = == BBMap == * '''Sito''': https://sourceforge.net/projects/bbmap/ * '''Descrizione''': programma per l'allineamento di frammenti (reads) contro una sequenza di riferimento, supporta l'allineamento delle reads prodotte dai principali metodi di ''[[https://it.wikipedia.org/wiki/Next_Generation_Sequencing|sequenziamento di nuova generazione]]''. * '''Licenza''': Free == BioConda == * '''Sito''': https://bioconda.github.io/ * '''Descrizione''': Bioconda è un repository di software per la bioinformatica distribuito sul package manager Conda. * '''Licenza''': MIT License (più licenze specifiche per i singoli pacchetti) == BioconductoR == * '''Sito''': https://www.bioconductor.org/ * '''Descrizione''': collezione di librerie, pacchetti e dataframe sviluppati per [[https://it.wikipedia.org/wiki/R_(software)|R]] allo scopo di effettuare calcoli e analisi di dati in ambito [[https://it.wikipedia.org/wiki/-omica|omico]] (principalmente genomica e proteomica, ma non solo). * '''Licenza''': Artistic License 2.0 == BioPerl == * '''Sito''': https://bioperl.org/ * '''Descrizione''': repository di moduli per linguaggio Perl dedicati alla bioinformatica. * '''Licenza''': GNU Free Documentation License 1.2 == Biopython == * '''Sito''': https://biopython.org/ * '''Descrizione''': insieme di tool di programmazione sviluppati in Python. È un progetto collaborativo distribuito per sviluppare librerie e applicazioni Python che soddisfino le esigenze del lavoro del bioinformatico. * '''Licenza''': il cpdice sorgente viene distribuito con licenza [[https://github.com/biopython/biopython/blob/master/LICENSE.rst|Biopython License]] == Bowtie == * '''Sito''': http://bowtie-bio.sourceforge.net/index.shtml * '''Descrizione''': pacchetto software comunemente utilizzato per l'allineamento di frammenti (provenienti da metodi di sequenziamento) contro assembly genomici di riferimento. * '''Licenza''': Artistic License 2.0 == CytoScape == * '''Sito''': https://cytoscape.org/ * '''Descrizione''': piattaforma open source per la visualizzazione di network di interazioni molecolari e [[https://en.wikipedia.org/wiki/Biological_pathway|pathways biologici]]. Consente di integrare i network con annotazioni funzionali (ad esempio [[https://it.wikipedia.org/wiki/Gene_Ontology|Gene Ontology]]), profili di espressione genica e molto altro. * '''Licenza''': GNU LGPL (Lesser General Public License) == FastQC == * '''Sito''': https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ * '''Descrizione''': tool per il controllo qualità di raw data provenienti da pipeline di sequenziamento high throughput. * '''Licenza''': GNU GPL v3 == GATK == * '''Sito''': https://gatk.broadinstitute.org/hc/en-us * '''Descrizione''': suite di strumenti per analisi genomiche e caratterizzazione di varianti a partire da dataset di sequenziamento. * '''Licenza''': Apache 2.0 == HMMER == * '''Sito''': http://hmmer.org/ * '''Descrizione''': programma di allineamento di sequenze per la ricerca di sequenze omologhe, l'algoritmo si basa sul ''[[https://it.wikipedia.org/wiki/Modello_di_Markov_nascosto|modello di Markov nascosto]]''. * '''Licenza''': BSD-3 == ImageJ == * '''Sito''': https://imagej.net/Welcome * '''Descrizione''': software per la rielaborazione analitica di immagini acquisite da strumenti di laboratorio (microscopia, fluorescenza, etc.). * '''Licenza''': BSD-2 == MaxQuant/Perseus == * '''Sito''': https://maxquant.net/ * '''Descrizione''': piattaforma per l’analisi di dati di proteomica quantitativa, in particolare !MaxQuant è disegnato specificamente per l’analisi di dataset da spettrometria di massa. * '''Licenza''': Freeware == Muscle == * '''Sito''': http://www.drive5.com/muscle/ * '''Descrizione''': tool per [[https://en.wikipedia.org/wiki/Multiple_sequence_alignment|allineamento multiplo]] di sequenze. Questo software è particolarmente indicato per eseguire allineamenti strutturali con strutture 3D. * '''Licenza''': Public Domain == PHYLIP == * '''Sito''': https://evolution.genetics.washington.edu/phylip.html * '''Descrizione''': pacchetto di programmi per inferire alberi evolutivi e fare analisi [[https://it.wikipedia.org/wiki/Filogenesi|filogenetiche]]. * '''Licenza''': FOSS == Prokka == * '''Sito''': https://vicbioinformatics.com/software.prokka.shtml * '''Descrizione''': software per l'annotazione di genomi virali e batterici. * '''Licenza''': GNU GPL v2 == psort == * '''Sito''': http://psort.org/ * '''Descrizione''': famiglia di programmi per la predizione della localizzazione subcellulare di proteine. * '''Licenza''': FOSS == Seaview == * '''Sito''': http://doua.prabi.fr/software/seaview * '''Descrizione''': semplice editor per la manipolazione di allineamenti multipli. * '''Licenza''': GNU GPL == T-Coffee == * '''Sito''': http://www.tcoffee.org/ * '''Descrizione''': piattaforma integrata tool per [[https://en.wikipedia.org/wiki/Multiple_sequence_alignment|allineamento multiplo]] di sequenze. Questo software è noto per le sue performance, permette di usare anche profili di [[https://it.wikipedia.org/wiki/Struttura_secondaria|struttura secondaria]]. * '''Licenza''': GNU GPL, Creative Commons Attribution-!NonCommercial-!ShareAlike 3.0 Unported License == UGENE == * '''Sito''': http://ugene.net/ * '''Descrizione''': piattaforma integrata per l'analisi di dati biologici come sequenze, annotazioni, allineamenti multipli, alberi filogenetici, [[https://en.wikipedia.org/wiki/Sequencing|assembly NGS]] e molto altro. * '''Licenza''': GNU GPL v2.0 = Chimica Computazionale = == AMBER == * '''Sito''': https://ambermd.org * '''Descrizione''': software per simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]], molto impiegato per la robustezza e l’affidabilità dei [[https://it.wikipedia.org/wiki/Force_field|force field]] che implementa. * '''Licenza''': il core principale di AMBER viene rilasciato sotto licenza proprietaria, i tool di analisi e sviluppo (''AMBERTools'') vengono rilasciati con licenze GPL o FOSS. == AutoDock == * '''Sito''': http://autodock.scripps.edu/ * '''Descrizione''': suite di tool per eseguire calcoli di [[https://it.wikipedia.org/wiki/Docking_(chimica)|docking]], predice pose strutturali su come piccole molecole possano legarsi a recettori la cui struttura 3D è nota sperimentalmente. * '''Licenza''': GNU General Public License, Licenza Apache == Bioblender == * '''Sito''': http://www.bioblender.org/ * '''Descrizione''': estensione di '''Blender''' per la visualizzazione e il rendering di biomolecole. * '''Licenza''': GNU GPL == ccp4 == * '''Sito''': https://www.ccp4.ac.uk/ * '''Descrizione''': il ''Collaborative Computational Project Number 4'' ('''ccp4''') è un progetto istituito nel 1979 per supportare la collaborazione tra ricercatori che lavorano nello sviluppo di software e assemblare una raccolta completa di software per la biologia strutturale. Esiste un progetto derivato (''Collaborative Computational Project for Electron cryo-Microscopy'' - [[https://www.ccpem.ac.uk|ccp-em]]) dedicato alla [[https://it.wikipedia.org/wiki/Microscopia_crioelettronica|microscopia crioelettronica]]. * '''Licenza''': dipenda dai singoli pacchetti della raccolta. == Chimera == * '''Sito''': https://www.cgl.ucsf.edu/chimera/ * '''Descrizione''': software per la visualizzazione e l'analisi interattiva di strutture molecolari e dati correlati, tra cui mappe di densità, complessi supramolecolari, allineamenti di sequenze, risultati di docking, traiettorie e ensemble conformazionali. * '''Licenza''': Free per uso non commerciale == GROMACS == * '''Sito''': https://www.gromacs.org/ * '''Descrizione''': software per simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]], molto utile per i numerosi tool di analisi post-produzione che offre. * '''Licenza''': GNU Lesser General Public License (LGPL), version 2.1 == Modeller == * '''Sito''': https://salilab.org/modeller/ * '''Descrizione''': Software per la creazione di modelli strutturali di proteine usando l’approccio del [[https://en.wikipedia.org/wiki/Homology_modeling|homology modeling]] * '''Licenza''': Software proprietario: academic nonprofit freeware, Software commerciale == NAMD == * '''Sito''': https://www.ks.uiuc.edu/Research/namd/ * '''Descrizione''': software per simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]], particolarmente adatto per simulazioni avanzate di meta-dinamica (ad esempio [[https://www.ks.uiuc.edu/Research/namd/2.9/ug/node63.html|Accelerated Molecular Dynamics]]). * '''Licenza''': Software proprietario, freeware for noncommercial use == Open Babel == * '''Sito''': http://openbabel.org/wiki/Main_Page * '''Descrizione''': toolbox per la conversione di formati di file chimici. * '''Licenza''': GNU GPL v2.0 == PyMOL == * '''Sito''': https://pymol.org/ * '''Descrizione''': viewer molecolare di alto livello, ideale per la produzione di materiale da pubblicare o presentare. * '''Licenza''': la versione attuale di '''PyMOL''' è chiusa e a pagamento rilasciata da Schrodinger. {{{#!wiki important Esistono [[https://it.wikipedia.org/wiki/PyMOL|progetti open e free]] ma potrebbero riguardare vecchie versioni forse non più mantenute. }}} == Quantum ESPRESSO == * '''Sito''': https://www.quantum-espresso.org/ * '''Descrizione''': suite per i calcoli della struttura elettronica la modellazione di materiali, si basa sulla teoria del funzionale della densità ([[https://it.wikipedia.org/wiki/Teoria_del_funzionale_della_densit%C3%A0|DFT]]). * '''Licenza''': GNU GPL == Rosetta == * '''Sito''': https://www.rosettacommons.org/ * '''Descrizione''': software per la modellazione [[https://it.wikipedia.org/wiki/Metodo_ab_initio|ab initio]] di macromolecole, punto di riferimento per la predizione di strutture proteiche. Considerato l'intensivo sforzo di calcolo richiesto '''Rosetta''' viene distribuito anche come servizio online. * '''Licenza''': Commerciale, liberamente disponibile per uso accademico == ViennaRNA == * '''Sito''': https://www.tbi.univie.ac.at/RNA/ * '''Descrizione''': pacchetto di tools per la predizione e l'analisi di strutture secondarie di RNA. * '''Licenza''': FOSS == VMD == * '''Sito''': http://www.ks.uiuc.edu/Research/vmd/ * '''Descrizione''': viewer molecolare particolarmente versatile per la visualizzazione grafica di simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]] * '''Licenza''': Distribution specific <> = Ulteriori risorse online = * [[http://www.cathdb.info/|CATH]]: banca dati per la classificazione strutturale di domini proteici. * [[https://david.ncifcrf.gov/|DAVID]]: database di annotazioni funzionali su dati provenienti da [[https://it.wikipedia.org/wiki/Microarray_di_DNA|microarray]]. * [[https://www.ebi.ac.uk/|EMBL-EBI]]: portale dell'European Bioinformatics Institute, gestito dall'European Molecular Biology Laboratory. Tra i diversi servizi che offre citiamo: * [[https://www.ensembl.org/|Ensembl]]: browser genomico. * [[https://www.ebi.ac.uk/interpro/|InterPro]]: banca dati per la classificazione di famiglie di proteine. * [[https://www.ebi.ac.uk/Tools/msa/|MSA tools]]: tools online di allineamento multiplo di sequenze. * [[https://www.ebi.ac.uk/thornton-srv/databases/cgi-bin/pdbsum/GetPage.pl?pdbcode=index.html|PDBsum]]: database che colleziona informazioni e annotazioni su strutture 3D (file PDB). * [[https://www.embnet.org/wp/|EMBnet]]: l'European Molecular Biology network è una rete scientifica internazionale e un gruppo di interesse che mira a migliorare i servizi di bioinformatica riunendo competenze e capacità di bioinformatica. * [[https://www.embo.org/|EMBO]]: l'European Molecular Biology Organization è un'organizzazione che riunisce scienziati e ricercatori scientifici sulla base dell'"eccellenza nella ricerca" nell'area delle scienze biologiche e in particolare della biologia molecolare. * [[https://usegalaxy.org/|Galaxy]]: piattaforma integrata per l'analisi di dati genomici, offre numerosi tool da combinare in workflow customizzabili. * [[https://www.genecards.org|GeneCards]]: questo portale rappresenta il punto di partenza per reperire una grande quantità di informazioni e annotazioni sui geni umani. * [[https://www.genepattern.org/|GenePattern]]: piattaforma per l'analisi dell'espressione genica (RNA-seq and microarray), copy number variation, proteomica, citometria di flusso e network analysis. * [[http://geneontology.org/|Gene Ontology]]: progetto bioinformatico atto a unificare la descrizione delle caratteristiche dei prodotti dei geni in tutte le specie viventi attraverso lo sviluppo di un vocabolario controllato i cui termini sono interconnessi gli uni agli altri attraverso un grafo ad albero. * [[https://www.genome.jp/kegg/pathway.html|KEGG Pathway Database]]: database di pathway metabolici. * [[https://www.iedb.org/|Immune Epitope DataBase]]: database che raccoglie antigeni ed [[https://it.wikipedia.org/wiki/Epitopo|epitopi]] isolati e carratterizzati, contiene pure annotazioni di natura immunologica. * [[https://meme-suite.org/meme/|MEME]]: raccolta di tool online per individuare motivi e fare inferenza su sequenze amminoacidiche o di acidi nucleici che non risultano note da allineamenti. * [[https://www.ncbi.nlm.nih.gov/|NCBI]]: portale del National Center for Biotechnology Information, gestito dal National Institute of Health (NIH). Tra i diversi servizi che offre citiamo: * [[https://blast.ncbi.nlm.nih.gov/Blast.cgi|BLAST]]: metodi per l'[[https://it.wikipedia.org/wiki/Allineamento_di_sequenze|allineamento locale di sequenze]]. * [[https://www.ncbi.nlm.nih.gov/gene|(Entrez)Gene]]: banca dati di geni isolati e caratterizzati. * [[https://pubmed.ncbi.nlm.nih.gov/|PubMed]]: portale per la ricerca bibliografica di articoli scientifici peer reviewed. * [[https://www.ncbi.nlm.nih.gov/refseq/|RefSeq]]: banca dati di sequenze amminoacidiche risolte sperimentalmente. * [[https://www.nextflow.io/|Nextflow]]: piattaforma per gestire workflow e pipeline scientifiche usando software containers. * [[https://www.omim.org/|OMIM]]: banca dati sulle malattie ereditarie e disordini genetici. * [[https://www.pathwaycommons.org/|Pathway Commons]]: portale per la ricerca di pathways metabolici. * [[https://www.rcsb.org/|Protein Data Bank]]: repository di strutture 3D di macromolecole (proteine, acidi nucleici) risolte sperimentalmente. * [[https://predictioncenter.org/|Protein Structure Prediction Center]]: questo sito raccoglie i risultati dei CASP (Critical Assessment of protein Structure Prediction), un contest internazionale per la valutazione di metodi innovativi di predizione di strutture 3D. * [[https://reactome.org/|Reactome]]: database di pathway metabolici. * [[http://scop.mrc-lmb.cam.ac.uk/|SCOP]]: database per la classificazione strutturale delle proteine. * [[https://snakemake.readthedocs.io/en/stable/|Snakemake]]: sistema di gestione di workflow per creare analisi riproducibili e scalabili, sviluppato in Python. * [[https://string-db.org/|STRING]]: tool per l'analisi di network di interazioni proteina-proteina. * [[https://www.ibi.vu.nl/programs/sympredwww/|SYMPRED]]: metaserver che colleziona i risultati e restituisce un consensus dei principali metodi di predizione di struttura secondaria delle proteine. * [[https://taverna.incubator.apache.org/|Taverna]]: piattaforma per la progettazione e l'esecuzione di workflow. * [[https://www.proteinatlas.org/|The Human Protein Atlas]]: database utile per valutare dove e in che modo sono espresse le proteine umane, basato su dati di evidenze sperimentali. * [[https://genome-euro.ucsc.edu/cgi-bin/hgGateway|UCSC Genome Browser]]: browser genomico per visualizzare dove mappano i geni sui genomi di diversi organismi. * [[https://www.uniprot.org/uniprot|UniProtKB]]: repository di annotazioni funzionali di proteine (sperimentali e computazionali). * [[https://varsome.com/|Varsome]]: bancadati che raccoglie mutazioni e varianti genetiche umane. = Ulteriori risorse = * [[https://help.ubuntu.com/community/UbuntuScience/Biology|UbuntuScience/Biology]]: pagina con ulteriori voci sul wiki internazionale, dalla quale questa guida prende spunto. * [[https://en.wikipedia.org/wiki/Comparison_of_software_for_molecular_mechanics_modeling|Molecular mechanics]]: pagina di Wikipedia con i principali software, e relativo confronto, per calcoli di meccanica molecolare. ---- CategoryScienza