Wiki Ubuntu-it

Indice
Partecipa
FAQ
Wiki Blog
------------------
Ubuntu-it.org
Forum
Chiedi
Chat
Cerca
Planet
  • Pagina non alterabile
  • Informazioni
  • Allegati
  • Differenze per "Scienza/AppBiologia"
Differenze tra le versioni 48 e 86 (in 38 versioni)
Versione 48 del 11/03/2021 12.50.36
Dimensione: 11216
Commento:
Versione 86 del 16/09/2021 07.33.22
Dimensione: 17720
Commento: Ripristinata in attesa di chiarimenti
Le cancellazioni sono segnalate in questo modo. Le aggiunte sono segnalate in questo modo.
Linea 1: Linea 1:
## page was renamed from Scienza/AppChimicaBiologia
## page was renamed from ProveAppBiologia
Linea 10: Linea 12:
Questa pagina presenta una lista di software, librerie e pacchetti utilizzabili su Ubuntu utili nell'ambito della biologia. Divideremo i contenuti in due categorie principali: ''[[https://it.wikipedia.org/wiki/Bioinformatica|bioinformatica]]'' e ''[[https://it.wikipedia.org/wiki/Chimica_computazionale|chimica computazionale]]''. Nonostante sia una estrema semplificazione degli approcci informatici adottati in biologia, assumiamo per semplicità questi come i filoni principali di ricerca. Questa pagina presenta una lista di software, librerie e pacchetti utilizzabili su Ubuntu utili nell'ambito della biologia. I contenuti sono divisi in due categorie principali: [[https://it.wikipedia.org/wiki/Bioinformatica|bioinformatica]] e [[https://it.wikipedia.org/wiki/Chimica_computazionale|chimica computazionale]]. Nonostante sia una estrema semplificazione degli approcci informatici adottati in biologia, assumiamo per semplicità questi come i filoni principali di ricerca.
Linea 14: Linea 16:
== BBMap ==

 * '''Sito''': https://sourceforge.net/projects/bbmap/
 * '''Descrizione''': programma per l'allineamento di frammenti (reads) contro una sequenza di riferimento, supporta l'allineamento delle reads prodotte dai principali metodi di ''[[https://it.wikipedia.org/wiki/Next_Generation_Sequencing|sequenziamento di nuova generazione]]''.
 * '''Licenza''': Free
Linea 16: Linea 24:
 * '''Sito''': https://bioconda.github.io  * '''Sito''': https://bioconda.github.io/
Linea 23: Linea 31:
 * '''Descrizione''': BioconductoR è una collezione di librerie, pacchetti e dataframe sviluppati per ''[[https://it.wikipedia.org/wiki/R_(software)|R]]'' allo scopo di effettuare calcoli e analisi di dati in ambito ''[[https://it.wikipedia.org/wiki/-omica|omico]]'' (principalmente genomica e proteomica, ma non solo)  * '''Descrizione''': collezione di librerie, pacchetti e dataframe sviluppati per [[https://it.wikipedia.org/wiki/R_(software)|R]] allo scopo di effettuare calcoli e analisi di dati in ambito [[https://it.wikipedia.org/wiki/-omica|omico]] (principalmente genomica e proteomica, ma non solo).
Linea 26: Linea 34:
== BioPerl ==
 * '''Sito''': https://bioperl.org/
 * '''Descrizione''': repository di moduli per linguaggio Perl dedicati alla bioinformatica.
 * '''Licenza''': GNU Free Documentation License 1.2
Linea 29: Linea 42:
 * '''Descrizione''': Biopython è un insieme di tool di programmazione sviluppati in Python. È un progetto collaborativo distribuito per sviluppare librerie e applicazioni Python che soddisfino le esigenze del lavoro del bioinformatico.
 * '''Licenza''': il cpdice sorgente viene distribuito con licenza ''[[https://github.com/biopython/biopython/blob/master/LICENSE.rst|Biopython License]]''
 * '''Descrizione''': insieme di tool di programmazione sviluppati in Python. È un progetto collaborativo distribuito per sviluppare librerie e applicazioni Python che soddisfino le esigenze del lavoro del bioinformatico.
 * '''Licenza''': il cpdice sorgente viene distribuito con licenza [[https://github.com/biopython/biopython/blob/master/LICENSE.rst|Biopython License]]

== Bowtie ==

 * '''Sito''': http://bowtie-bio.sourceforge.net/index.shtml
 * '''Descrizione''': pacchetto software comunemente utilizzato per l'allineamento di frammenti (provenienti da metodi di sequenziamento) contro assembly genomici di riferimento.
 * '''Licenza''': Artistic License 2.0
Linea 35: Linea 54:
 * '''Descrizione''': Cytoscape è una piattaforma open source per la visualizzazione di network di interazioni molecolari e ''[[https://en.wikipedia.org/wiki/Biological_pathway|pathways biologici]]''. Consente di integrare i network con annotazioni funzionali (ad esempio ''[[https://it.wikipedia.org/wiki/Gene_Ontology|Gene Ontology]]''), profili di espressione genica e molto altro.  * '''Descrizione''': piattaforma open source per la visualizzazione di network di interazioni molecolari e [[https://en.wikipedia.org/wiki/Biological_pathway|pathways biologici]]. Consente di integrare i network con annotazioni funzionali (ad esempio [[https://it.wikipedia.org/wiki/Gene_Ontology|Gene Ontology]]), profili di espressione genica e molto altro.
Linea 38: Linea 57:
== FastQC ==

 * '''Sito''': https://www.bioinformatics.babraham.ac.uk/projects/fastqc/
 * '''Descrizione''': tool per il controllo qualità di raw data provenienti da pipeline di sequenziamento high throughput.
 * '''Licenza''': GNU GPL v3

== GATK ==
 * '''Sito''': https://gatk.broadinstitute.org/hc/en-us
 * '''Descrizione''': suite di strumenti per analisi genomiche e caratterizzazione di varianti a partire da dataset di sequenziamento.
 * '''Licenza''': Apache 2.0

== HMMER ==

 * '''Sito''': http://hmmer.org/
 * '''Descrizione''': programma di allineamento di sequenze per la ricerca di sequenze omologhe, l'algoritmo si basa sul ''[[https://it.wikipedia.org/wiki/Modello_di_Markov_nascosto|modello di Markov nascosto]]''.
 * '''Licenza''': BSD-3

== ImageJ ==

 * '''Sito''': https://imagej.net/Welcome
 * '''Descrizione''': software per la rielaborazione analitica di immagini acquisite da strumenti di laboratorio (microscopia, fluorescenza, etc.).
 * '''Licenza''': BSD-2
Linea 41: Linea 83:
 * '''Descrizione''': Piattaforma per l’analisi di dati di proteomica quantitativa, in particolare MaxQuant è disegnato specificamente per l’analisi di dataset da spettrometria di massa.  * '''Descrizione''': piattaforma per l’analisi di dati di proteomica quantitativa, in particolare !MaxQuant è disegnato specificamente per l’analisi di dataset da spettrometria di massa.
Linea 47: Linea 89:
 * '''Descrizione''': tool per ''[[https://en.wikipedia.org/wiki/Multiple_sequence_alignment|allineamento multiplo]]'' di sequenze. Questo software è particolarmente indicato per eseguire allineamenti strutturali con strutture 3D.  * '''Descrizione''': tool per [[https://en.wikipedia.org/wiki/Multiple_sequence_alignment|allineamento multiplo]] di sequenze. Questo software è particolarmente indicato per eseguire allineamenti strutturali con strutture 3D.
Linea 53: Linea 95:
 * '''Descrizione''': pacchetto di programmi per inferire alberi evolutivi e fare analisi ''[[https://it.wikipedia.org/wiki/Filogenesi|filogenetiche]]''.  * '''Descrizione''': pacchetto di programmi per inferire alberi evolutivi e fare analisi [[https://it.wikipedia.org/wiki/Filogenesi|filogenetiche]].
Linea 56: Linea 98:
== Prokka ==
 * '''Sito''': https://vicbioinformatics.com/software.prokka.shtml
 * '''Descrizione''': software per l'annotazione di genomi virali e batterici.
 * '''Licenza''': GNU GPL v2

== psort ==
 * '''Sito''': http://psort.org/
 * '''Descrizione''': famiglia di programmi per la predizione della localizzazione subcellulare di proteine.
 * '''Licenza''': FOSS
Linea 59: Linea 111:
 * '''Descrizione''': Semplice editor per la manipolazione di allineamenti multipli.  * '''Descrizione''': semplice editor per la manipolazione di allineamenti multipli.
Linea 65: Linea 117:
 * '''Descrizione''': piattaforma integrata tool per ''[[https://en.wikipedia.org/wiki/Multiple_sequence_alignment|allineamento multiplo]]'' di sequenze. Questp software è noto per le sue performance, permette di usare anche profili di ''[[https://it.wikipedia.org/wiki/Struttura_secondaria|struttura secondaria]]''.
 * '''Licenza''': GNU GPL, Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License
 * '''Descrizione''': piattaforma integrata tool per [[https://en.wikipedia.org/wiki/Multiple_sequence_alignment|allineamento multiplo]] di sequenze. Questo software è noto per le sue performance, permette di usare anche profili di [[https://it.wikipedia.org/wiki/Struttura_secondaria|struttura secondaria]].
 * '''Licenza''': GNU GPL, Creative Commons Attribution-!NonCommercial-!ShareAlike 3.0 Unported License
Linea 71: Linea 123:
 * '''Descrizione''': piattaforma integrata per l'analisi di dati biologici come sequenze, annotazioni, allineamenti multipli, alberi filogenetici, ''[[https://en.wikipedia.org/wiki/Sequencing|assembly NGS]]'' e molto altro.  * '''Descrizione''': piattaforma integrata per l'analisi di dati biologici come sequenze, annotazioni, allineamenti multipli, alberi filogenetici, [[https://en.wikipedia.org/wiki/Sequencing|assembly NGS]] e molto altro.
Linea 79: Linea 131:
 * '''Descrizione''': software per simulazioni di ''[[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]]'', molto impiegato per la robustezza e l’affidabilità dei ''[[https://it.wikipedia.org/wiki/Force_field|force field]]'' che implementa.
 * '''Licenza''': il core principale di AMBER viene rilasciato sotto licenza proprietaria, i tool di analisi e sviluppo (''AMBERTools'') vengono rilasciati con licenze GPL o FOSS
 * '''Descrizione''': software per simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]], molto impiegato per la robustezza e l’affidabilità dei [[https://it.wikipedia.org/wiki/Force_field|force field]] che implementa.
 * '''Licenza''': il core principale di AMBER viene rilasciato sotto licenza proprietaria, i tool di analisi e sviluppo (''AMBERTools'') vengono rilasciati con licenze GPL o FOSS.
Linea 85: Linea 137:
 * '''Descrizione''': suite di tool per eseguire calcoli di ''[[https://it.wikipedia.org/wiki/Docking_(chimica)|docking]]'', predice pose strutturali su come piccole molecole possano legarsi a recettori la cui struttura 3D è nota sperimentalmente.
 * '''Licenza''':  GNU General Public License, Licenza Apache
 * '''Descrizione''': suite di tool per eseguire calcoli di [[https://it.wikipedia.org/wiki/Docking_(chimica)|docking]], predice pose strutturali su come piccole molecole possano legarsi a recettori la cui struttura 3D è nota sperimentalmente.
 * '''Licenza''': GNU General Public License, Licenza Apache

== Bioblender ==

 * '''Sito''': http://www.bioblender.org/
 * '''Descrizione''': estensione di '''Blender''' per la visualizzazione e il rendering di biomolecole.
 * '''Licenza''': GNU GPL
Linea 91: Linea 149:
 * '''Descrizione''': il Collaborative Computational Project Number 4 (ccp4) è un progetto istituito nel 1979 per supportare la collaborazione tra ricercatori che lavorano nello sviluppo di software e assemblare una raccolta completa di software per la biologia strutturale. Esiste un progetto derivato (Collaborative Computational Project for Electron cryo-Microscopy - ''[[https://www.ccpem.ac.uk|ccp-em]]'') dedicato alla ''[[https://it.wikipedia.org/wiki/Microscopia_crioelettronica|microscopia crioelettronica]]''.
 * '''Licenza''': (credo dipenda dai singoli pacchetti della raccolta)
 * '''Descrizione''': il ''Collaborative Computational Project Number 4'' ('''ccp4''') è un progetto istituito nel 1979 per supportare la collaborazione tra ricercatori che lavorano nello sviluppo di software e assemblare una raccolta completa di software per la biologia strutturale. Esiste un progetto derivato (''Collaborative Computational Project for Electron cryo-Microscopy'' - [[https://www.ccpem.ac.uk|ccp-em]]) dedicato alla [[https://it.wikipedia.org/wiki/Microscopia_crioelettronica|microscopia crioelettronica]].
 * '''Licenza''': dipenda dai singoli pacchetti della raccolta.
Linea 103: Linea 161:
 * '''Descrizione''': software per simulazioni di ''[[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]]'', molto utile per i numerosi tool di analisi post-produzione che offre.  * '''Descrizione''': software per simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]], molto utile per i numerosi tool di analisi post-produzione che offre.
Linea 109: Linea 167:
 * '''Descrizione''': Software per la creazione di modelli strutturali di proteine usando l’approccio del ''[[https://en.wikipedia.org/wiki/Homology_modeling|homology modeling]]''  * '''Descrizione''': Software per la creazione di modelli strutturali di proteine usando l’approccio del [[https://en.wikipedia.org/wiki/Homology_modeling|homology modeling]]
Linea 115: Linea 173:
 * '''Descrizione''': software per simulazioni di ''[[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]]'', particolarmente adatto per simulazioni avanzate di meta-dinamica (ad esempio ''[[https://www.ks.uiuc.edu/Research/namd/2.9/ug/node63.html|Accelerated Molecular Dynamics]]'')  * '''Descrizione''': software per simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]], particolarmente adatto per simulazioni avanzate di meta-dinamica (ad esempio [[https://www.ks.uiuc.edu/Research/namd/2.9/ug/node63.html|Accelerated Molecular Dynamics]]).
Linea 127: Linea 185:
 * '''Descrizione''': viewer molecolare di alto livello, ideale per la produzione di materiale da pubblicare o presentare
{{{#!wiki important
 * '''Licenza''': la versione attuale di PyMOL è chiusa e a pagamento rilasciata da Schrodinger, esistono ''[[https://it.wikipedia.org/wiki/PyMOL|progetti open e free]]'' ma mi sembra riguardino versioni vecchie e non so se sono ancora mantenuti
 * '''Descrizione''': viewer molecolare di alto livello, ideale per la produzione di materiale da pubblicare o presentare.
 * '''Licenza''': la versione attuale di '''PyMOL''' è chiusa e a pagamento rilasciata da Schrodinger.
 
{{{#!wiki important
Esistono [[https://it.wikipedia.org/wiki/PyMOL|progetti open e free]] ma potrebbero riguardare vecchie versioni forse non più mantenute.
Linea 131: Linea 190:

== Quantum ESPRESSO ==

 * '''Sito''': https://www.quantum-espresso.org/
 * '''Descrizione''': suite per i calcoli della struttura elettronica la modellazione di materiali, si basa sulla teoria del funzionale della densità ([[https://it.wikipedia.org/wiki/Teoria_del_funzionale_della_densit%C3%A0|DFT]]).
 * '''Licenza''': GNU GPL
Linea 134: Linea 199:
 * '''Descrizione''': software per la modellazione ''[[https://it.wikipedia.org/wiki/Metodo_ab_initio|ab initio]]'' di macromolecole, punto di riferimento per la predizione di strutture proteiche. Considerato l'intensivo sforzo di calcolo richiesto Rosetta viene distribuito anche come servizio online.  * '''Descrizione''': software per la modellazione [[https://it.wikipedia.org/wiki/Metodo_ab_initio|ab initio]] di macromolecole, punto di riferimento per la predizione di strutture proteiche. Considerato l'intensivo sforzo di calcolo richiesto '''Rosetta''' viene distribuito anche come servizio online.
Linea 137: Linea 202:
== Quantum ESPRESSO ==

 * '''Sito''': https://www.quantum-espresso.org/
 * '''Descrizione''': suite per i calcoli della struttura elettronica la modellazione di materiali, si basa sulla teoria del funzionale della densità (''[[https://it.wikipedia.org/wiki/Teoria_del_funzionale_della_densit%C3%A0|DFT]]'')
 * '''Licenza''': GNU GPL
== ViennaRNA ==

 * '''Sito''': https://www.tbi.univie.ac.at/RNA/
 * '''Descrizione''': pacchetto di tools per la predizione e l'analisi di strutture secondarie di RNA.
 * '''Licenza''': FOSS
Linea 146: Linea 211:
 * '''Descrizione''': viewer molecolare particolarmente versatile per la visualizzazione grafica di simulazioni di ''[[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]]''  * '''Descrizione''': viewer molecolare particolarmente versatile per la visualizzazione grafica di simulazioni di [[https://it.wikipedia.org/wiki/Dinamica_molecolare|dinamica molecolare]]
Linea 149: Linea 214:
Linea 152: Linea 216:
 * '''[[https://blast.ncbi.nlm.nih.gov/Blast.cgi|BLAST]]''' : servizi per l' ''[[https://it.wikipedia.org/wiki/Allineamento_di_sequenze|allineamento locale di sequenze]]'' offerto dall'NIH

 * '''[[https://www.ensembl.org/|Ensembl]]''' : browser genomico hostato dall'EMBL (European Molecular Biology Laboratory)

 * '''[[https://usegalaxy.org/|Galaxy]]''' : piattaforma integrata per l'analisi di dati genomici, offre numerosi tool da combinare in workflow customizzabili

 * '''[[https://www.genepattern.org/|GenePattern]]''' : piattaforma per l'analisi dell'espressione genica (RNA-seq and microarray), copy number variation, proteomica, citometria di flusso e network analysis.

 * '''[[https://www.genome.jp/kegg/pathway.html|KEGG Pathway Database]]''' : database di pathway metabolici

 * '''[[https://www.ebi.ac.uk/Tools/msa/|MSA tools]]''' : tools online di allineamento multiplo di sequenze, hostato dall'EMBL (European Molecular Biology Laboratory)

 * '''[[https://reactome.org/|Reactome]]''' : database di pathway metabolici

 * '''[[https://pandas.pydata.org/|pandas]]''' : libreria software scritta per il linguaggio di programmazione Python per la manipolazione e l'analisi dei dati.

 * '''[[https://www.rcsb.org/|Protein Data Bank]]''' : repository di strutture 3D di macromolecole (proteine, acidi nucleici) risolte sperimentalmente

 * '''[[https://pubmed.ncbi.nlm.nih.gov/|PubMed]]''' : portale per la ricerca bibliografica di articoli scientifici peer reviewed

 * '''[[https://taverna.incubator.apache.org/|Taverna]]''' : piattaforma per la progettazione e l'esecuzione di workflow

 * '''[[https://genome-euro.ucsc.edu/cgi-bin/hgGateway|UCSC Genome Browser]]''' : browser genomico per visualizzare dove mappano i geni sui genomi di diversi organismi

 * '''[[https://www.uniprot.org/uniprot|UniProtKB]]''' : repository di annotazioni funzionali di proteine(sperimentali e computazionali)

= Revisione richiesta =
{{{#!wiki tip
Esiste la wiki ''[[https://help.ubuntu.com/community/UbuntuScience/Biology|UbuntuScience.Biology]]'' con diverse altre risorse da visionare...
}}}
 * [[http://www.cathdb.info/|CATH]]: banca dati per la classificazione strutturale di domini proteici.
 * [[https://david.ncifcrf.gov/|DAVID]]: database di annotazioni funzionali su dati provenienti da [[https://it.wikipedia.org/wiki/Microarray_di_DNA|microarray]].
 * [[https://www.ebi.ac.uk/|EMBL-EBI]]: portale dell'European Bioinformatics Institute, gestito dall'European Molecular Biology Laboratory. Tra i diversi servizi che offre citiamo:
   * [[https://www.ensembl.org/|Ensembl]]: browser genomico.
   * [[https://www.ebi.ac.uk/interpro/|InterPro]]: banca dati per la classificazione di famiglie di proteine.
   * [[https://www.ebi.ac.uk/Tools/msa/|MSA tools]]: tools online di allineamento multiplo di sequenze.
   * [[https://www.ebi.ac.uk/thornton-srv/databases/cgi-bin/pdbsum/GetPage.pl?pdbcode=index.html|PDBsum]]: database che colleziona informazioni e annotazioni su strutture 3D (file PDB).
 * [[https://www.embnet.org/wp/|EMBnet]]: l'European Molecular Biology network è una rete scientifica internazionale e un gruppo di interesse che mira a migliorare i servizi di bioinformatica riunendo competenze e capacità di bioinformatica.
 * [[https://www.embo.org/|EMBO]]: l'European Molecular Biology Organization è un'organizzazione che riunisce scienziati e ricercatori scientifici sulla base dell'"eccellenza nella ricerca" nell'area delle scienze biologiche e in particolare della biologia molecolare.
 * [[https://usegalaxy.org/|Galaxy]]: piattaforma integrata per l'analisi di dati genomici, offre numerosi tool da combinare in workflow customizzabili.
 * [[https://www.genecards.org|GeneCards]]: questo portale rappresenta il punto di partenza per reperire una grande quantità di informazioni e annotazioni sui geni umani.
 * [[https://www.genepattern.org/|GenePattern]]: piattaforma per l'analisi dell'espressione genica (RNA-seq and microarray), copy number variation, proteomica, citometria di flusso e network analysis.
 * [[http://geneontology.org/|Gene Ontology]]: progetto bioinformatico atto a unificare la descrizione delle caratteristiche dei prodotti dei geni in tutte le specie viventi attraverso lo sviluppo di un vocabolario controllato i cui termini sono interconnessi gli uni agli altri attraverso un grafo ad albero.
 * [[https://www.genome.jp/kegg/pathway.html|KEGG Pathway Database]]: database di pathway metabolici.
 * [[https://www.iedb.org/|Immune Epitope DataBase]]: database che raccoglie antigeni ed [[https://it.wikipedia.org/wiki/Epitopo|epitopi]] isolati e carratterizzati, contiene pure annotazioni di natura immunologica.
 * [[https://meme-suite.org/meme/|MEME]]: raccolta di tool online per individuare motivi e fare inferenza su sequenze amminoacidiche o di acidi nucleici che non risultano note da allineamenti.
 * [[https://www.ncbi.nlm.nih.gov/|NCBI]]: portale del National Center for Biotechnology Information, gestito dal National Institute of Health (NIH). Tra i diversi servizi che offre citiamo:
   * [[https://blast.ncbi.nlm.nih.gov/Blast.cgi|BLAST]]: metodi per l'[[https://it.wikipedia.org/wiki/Allineamento_di_sequenze|allineamento locale di sequenze]].
   * [[https://www.ncbi.nlm.nih.gov/gene|(Entrez)Gene]]: banca dati di geni isolati e caratterizzati.
   * [[https://pubmed.ncbi.nlm.nih.gov/|PubMed]]: portale per la ricerca bibliografica di articoli scientifici peer reviewed.
   * [[https://www.ncbi.nlm.nih.gov/refseq/|RefSeq]]: banca dati di sequenze amminoacidiche risolte sperimentalmente.
 * [[https://www.nextflow.io/|Nextflow]]: piattaforma per gestire workflow e pipeline scientifiche usando software containers.
 * [[https://www.omim.org/|OMIM]]: banca dati sulle malattie ereditarie e disordini genetici.
 * [[https://www.pathwaycommons.org/|Pathway Commons]]: portale per la ricerca di pathways metabolici.
 * [[https://www.rcsb.org/|Protein Data Bank]]: repository di strutture 3D di macromolecole (proteine, acidi nucleici) risolte sperimentalmente.
 * [[https://predictioncenter.org/|Protein Structure Prediction Center]]: questo sito raccoglie i risultati dei CASP (Critical Assessment of protein Structure Prediction), un contest internazionale per la valutazione di metodi innovativi di predizione di strutture 3D.
 * [[https://reactome.org/|Reactome]]: database di pathway metabolici.
 * [[http://scop.mrc-lmb.cam.ac.uk/|SCOP]]: database per la classificazione strutturale delle proteine.
 * [[https://snakemake.readthedocs.io/en/stable/|Snakemake]]: sistema di gestione di workflow per creare analisi riproducibili e scalabili, sviluppato in Python.
 * [[https://string-db.org/|STRING]]: tool per l'analisi di network di interazioni proteina-proteina.
 * [[https://www.ibi.vu.nl/programs/sympredwww/|SYMPRED]]: metaserver che colleziona i risultati e restituisce un consensus dei principali metodi di predizione di struttura secondaria delle proteine.
 * [[https://taverna.incubator.apache.org/|Taverna]]: piattaforma per la progettazione e l'esecuzione di workflow.
 * [[https://www.proteinatlas.org/|The Human Protein Atlas]]: database utile per valutare dove e in che modo sono espresse le proteine umane, basato su dati di evidenze sperimentali.
 * [[https://genome-euro.ucsc.edu/cgi-bin/hgGateway|UCSC Genome Browser]]: browser genomico per visualizzare dove mappano i geni sui genomi di diversi organismi.
 * [[https://www.uniprot.org/uniprot|UniProtKB]]: repository di annotazioni funzionali di proteine (sperimentali e computazionali).
 * [[https://varsome.com/|Varsome]]: bancadati che raccoglie mutazioni e varianti genetiche umane.

= Ulteriori risorse =

 * [[https://help.ubuntu.com/community/UbuntuScience/Biology|UbuntuScience/Biology]]: pagina con ulteriori voci sul wiki internazionale, dalla quale questa guida prende spunto.

 * [[https://en.wikipedia.org/wiki/Comparison_of_software_for_molecular_mechanics_modeling|Molecular mechanics]]: pagina di Wikipedia con i principali software, e relativo confronto, per calcoli di meccanica molecolare.
Linea 183: Linea 260:
CategoryHomepage CategoryScienza


Problemi in questa pagina? Segnalali in questa discussione

Introduzione

Questa pagina presenta una lista di software, librerie e pacchetti utilizzabili su Ubuntu utili nell'ambito della biologia. I contenuti sono divisi in due categorie principali: bioinformatica e chimica computazionale. Nonostante sia una estrema semplificazione degli approcci informatici adottati in biologia, assumiamo per semplicità questi come i filoni principali di ricerca.

Bioinformatica

BBMap

BioConda

  • Sito: https://bioconda.github.io/

  • Descrizione: Bioconda è un repository di software per la bioinformatica distribuito sul package manager Conda.

  • Licenza: MIT License (più licenze specifiche per i singoli pacchetti)

BioconductoR

  • Sito: https://www.bioconductor.org/

  • Descrizione: collezione di librerie, pacchetti e dataframe sviluppati per R allo scopo di effettuare calcoli e analisi di dati in ambito omico (principalmente genomica e proteomica, ma non solo).

  • Licenza: Artistic License 2.0

BioPerl

  • Sito: https://bioperl.org/

  • Descrizione: repository di moduli per linguaggio Perl dedicati alla bioinformatica.

  • Licenza: GNU Free Documentation License 1.2

Biopython

  • Sito: https://biopython.org/

  • Descrizione: insieme di tool di programmazione sviluppati in Python. È un progetto collaborativo distribuito per sviluppare librerie e applicazioni Python che soddisfino le esigenze del lavoro del bioinformatico.

  • Licenza: il cpdice sorgente viene distribuito con licenza Biopython License

Bowtie

  • Sito: http://bowtie-bio.sourceforge.net/index.shtml

  • Descrizione: pacchetto software comunemente utilizzato per l'allineamento di frammenti (provenienti da metodi di sequenziamento) contro assembly genomici di riferimento.

  • Licenza: Artistic License 2.0

CytoScape

  • Sito: https://cytoscape.org/

  • Descrizione: piattaforma open source per la visualizzazione di network di interazioni molecolari e pathways biologici. Consente di integrare i network con annotazioni funzionali (ad esempio Gene Ontology), profili di espressione genica e molto altro.

  • Licenza: GNU LGPL (Lesser General Public License)

FastQC

GATK

HMMER

ImageJ

  • Sito: https://imagej.net/Welcome

  • Descrizione: software per la rielaborazione analitica di immagini acquisite da strumenti di laboratorio (microscopia, fluorescenza, etc.).

  • Licenza: BSD-2

MaxQuant/Perseus

  • Sito: https://maxquant.net/

  • Descrizione: piattaforma per l’analisi di dati di proteomica quantitativa, in particolare MaxQuant è disegnato specificamente per l’analisi di dataset da spettrometria di massa.

  • Licenza: Freeware

Muscle

PHYLIP

Prokka

psort

  • Sito: http://psort.org/

  • Descrizione: famiglia di programmi per la predizione della localizzazione subcellulare di proteine.

  • Licenza: FOSS

Seaview

T-Coffee

UGENE

  • Sito: http://ugene.net/

  • Descrizione: piattaforma integrata per l'analisi di dati biologici come sequenze, annotazioni, allineamenti multipli, alberi filogenetici, assembly NGS e molto altro.

  • Licenza: GNU GPL v2.0

Chimica Computazionale

AMBER

  • Sito: https://ambermd.org

  • Descrizione: software per simulazioni di dinamica molecolare, molto impiegato per la robustezza e l’affidabilità dei force field che implementa.

  • Licenza: il core principale di AMBER viene rilasciato sotto licenza proprietaria, i tool di analisi e sviluppo (AMBERTools) vengono rilasciati con licenze GPL o FOSS.

AutoDock

  • Sito: http://autodock.scripps.edu/

  • Descrizione: suite di tool per eseguire calcoli di docking, predice pose strutturali su come piccole molecole possano legarsi a recettori la cui struttura 3D è nota sperimentalmente.

  • Licenza: GNU General Public License, Licenza Apache

Bioblender

  • Sito: http://www.bioblender.org/

  • Descrizione: estensione di Blender per la visualizzazione e il rendering di biomolecole.

  • Licenza: GNU GPL

ccp4

  • Sito: https://www.ccp4.ac.uk/

  • Descrizione: il Collaborative Computational Project Number 4 (ccp4) è un progetto istituito nel 1979 per supportare la collaborazione tra ricercatori che lavorano nello sviluppo di software e assemblare una raccolta completa di software per la biologia strutturale. Esiste un progetto derivato (Collaborative Computational Project for Electron cryo-Microscopy - ccp-em) dedicato alla microscopia crioelettronica.

  • Licenza: dipenda dai singoli pacchetti della raccolta.

Chimera

  • Sito: https://www.cgl.ucsf.edu/chimera/

  • Descrizione: software per la visualizzazione e l'analisi interattiva di strutture molecolari e dati correlati, tra cui mappe di densità, complessi supramolecolari, allineamenti di sequenze, risultati di docking, traiettorie e ensemble conformazionali.

  • Licenza: Free per uso non commerciale

GROMACS

  • Sito: https://www.gromacs.org/

  • Descrizione: software per simulazioni di dinamica molecolare, molto utile per i numerosi tool di analisi post-produzione che offre.

  • Licenza: GNU Lesser General Public License (LGPL), version 2.1

Modeller

  • Sito: https://salilab.org/modeller/

  • Descrizione: Software per la creazione di modelli strutturali di proteine usando l’approccio del homology modeling

  • Licenza: Software proprietario: academic nonprofit freeware, Software commerciale

NAMD

Open Babel

PyMOL

  • Sito: https://pymol.org/

  • Descrizione: viewer molecolare di alto livello, ideale per la produzione di materiale da pubblicare o presentare.

  • Licenza: la versione attuale di PyMOL è chiusa e a pagamento rilasciata da Schrodinger.

    Esistono progetti open e free ma potrebbero riguardare vecchie versioni forse non più mantenute.

Quantum ESPRESSO

  • Sito: https://www.quantum-espresso.org/

  • Descrizione: suite per i calcoli della struttura elettronica la modellazione di materiali, si basa sulla teoria del funzionale della densità (DFT).

  • Licenza: GNU GPL

Rosetta

  • Sito: https://www.rosettacommons.org/

  • Descrizione: software per la modellazione ab initio di macromolecole, punto di riferimento per la predizione di strutture proteiche. Considerato l'intensivo sforzo di calcolo richiesto Rosetta viene distribuito anche come servizio online.

  • Licenza: Commerciale, liberamente disponibile per uso accademico

ViennaRNA

VMD

Ulteriori risorse online

  • CATH: banca dati per la classificazione strutturale di domini proteici.

  • DAVID: database di annotazioni funzionali su dati provenienti da microarray.

  • EMBL-EBI: portale dell'European Bioinformatics Institute, gestito dall'European Molecular Biology Laboratory. Tra i diversi servizi che offre citiamo:

    • Ensembl: browser genomico.

    • InterPro: banca dati per la classificazione di famiglie di proteine.

    • MSA tools: tools online di allineamento multiplo di sequenze.

    • PDBsum: database che colleziona informazioni e annotazioni su strutture 3D (file PDB).

  • EMBnet: l'European Molecular Biology network è una rete scientifica internazionale e un gruppo di interesse che mira a migliorare i servizi di bioinformatica riunendo competenze e capacità di bioinformatica.

  • EMBO: l'European Molecular Biology Organization è un'organizzazione che riunisce scienziati e ricercatori scientifici sulla base dell'"eccellenza nella ricerca" nell'area delle scienze biologiche e in particolare della biologia molecolare.

  • Galaxy: piattaforma integrata per l'analisi di dati genomici, offre numerosi tool da combinare in workflow customizzabili.

  • GeneCards: questo portale rappresenta il punto di partenza per reperire una grande quantità di informazioni e annotazioni sui geni umani.

  • GenePattern: piattaforma per l'analisi dell'espressione genica (RNA-seq and microarray), copy number variation, proteomica, citometria di flusso e network analysis.

  • Gene Ontology: progetto bioinformatico atto a unificare la descrizione delle caratteristiche dei prodotti dei geni in tutte le specie viventi attraverso lo sviluppo di un vocabolario controllato i cui termini sono interconnessi gli uni agli altri attraverso un grafo ad albero.

  • KEGG Pathway Database: database di pathway metabolici.

  • Immune Epitope DataBase: database che raccoglie antigeni ed epitopi isolati e carratterizzati, contiene pure annotazioni di natura immunologica.

  • MEME: raccolta di tool online per individuare motivi e fare inferenza su sequenze amminoacidiche o di acidi nucleici che non risultano note da allineamenti.

  • NCBI: portale del National Center for Biotechnology Information, gestito dal National Institute of Health (NIH). Tra i diversi servizi che offre citiamo:

  • Nextflow: piattaforma per gestire workflow e pipeline scientifiche usando software containers.

  • OMIM: banca dati sulle malattie ereditarie e disordini genetici.

  • Pathway Commons: portale per la ricerca di pathways metabolici.

  • Protein Data Bank: repository di strutture 3D di macromolecole (proteine, acidi nucleici) risolte sperimentalmente.

  • Protein Structure Prediction Center: questo sito raccoglie i risultati dei CASP (Critical Assessment of protein Structure Prediction), un contest internazionale per la valutazione di metodi innovativi di predizione di strutture 3D.

  • Reactome: database di pathway metabolici.

  • SCOP: database per la classificazione strutturale delle proteine.

  • Snakemake: sistema di gestione di workflow per creare analisi riproducibili e scalabili, sviluppato in Python.

  • STRING: tool per l'analisi di network di interazioni proteina-proteina.

  • SYMPRED: metaserver che colleziona i risultati e restituisce un consensus dei principali metodi di predizione di struttura secondaria delle proteine.

  • Taverna: piattaforma per la progettazione e l'esecuzione di workflow.

  • The Human Protein Atlas: database utile per valutare dove e in che modo sono espresse le proteine umane, basato su dati di evidenze sperimentali.

  • UCSC Genome Browser: browser genomico per visualizzare dove mappano i geni sui genomi di diversi organismi.

  • UniProtKB: repository di annotazioni funzionali di proteine (sperimentali e computazionali).

  • Varsome: bancadati che raccoglie mutazioni e varianti genetiche umane.

Ulteriori risorse

  • UbuntuScience/Biology: pagina con ulteriori voci sul wiki internazionale, dalla quale questa guida prende spunto.

  • Molecular mechanics: pagina di Wikipedia con i principali software, e relativo confronto, per calcoli di meccanica molecolare.


CategoryScienza