Χρονογραμμή Βιοπληροφορικής

  • Margaret Dayhoff: Η πρώτη βιοπληροφορικός

    Margaret Dayhoff: Η πρώτη βιοπληροφορικός
    Η Margaret Dayhoff (1925–1983) ήταν Αμερικανίδα φυσικοχημικός που πρωτοστάτησε στην εφαρμογή υπολογιστικών μεθόδων στον τομέα της βιοχημείας. Αφιέρωσε την καριέρα της στην εφαρμογή των εξελισσόμενων υπολογιστικών τεχνολογιών για την υποστήριξη της προόδου στη βιολογία και την ιατρική, κυρίως τη δημιουργία βάσεων δεδομένων πρωτεϊνών και νουκλεϊκών οξέων και εργαλείων για την ανάκριση των βάσεων δεδομένων.
  • Η ανακάλυψη της δομής του DNA

    Η ανακάλυψη της δομής του DNA
    Η ανακάλυψη της διπλής έλικας του DNA είναι η μεγαλύτερη βιολογική ανακάλυψη του 20ού αιώνα. Έγινε το 1953 και ήταν το αποτέλεσμα της ερευνητικής εργασίας δύο ομάδων επιστημόνων: των Wilkins και Franklin καθώς και των Watson και Crick. Στηριζόμενοι στο σύνολο των αποτελεσμάτων των δύο ομάδων οι Watson και Crick διατύπωσαν το μοντέλο της διπλής έλικας του DNA, που αναφέρεται στη δομή του DNA στο χώρο.
  • Δυναμικός Προγραμματισμός

    Δυναμικός Προγραμματισμός
    O αλγόριθμος δυναμικού προγραμματισμού αποτελεί μια μέθοδο επίλυσης σύνθετων προβλημάτων χωρίζοντάς τα σε μικρότερα προβλήματα, τα οποία δεν είναι ανεξάρτητα το ένα από το άλλο και σταδιακά επιλύονται τα μεγαλύτερα ως σύνθεση των απλούστερων. Ανακαλύφθηκε από τον Αμερικανό μαθηματικό Richard Ε. Bellman (1920 – 1984). Είναι ιδιαίτερα χρήσιμος για την επίλυση προβλημάτων της Bιοπληροφορικής. Χρησιμοποιείται κυρίως, για να συναγάγει τη λειτουργία ομόλογων πρωτεϊνών με άλλες πρωτεΐνες.
  • Η πρώτη αυτοματοποιημένη αλληλουχία

    Η πρώτη αυτοματοποιημένη αλληλουχία
    H αυτοματοποιημένη αλληλουχία πεπτιδίων Edman προέκυψε ως μια απλή μέθοδος που επέτρεπε τον προσδιορισμό της αλληλουχίας των πρωτεϊνών, ένα αμινοξύ τη φορά ξεκινώντας από το Ν-άκρο. Σε συνδυασμό με την αυτοματοποίηση, προσδιορίστηκαν η αλληλουχία για περισσότερες από 15 διαφορετικές οικογένειες πρωτεϊνών τα επόμενα 10 χρόνια.
  • COMPROTEIN

    COMPROTEIN
    Το πρώτο λογισμικό βιοπληροφορικής. Αναπτύχθηκε από συναργασία των Margaret Dayhoff και Robert S. Ledley. Είναι ένα πλήρες πρόγραμμα υπολογιστή για το IBM 7090 σχεδιασμένο για τον προσδιορισμό της πρωτεϊνικής δομής χρησιμοποιώντας δεδομένα αλληλουχίας πεπτιδίων Edman. Αυτό το λογισμικό, εξ ολοκλήρου κωδικοποιημένο σε FORTRAN σε κάρτες διάτρησης.
  • Atlas of Protein Sequence and Structure

    O “Άτλας της αλληλουχίας και της δομής των πρωτεϊνών” (Atlas of Protein Sequence and Structure) αποτελεί τη πρώτη βάση δεδομένων της πολυπεπτιδικής αλυσίδας τωνπρωτεϊνών. Δημιουργήθηκε από την Αμερικανίδα φυσικοχημικός Margaret Dayhoff.
  • Ολική Στοίχιση (Αλγόριθμος Needleman & Wunsch)

    Ολική Στοίχιση (Αλγόριθμος Needleman & Wunsch)
    Η ολική στοίχιση δυο αλληλουχιών (global alignment) των S.B.Needleman και C.D.Wunsch χρησιμοποίησαν το δυναμικό προγραμματισμό για σύγκριση αλληλουχιών. Η τεχνική τους αποτελεί τον πυρήνα πολλών μεθόδων στοίχισης και αναζήτησης αλληλουχίας.
  • Protein Data Bank (PDB)

    Protein Data Bank (PDB)
    Tο Εθνικό Εργαστήριο του Brookhaven ίδρυσε την “Τράπεζα Δεδομένων των Πρωτεϊνών” για την αρχειοθέτηση της τρισδιάστατης δομής τους. Η δημιουργία του έγινε με μια συλλογή δέκα πρωτεϊνών κρυσταλλογραφίας ακτίνων Χ και με μια οθόνη μοριακών γραφικών, την Brookhaven RAster Display (BRAD), για την απεικόνιση αυτών των πρωτεϊνικών δομών σε 3-D. Σήμερα αποθηκεύει περισσότερες από 30.000 δομές.
  • PAM

    Οι PAM (Point Accepted Mutations) είναι πίνακες αντικατάστασης αμινοξέων που κωδικοποιούν την πιθανότητα εξελικτικής μετάλλαξης σε επίπεδο των αμινοξέων. Οι πίνακες PAM εφευρέθηκαν από τη Margaret Dayhoff το 1978. Ο υπολογισμός αυτών βασίστηκε σε 1572 παρατηρούμενες μεταλλάξεις σε φυλογενετικά δέντρα 71 οικογενειών πρωτεϊνών. Οι πρωτεΐνες επιλέχθηκαν με βάση την υψηλή ομοιότητα από τους κοινόυς προγόνους τους.
  • Τοπική Στοίχηση (Αλγόριθμος Smith & Waterman)

    Τοπική Στοίχηση (Αλγόριθμος Smith & Waterman)
    Οι Smith και Waterman ανέπτυξαν έναν αλγόριθμο, που χρησιμοποιείται για τη σύγκριση δυο αλληλουχιών στην περίπτωση που θέλουμε να βρούμε την καλύτερη δυνατή στοίχιση δυο υπό-αλληλουχιών τους. Η μέθοδος αυτή ονομάζεται τοπική στοίχιση (local alignment). Χρησιμοποιείται συνήθως για την εύρεση ομοιοτήτων και διαφορών σε πρωτεΐνες, επειδή πολλές πρωτεΐνες είναι δομικά και λειτουργικά παρόμοιες μεταξύ τους σε
    αντίθεση με τα γονίδια.
  • EMBL (Nucleotide Sequence Database)

    Η EMBL Nucleotide Sequence Database αποτελεί τη μεγαλύτερη βάση νουκλεοτιδικών αλληλουχιών στην Ευρώπη. Eδράζεται και συντηρείται από το Ευρωπαϊκό Ινστιτούτο Βιοπληροφορικής (EBI) στο Cambridge. Οι αλληλουχίες κατατίθενται στην EMBL-Bank μέσω διαδικτύου, ακολουθώντας μία απλή διαδικασία από ανεξάρτητα ερευνητικά εργαστήρια ή ομάδες που ασχολούνται με τον προσδιορισμό των γονιδιωμάτων διαφόρων οργανισμών.
  • GenBank

    GenBank
    Η ανοιχτής πρόσβασης βάση δεδομένων GenBank περιέρχει πληροφορίες για αλληλουχίες DNA. Δημιουργήθηκε από το Εθνικό Κέντρο Πληροφοριών Βιοτεχνολογίας (National Center for Biotechnology Information-NCBI). Η έκδοση 250.0, που δημοσιεύθηκε τον Ιούνιο του 2022, περιείχε πάνω από 17 τρισεκατομμύρια νουκλεοτιδικές βάσεις σε περισσότερες από 2,45 δισεκατομμύρια αλληλουχίες.
  • FASTA

    FASTA
    Το FASTA είναι ένα DNA και πρωτεϊνών πακέτο λογισμικού ευθυγράμμισης αλληλουχιών που περιγράφηκε για πρώτη φορά από τους David J. Lipman και William R. Pearson το 1985. Το FASTA format χρησιμοποιήται ευρέως στη βιοπληροφορική. Εκτός από τις μεθόδους γρήγορης ευρετικής αναζήτησης, το πακέτο FASTA παρέχει SSEARCH, μια υλοποίηση του αλγορίθμου Smith–Waterman.
  • DDBJ

    DDBJ
    H DNA Databank of Japan (DDBJ) είναι η μοναδική διεθνώς αναγνωρισμένη βάση νουκλεοτιδικών αλληλουχιών στην Ιαπωνία. Ιδρύθηκε στο Εθνικό Ινστιτούτο Γενετικής (NIG) καιρίσκεται υπό την αιγίδα του Υπουργείου Παιδείας, Επιστημών και Αθλητισμού της Ιαπωνίας. Βασική πηγή δεδομένων της βάσης αποτελούν οι εργασίες των Ιαπώνων ερευνητών. Επιπλέον στην DDJB είναι διαθέσιμα διάφορα εργαλεία ανάλυσης νουκλεοτιδικών αλληλουχιών.
  • SWISS-PROT

    SWISS-PROT
    Το SWISS-PROT είναι μια επιμελημένη βάση δεδομένων αλληλουχιών πρωτεΐνης που προσπαθεί να παρέχει υψηλό επίπεδο σχολιασμού (όπως η περιγραφή της λειτουργίας μιας πρωτεΐνης, η δομή των τομέων της, οι μετα-μεταφραστικές τροποποιήσεις, οι παραλλαγές κ.λπ.), ένα ελάχιστο επίπεδο πλεονασμού και υψηλό επίπεδο ενοποίησης με άλλες βάσεις δεδομένων.
  • Human Genome Organisation (HUGO)

    Human Genome Organisation (HUGO)
    Ο Οργανισμός Ανθρώπινου Γονιδιώματος είναι ένας μη κερδοσκοπικός οργανισμός. Δημιουργήθηκε το 1988 για τη χαρτογράφηση και την αλληλουχία του γονιδιώματος στο Cold Spring Harbor. Ο αρχικός του σκοπός ήταν να προωθήσει τις διεθνείς συνεργατικές προσπάθειες για τη μελέτη του ανθρώπινου γονιδιώματος και την αντιμετώπιση των ζητημάτων γύρω από την ονοματολογία. Από μια ένωση μελών 42 επιστημόνων από 17 χώρες, η HUGO αύξησε τη βάση μελών της σε πάνω από 1.200 μέλη από 69 χώρες.
  • Εθνικό Κέντρο Πληροφοριών της Βιοτεχνολογίας

    Εθνικό Κέντρο Πληροφοριών της Βιοτεχνολογίας
    Το NCBI (National Center for Biotechnology Information) ιδρύθηκε το 1988 με πράξη του Κογκρέσου των Ηνωμένων Πολιτειών ως τμήμα της Εθνικής Βιβλιοθήκης Ιατρικής στα Εθνικά Ινστιτούτα Υγείας, με αποστολή να βρει νέες προσεγγίσεις για την αντιμετώπιση του αυξανόμενου όγκου και πολυπλοκότητας των βιολογικών δεδομένων προκειμένου να διευκολύνουν την κατανόηση των γονιδίων και του ρόλου τους στην υγεία και τις ασθένειες.
  • BLAST

    BLAST
    Το BLAST (Basic Local Alignment Search Tool) συγκρίνει δύο αλληλουχίες με αλγορίθμους τοπικής στόιχισης. Το πρόγραμμα συγκρίνει νουκλεοτίδια ή αλληλουχίες πρωτεΐνης με βάσεις δεδομένων και υπολογίζει τη βέλτιστη στοίχιση. Το BLAST μπορεί να χρησιμοποιηθεί για να συμπεράνει τη λειτουργική και εξελικτική σχέση μεταξύ αλληλουχιών, καθώς και στην αναγνώριση μελών οικογενειών. Είναι ένα από τα πιο ευρέως χρησιμοποιούμενα εργαλεία για αναζήτηση και σύγκριση αλληλουχιών.
  • MEGA

    MEGA
    Το λογισμικό MEGA (Molecular Evolutionary Genetics Analysis) είναι μια εφαρμογή σχεδιασμένη για συγκριτική ανάλυση ομόλογων αλληλουχιών γονιδίων, είτε από πολυγονιδιακές οικογένειες, είτε από διαφορετικά είδη με ιδιαίτερη έμφαση στην εξαγωγή εξελικτικών σχέσεων και προτύπων εξέλιξης DNA και πρωτεϊνών. Αναπτύχθηκαν 10 εκδόσεις του ΜΕGA με την πιο πρόσφατη MEGA 11.
  • BLOSUM

    Οι πίκανες BLOSUM (BLOcks SUbstitution Matrix) είναι πίνακες αντικατάστασης που χρησιμοποιούνται για την ευθυγράμμιση αλληλουχιών των πρωτεϊνών. Χρησιμοποιούνται για τη βαθμολογία ευθυγραμμίσεων μεταξύ εξελικτικά συγκλίνουσες αλληλουχίες πρωτεϊνών. Παρουσιάστηκαν για πρώτη φορά σε μια εργασία από τους Steven Henikoff και τη σύζηγό του Jorja Henikoff.
  • PubMed

    PubMed
    Η PubMed στεγάζεται στο NCBI και περιλαμβάνει περισσότερα από 24 εκατομύρια καταχωρήσεις επιστημονικών άρθρων από τη βιοϊατρική βιβλιογραφία (έχοντας κάλυψη της MEDLINE, άλλων περιοδικών των επιστημών της ζωής αλλά και από κάποια online βιβλία). Οι αναφορές μπορεί να περιέχουν συνδέσμους στο πλήρες κείμενο των εργασιών, είτε μέσω της PubMed Central, είτε απευθείας μέσω των ιστοσελίδων των εκδοτικών οίκων.
  • Web of Science

    Web of Science
    Το Web of Science είναι μια πλατφόρμα που παρέχει πρόσβαση σε πολλαπλές βάσεις δεδομένων που παρέχουν δεδομένα αναφοράς και παραπομπών από ακαδημαϊκά περιοδικά, πρακτικά συνεδρίων και άλλα έγγραφα σε διάφορα ακαδημαϊκούς κλάδους. Δημιουργήθηκε αρχικά από το Ινστιτούτο Επιστημονικών Πληροφοριών.
  • GeneExpression Omnibus (GEO)

    Δημόσια του NCBI που παρέχει δεδομένα γονιδιακής έκφρασης, τόσο από μικροσυστοιχίες όσο και από αλληλούχιση (next generation sequenicng). Τα δεδομένα υπάρχουν τόσο σε ακατέργαστη (raw) όσο και σε επεξεργασμένη μορφή (μεκανονικοποιήσεις κ.ο.κ.). Η βάση περιέχει (τον Φεβρουάριο του 2015), δεδομένα από 14.031 διαφορετικές πλατφόρμες έκφρασης,προερχόμενα από 1.357.732 "δείγματα", δηλαδή άτομα.
  • dbSNP

    Η dbSNP είναι η δημόσια βάση για τους νουκλεοτιδικούς πολυμορφισμούς. Εκτός από νουκλεοτιδικούς πολυμορφισμούς (single nucleotide polymorphisms - SNPs), περιέχει και δεδομένα για πολυμορφικές θέσεις που αφορούν απαλοιφές ή εισαγωγές βάσεων (deletion insertion polymorphisms -DIPs), καθώς και για ένθετα μεταθετά στοιχεία και μικροδορυφορικές επαναλήψεις (short tandem repeats - STRs).
  • UniProt

    UniProt
    Το UniProt είναι μια ελεύθερα προσβάσιμη βάση δεδομένων αλληλουχίας πρωτεϊνών και λειτουργικών πληροφοριών, πολλές εγγραφές προέρχονται από έργα αλληλουχίας γονιδιώματος . Περιέχει μεγάλο όγκο πληροφοριών σχετικά με τη βιολογική λειτουργία των πρωτεϊνών που προέρχονται από την ερευνητική βιβλιογραφία. Το UniProt παρέχει τέσσερις βασικές βάσεις δεδομένων: UniProtKB (με υποτμήματα Swiss-Prot και TrEMBL), UniParc, UniRef και Proteome.
  • HapMap

    HapMap
    Το International HapMap Project είναι το αποτέλεσμα
    μια διεθνούς συνεργασίας σε μια προσπάθεια να εντοπισθούν και να καταγραφούν οι γενετικές διαφορές
    αλλά και οι ομοιότητες των ανθρώπινων πληθυσμών. Σκοπός του προγράμματος αποτελεί η σύγκριση των γενετικών αλληλουχίων διαφορετικών ατόμων (από διαφορετικούς πληθυσμούς) και να εντοπίσει με αυτόν τον τρόπο χρωμοσωμικές περιοχές στις οποίες οι γενετικές παραλλαγές (συνήθως, νουκλεοτιδικοί πολυμορφισμοί), κληρονομούνται μαζί.