Θέματα Βιοπληροφορικής 2015
1. Αποτελεί βάση δεδομένων δομών μακρομορίων (πρωτεϊνών και νουκλεϊκών οξέων).
a. PDB
b. UniProt
2. Αποτελεί πρόγραμμα πολλαπλής στοίχισης ακολουθιών.
a. T-coffee
b. InterProScan
3. Μεθοδολογία ανακατασκευής φυλογενετικών δέντρων, η οποία επιλέγει το δέντρο που ελαχιστοποιεί το πλήθος των εξελικτικών βημάτων που απαιτούνται για την επεξήγηση των δεδομένων.
a. Μέγιστη φειδωλότητα
b. Μέγιστη πιθανοφάνεια
4. Το μέγεθος των λέξεων (k-tuples) που χρησιμοποιούνται στον αλγόριθμο FASTA επηρεάζει την ευαισθησία και την ταχύτητα της αναζήτησης.
5. Μια συναινετική ακολουθία περιέχει πληροφορίες σχετικά με τη μεταβλητότητα κάθε στήλης της πολλαπλής στοίχισης την οποία περιγράφει.
6. Το Sum-of-Pairs Score χρησιμοποιείται για την βαθμολόγηση πολλαπλής στοίχισης ακολουθιών.
7. Το TBLASTN χρησιμοποιείται για τον εντοπισμό ομόλογων πρωτεϊνικών ακολουθιών σε αμινοξικές βάσεις δεδομένων.
8. Οι αλγόριθμοι δυναμικού προγραμματισμού εγγυώνται την εύρεση της βιολογικά σωστής στοίχισης.
9. Το RMSD είναι ένας τρόπος βαθμολόγησης της δομικής σύγκρισης μεταξύ δύο μορίων.
10. Το PHI-BLAST χρησιμοποιεί ένα μοτίβο (regular expression) για την εύρεση βιολογικά σημαντικών στοιχίσεων.
11. Για την τοποθέτηση των πλευρικών αλυσίδων στην προτυποποίηση πρωτεϊνών με ομολογία χρησιμοποιούνται βιβλιοθήκες στροφομερών.
12. Η βάση δεδομένων UniProt ταξινομεί τις πρωτεϊνικές δομές με βάση τα στοιχεία δευτερογταγούς δομής και της εξελικτικής σχέσης.
13. Μέτρο εκτίμησης της ακρίβειας πρόγνωσης στοιχείων δευτεροταγούς δομής:
a. STRIDE
b. SOV
c. GORIII
d. VAST
14. H εξελικτική ιστορία των γονιδίων ταυτίζεται με την εξελικτική ιστορία των οργανισμών.
15. Η υψηλή ομοιότητα σε επίπεδο ακολουθίας είναι απόδειξη ομολογίας.
16. Αποτελεί πρόγραμμα πολλαπλής προοδευτικής στοίχισης βάσει ενός δεντρου-οδηγού:
a. Needleman-Wunsch
b. ClustalW
c. BAliBASE
d. Hmmscan
17. Δίνεται το ακόλουθο διάγραμμα σημείων (Dot Matrix Plot) όπου και στους δύο άξονες βρίσκεται η ίδια ακολουθία. Τι συμπεράσματα βγάζετε για την ακολουθία;
a.
Έχει μια περιοχή χαμηλής πολυπλοκότητας
b. Είναι παλίνδρομη ακολουθία
18. Δίνεται το ακόλουθα διάγραμμα σημείων όπου και στους δύο άξονες βρίσκεται η ίδια ακολουθία. Τι συμπέρασμα βγάζετε για την ακολουθία;
a. Είναι παλίνδρομη
b.
19. Τα όρια των στοιχείων δευτεροταγούς δομής μεταβάλλονται σε οικογένειες ομόλογων πρωτεϊνών.
20. Το μοντέλο βαθμολόγησης των κενών gp(k)=b+ak, (|b|>|a|) ονομάζεται:
a. Linear gap penalty
b. Affine gap penalty
21. Η παρατηρούμενη απόσταση διαφέρει από την εξελικτική απόσταση για:
a. Μεγάλες αποστάσεις
b. Μικρές αποστάσεις
22. Ποιοι πίνακες αντικατάστασης προκύπτουν από την τοπική πολλαπλή στοίχιση χωρίς κενά εξελικτικά απομακρυσμένων πρωτεϊνών;
a. PAM
b. BLOSUM
23. Δίνεται E-value της στοίχισης δύο νουκλεοτιδικών αλληλουχιών. Ποια από αυτές είναι στατιστικών σημαντική;
a. E-value=0
b. E-value=1
24. Για ποιον λόγο εφαρμόζουμε φίλτρα σε μία ακολουθία με περιοχές χαμηλής πολυπλοκότητας κατά την αναζήτηση σε βάσεις δεδομένων;
a. Δημιουργούνται στατιστικώς μη σημαντικές στοιχίσεις
b. Δημιουργούνται στοιχίσεις χωρίς βιολογικό νόημα
25. Ποιο από τα ακόλουθα ΔΕΝ αποτελεί επίπεδο για την περιγραφή των γονιδιακών προϊόντων της
Gene Ontology;
a. Cellular component
b. Metabolic pathway
c. Molecular function
d. Biological process
26. Η μέθοδος αναζήτησης γνωστών μοτίβων σε ρυθμιστικές περιοχές γονιδίων:
a. Phylogenetic footprinting
b. Homology modeling
27. Χρήσιμο στην αναζήτηση ιδιαίτερα συντηρημένων «υπογραφών» σε νουκλεοτιδικές ακολουθίες:
a. Position Specific Scoring Matrices
b. Hidden Markov Models
c. Consensus sequences
d. Regular expressions
28. Ποιοι πίνακες αντικατάστασης προκύπτουν από την τοπική στοίχιση χωρίς κενά εξελικτικά απομακρυσμένων πρωτεϊνών;
a. PAM
b. BLOSUM
29. Η παρουσία και η αφθονία πρωτεϊνών σε ένα δείγμα προσδιορίζεται με την χρήση:
a. Αναλυτικών μικροσυστοιχιών
b. Λειτουργικών μικροσυστοιχιών=>για βιοχημικές διεργασίες
c. Μικροσυστοιχιών ανάστροφης φάσης =>για πρωτεϊνική δράση
30.
Επιλογή του κατάλληλου μοτίβου για δοσμένη πρωτεϊνική ακολουθία
Το pattern 2 νομίζω υπάρχει στην περιοχή LDIQKVAGTWYSL
31. Σε έναν πίνακα αντικατάστασης, οι συντηρητικές αντικαταστάσεις έχουν σκορ:
a. Αρνητικό
b. Θετικό
32. Διαγωνισμός για την εκτίμηση της ακρίβειας πρόγνωσης των μεθόδων υπολογιστικού προσδιορισμού δομών πρωτεϊνών:
a. ROSETTA
b. PROCHECK
c. RaptorX
d. CASP
33. Σ’ ένα πείραμα μικροσυστοιχιών, η μέθοδος ανταλλαγής των χρωστικών που επισημαίνουν το δείγμα υπό μελέτη και το δείγμα αναφοράς χρησιμοποιείται προκειμένου να συνεκτιμηθεί:
a. Βιολογική μεταβλητότητα
b. Πειραματική μεταβλητότητα=>τεχνικές επαναλήψεις στα microarrays
34. Ο αριθμός των πειραματικά προσδιορισμένων δομών είναι πολύ μεγαλύτερος του αριθμού των ακολουθιών.
35. Σ’ ένα πείραμα μικροσυστοιχιών, η αναγνώριση γονιδίων με παρόμοιο προφίλ έκφρασης γίνεται με μεθόδους:
a. Κατηγοριοποίησης
b. Ομαδοποίησης
36. Αποτελεί συμπλήρωμα της Swiss-Prot:
a. InterPro
b. MyProt
c. TrEMBL
d. KEGG
37. Σε ένα κλαδόγραμμα το μήκος των κλαδιών του είναι ομόλογο της γενετικής απόκλισης.
38. Το μοντέλο affine gap penalty, η gap opening penalty είναι πολύ μεγαλύτερη από την gap extension penalty, γεγονός που αντανακλά την τάση οι ενθέσεις και οι διαγραφές να συμβαίνουν σε διαδοχικά κατάλοιπα.
39. Για αναζήτηση γονιδίων που δεν έχουν αναγνωριστεί με συμβατικές μεθόδους χρησιμοποιείται το:
a. BLASTP
b. BLASTN
c. TBLASTX
d. PHI-BLAST
40. Παρατηρήσιμη ποσότητα που μπορεί να εκφραστεί ως το ποσοστό των ταυτόσημων καταλοίπων μεταξύ δύο ακολουθιών: Ομοιότητα
41. Δίνεται ο πίνακας δυναμικού προγραμματισμού που έχει προκύψει χρησιμοποιώντας το απλό σύστημα βαθμολόγησης match=2, mismatch=-2, gap=-2. Ποια η τιμή του σημειωμένου κελιού;
a. από διαγώνια=4+match=4+2=6
b. από κάθετα=2+gap=2-2=0
c. από οριζόντια=2+gap=2-2=0
d. max(6,0,0)=6
42.
43. Ποια από τα ακόλουθα στατιστικά στοιχεία χρησιμοποιούνται για την αξιολόγηση των μοτίβων της ΒΔ PROSITE;
a. Precision
b. E-value
c. Και τα δύο
d. Κανένα από τα δύο
44. Σε ένα πείραμα μικροσυστοιχιών, η ακρίβεια ενός ταξινομητή για την κατηγοριοποίηση νέων δειγμάτων βάσει του προφίλ έκφρασής τους αυξάνεται με την χρήση μεγάλου αριθμού γονιδίων
– δεικτών.
45. Η αναζήτηση ομοιοτήτων σε βάσεις δεδομένων πρωτεϊνικών ακολουθιών χρησιμοποιείται για την εύρεση μεταλλάξεων πλαισίου αναγνώρισης:
46. Αποτελεί ΒΔ κατηγοριοποίησης πρωτεϊνών βάσει της τριτοταγούς δομής τους
a. PDB
b. CATH
c. PRODOM
d. PRINTS
47. Στο μοντέλο affine gap penalty η gap open penalty είναι πολύ μεγαλύτερη από την Gap extension penalty, γεγονός που αντανακλά την τάση οι ενθέσεις και οι διαγραφές να συμβαίνουν σε διαδοχικά κατάλοιπα.
48. Ποιο από τα ακόλουθα αρχεία δεν αποτελεί flat file;
a. Μορφοποίηση GenBank
b. Μορφοποίηση Uniprot
c. Μορφοποίηση PDB
d. Μορφοποίηση eUtils
49. Η επιλογή των παραμέτρων για τις ποινές των κενών είναι εμπειρική και δεν εξαρτάται από τον πίνακα αντικατάστασης που χρησιμοποιείται για την στοίχιση των ακολουθιών.
50. Η προτυποποίηση των στροφών στην τεχνική προτυποποίησης πρωτεϊνών με ομολογία γίνεται με την χρήση βιβλιοθήκης στροφομερών.
51. Το Ramachandran Plot δείχνει τις τιμές γωνιών που επιτρέπεται να πάρει ο πεπτιδικός δεσμός.
52. Ποια από τις παρακάτω ΔΕΝ ισχύει στην περίπτωση του προγράμματος ClustalW:
a. Αρχική στοίχιση όλων των ακολουθιών ανά δύο
b. Απόδοση στατιστικών βαρών στις ακολουθίες
c. Χρήση του ίδιου πίνακα αντικατάστασης για όλες τις στοιχίσεις
d. Χρήση διαφορετικής ποινής για τα κενά αναλόγως της θέσης
53. Ο πίνακας αντικατάστασης BLOSUM62 προκύπτει αναγωγικά από τον πίνακα BLOSUM1.
54. Σε έναν πίνακα αντικατάστασης, οι συντηρητικές αντικαταστάσεις έχουν σκορ:
a. Αρνητικό
b. Θετικό
55. Ποια η διαφορά μεταξύ των βάσεων δεδομένων RefSeq και GenBank;
a. Η RefSeq περιλαμβάνει ελεύθερα προσβάσιμες αλληλουχίες DNA που υποβάλλονται είτε από μεμονωμένα εργαστήρια είτε από κοινοπραξίες που έχουν αναλάβει project αλληλούχισης.
b. Τις καταχωρίσεις της GenBank τις έχουν επιμεληθεί εξειδικευμένοι επιστήμονες ώστε να μην είναι πλεονάζουσες.
56. Στον πίνακα Δυναμικού Προγραμματισμού για την τοπική στοίχιση δύο ακολουθιών, ΔΕΝ ισχύει:
a. Η στοίχιση τερματίζεται μόλις συναντήσουμε για πρώτη φορά μηδενική τιμή.
b. Δεν υπάρχουν κελιά με αρνητικές τιμές.
c. Κάθετο βέλος στον πίνακα ιχνηθέτη υποδεικνύει στοίχιση καταλοίπου με κενό.
d. Η στοίχιση αρχίζει από το τελευταίο κελί του πίνακα.
57. Σε ένα ΗΜΜ είναι:
a. Άγνωστη σειρά συμβόλων/ Γνωστή σειρά καταστάσεων
b. Γνωστή σειρά συμβόλων/Άγνωστη σειρά καταστάσεων
58. Για την φυλογενετική ανάλυση συγγενών οργανισμών χρησιμοποιούμε:
a. Ριβοσωμικό RNA
b. Μιτοχονδριακό DNA
c. Αμινοξικές αλληλουχίες
59. Μεθοδολογία ανακατασκευής φυλογενετικών δέντρων βάσει χαρακτήρων:
a. Neighbor joining
b. Maximum Parsimony
c. UPGMA
d. Fitch-Margoliash
60. Σε μία σφαιρική υδατοδιαλυτή πρωτεΐνη ο πυρήνας είναι:
a. Υδρόφιλος
b. Υδρόφοβος
61. Πρόγραμμα για την ανάθεση στοιχείων δευτεροταγούς δομής σε πειραματικά προσδιορισμένες δομές:
a. RMSD
b. Qindex
c. DSSP
d. SCOP
62. Ο σχηματισμός β πτυχωτών επιφανειών στηρίζεται σε αλληλεπιδράσεις:
a. Μικρής εμβέλειας
b. Μεγάλης εμβέλειας
63. Σε περιοχές κοντά στο 5’ άκρο των γονιδίων η συχνότητα εμφάνισης του δινουκλεοτιδίου CG:
a. Μειώνεται
b. Αυξάνεται
64. Σε ένα πείραμα μικροσυστοιχιών, ένα γονίδιο που εκφράζεται και στο δείγμα αναφοράς και στο υπό μελέτη δείγμα έχει χρώμα:
a. Πράσινο
b. Κόκκινο
c. Κίτρινο
d. Μαύρο
65. Ποια από τις ακόλουθες ΒΔ ΔΕΝ ανήκει στην International Nucleotide Sequence Database Collaboration;
a. DDBJ
b. GenBank
c. GEO
d. ENA
66. Αποτελεί βασική πηγή πληροφόρησης για γονίδια και σχετιζόμενους γενετικούς φαινότυπους:
a. HTGS
b. SMART
c. GO
d. OMIM
67. Παρατηρήσιμη ποσότητα που μπορεί να εκφραστεί ως το ποσοστό των ταυτόσημων καταλοίπων μεταξύ δύο ακολουθιών:
a. Ομολογία
b. Ομοιότητα
68. Η εισαγωγή κενών στην στοίχιση δύο ακολουθιών συνοδεύεται από αύξηση του score ομοιότητας.
69. Δίνονται δύο αμινοξικές ακολουθίες προς στοίχιση και το μοντέλο affine gap penalty. Ποιες από τις ακόλουθες τιμές θα επιλέγατε για τις παραμέτρους Gap opening penalty and Gap extension penalty αντίστοιχα;
a. 3, 0.0005
b. 0.0005, 1
c. 10, 0.5
d. 0.5, 10
70.
Ποια από τις ακόλουθες ΒΔ δεν περιέχει μοντέλα πολλαπλών στοιχίσεων βάσει Hidden Markov
Models;
a. Pfam
b. PROSITE
c. TIGRFAMs
d. InterPro
71. Σε ένα κλαδόγραμμα, το μήκος των κλαδιών του είναι ανάλογο της γενετικής απόκλισης.
72. Καταγράψτε το είδος της στοίχισης που υλοποιεί ο αλγόριθμος BLAST
a. Τοπική στοίχιση
73. Δίνεται η εγγραφή της PDB. Ποιες είναι οι συντεταγμένες του οξυγόνου της πλευρικής αλυσίδας του καταλοίπου ASN 90;
74.
a. Απάντηση:
75. Στο two-hit blast γίνεται επέκταση της στοίχισης μόνο όταν υπάρχουν δυο επικαλυπτόμενα ζεύγη λέξεων.
a. Pattern 1
b.
Pattern 276. Καταγράψτε ένα πρόγραμμα μοριακής οπτικοποίησης πρωτεϊνών:
a. PyMol
77.
Ακολουθούν screenshots από θέματα των οποίων οι εκφωνήσεις δεν είναι ολοκληρωμένες: