jeudi 30 avril 2015

NCBI 1.0









Matériel supplémentaire

La biologie moléculaire dépend en grande partie de l'étude des séquences d'ADN auxquelles correspondent les différents gènes qui permettent à chaque cellule vivante de fonctionner. Ces séquences d'ADN, au point de vue moléculaire, sont une suite de quatre molécules distinctes agencées en une longue chaîne. C'est l'ordre dans lequel ces quatre molécules sont arrangées qui permet de dicter la fonction de chaque gène.

Nous disposons depuis quelques décennies de technologies nous permettant de "lire" la séquence de l'ADN ou, pour être plus précis, de déterminer l'ordre dans lequel les quatre molécules ci-haut mentionnées sont agencées dans chaque gène. Chacune desdites molécules est représentée par une lettre: un A, un C, un G ou un T (chacune de ces lettres est l'initiale d'un groupement distinct sur chacune de ces molécules). Et donc, la séquence de chaque gène est toujours une suite de ces quatre lettres, dans un ordre qui lui est propre.

Où peut-on avoir accès à ces informations? Y a-t-il un gros livre, quelque part, qui dit que la séquence du gène de la préproinsuline humaine est ATGGCCCTGTGGATGCGCCTCCTGCCCCTGCTGGCGCTGCTGGCCCTCTGGGGACCTGACCCAGCCGCAGCCTTTGTGAACCAACACCTGTGCGGCTCACACCTGGTGGAAGCTCTCTACCTAGTGTGCGGGGAACGAGGCTTCTTCTACACACCCAAGACCCGCCGGGAGGCAGAGGACCTGCAGGTGGGGCAGGTGGAGCTGGGCGGGGGCCCTGGTGCAGGCAGCCTGCAGCCCTTGGCCCTGGAGGGGTCCCTGCAGAAGCGTGGCATTGTGGAACAATGCTGTACCAGCATCTGCTCCCTCTACCAGCTGGAGAACTACTGCAACTAG? Non, pas vraiment, parce que d'une part la plupart des séquences génétiques sont bien plus longues que celle-là (j'en ai délibérément choisi une très courte) et parce qu'il y a bien trop de gènes, dans bien trop d'organismes, pour faire d'un tel projet de publication quelque chose de viable. La lecture en devrait d'ailleurs bien vite monotone, et en plus il faudrait recopier chaque séquence toutes les fois qu'on voudrait s'en servir.

Les séquences d'ADN sont donc conservées sous forme électronique dans des bases de données accessibles à tout un chacun; des bases de données maintenues par des organismes comme le NCBI (National Center for Biotechnology Information), le EBI (European Bioinformatics Institute) ou l'université de Californie à Santa Cruz. Ces organismes nous permettent de télécharger à volonté toutes les séquences qui puissent nous intéresser.

Bien sûr, ça n'a pas toujours été aussi facile!



Aucun commentaire:

Publier un commentaire