L’information génétique de toutes les cellules réside dans la séquence de bases azotées dans les molécules extrêmement longues de l’ADN. Contrairement à l’ADN des cellules eucaryotes, qui réside dans le noyau, l’ADN des cellules bactériennes n’est pas séquestré dans un organite lié à une membrane mais apparaît sous la forme d’une longue bobine distribuée dans le cytoplasme. Chez de nombreuses bactéries, l’ADN se présente sous la forme d’un chromosome circulaire unique, bien que certaines bactéries puissent contenir deux chromosomes, et dans certains cas, l’ADN est linéaire plutôt que circulaire. Un nombre variable de molécules d’ADN plus petites, généralement circulaires (mais parfois linéaires), appelées plasmides, peuvent porter des informations auxiliaires.
La séquence des bases dans l’ADN a été déterminée pour des centaines de bactéries. La quantité d’ADN dans les chromosomes bactériens varie de 580 000 paires de bases chez Mycoplasma genitalium à 4 700 000 paires de bases chez E. coli et à environ 9 450 000 paires de bases chez Myxococcus xanthus. Sorangium cellulosum, une myxobactérie, possède l’un des plus grands génomes bactériens, contenant plus de 13 millions de paires de bases. La longueur du chromosome de E. coli, s’il est retiré de la cellule et étiré au maximum, est d’environ 1,2 mm, ce qui est frappant si l’on considère que la longueur de la cellule est d’environ 0,001 mm.
Comme dans tous les organismes, l’ADN bactérien contient les quatre bases azotées adénine (A), cytosine (C), guanine (G) et thymine (T). Les règles d’appariement des bases pour les molécules d’ADN double brin exigent que le nombre de bases adénine et thymine soit égal et que le nombre de bases cytosine et guanine soit également égal. La relation entre le nombre de paires de bases G et C et le nombre de paires de bases A et T est un indicateur important des changements génétiques évolutifs et adaptatifs au sein d’un organisme. La proportion, ou rapport molaire, de G + C peut être mesurée comme G + C divisé par la somme de toutes les bases (A + T + G + C) multipliée par 100 pour cent. La variation des rapports G + C entre les organismes peut être considérable. Chez les plantes et les animaux, la proportion de G + C est d’environ 50 pour cent. La proportion de G + C varie beaucoup plus chez les procaryotes, allant d’environ 25 pour cent chez la plupart des Mycoplasma à environ 50 pour cent chez E. coli et à près de 75 pour cent chez Micrococcus, les actinomycètes et les myxobactéries. La teneur en G + C au sein d’une espèce dans un même genre, cependant, est très similaire.