Qu’est-ce qu’un gène ? Un dossier révélateur dans un numéro récent de « La Recherche » met en évidence la remarquable absence de consensus : 18 spécialistes donnent autant de réponses différentes à la question. Pour mettre de l’ordre dans la confusion, on peut néanmoins regrouper les réponses en deux grandes catégories : d’une part, celles centrées sur l’ADN (et la biologie moléculaire apparenté, à savoir le ARN-messager et les protéines) ; d’autre part, les réponses « classiques » qui se réfèrent à la génétique formelle de Mendel à Morgan, qui a abouti à la théorie chromosomique. Le but de ce petit livre (une centaine de pages) est d’abord de présenter la génétique classique de façon succincte mais conséquente et accessible à des non-spécialistes (ce qui n’est déjà pas superflu, tant cette théorie est devenue méconnue) ; ensuite, de tirer des conséquences épistémologiques de cette théorie, en soulignant à la fois sa force et sa faiblesse caractéristiques, concernant la relation entre la génétique et la biologie. La conclusion sera un plaidoyer pour un retour (ou un nouveau départ) vers une biologie des organismes vivants en tant que tels, au trois échelles de temps de la physiologie, de l’ontogenèse et de la phylogenèse.
I. La génétique formelle.
– Présentation de l’expérience princeps de Mendel. Le couple conceptuel phénotype-génotype. Le phénotype est un trait observable des organismes en question ; le génotype, lui, n’est pas observable en tant que tel (cf, en physique, des entités comme la force, la masse, ou bien des électrons, des quarks etc ; aucune n’est observable directement en tant que telle, ce sont des objets scientifiques constitués en théorie, qui expliquent des phénomènes empiriquement observables). Souligner, déjà, le caractère différentiel de la génétique : on infère des différences génotypiques sur la base de l’observation de différences phénotypiques. Plus particulièrement, on infère que le génotype associé à un trait phénotypique donné est composé de deux facteurs mendéliens, un reçu de chacun des deux parents lors de la reproduction sexuelle, et dont l’un ou l’autre sera tranmis, aléatoirement, à chaque individu de la progéniture. Souligner la nature discrète des facteurs mendéliens, qui ne se mélangent pas (phénomène clé de la « ségrégation »).
– Présentation des expériences de l’Ecole de Morgan. En observant des croisements portant simultanément sur trois (ou plus) traits phénotypiques, on déduit que les facteurs mendéliens sont situés linéairement les uns par rapport aux autres, dans un certain nombre (4 pour la Drosophile, 23 pour les humains) de groupes de linkage.
– La théorie chromosomique. L’homologie parfaite entre le comportement des facteurs mendéliens, et celui des chromosomes (structures microscopiques observables à certains étapes de la division cellulaire, notamment lors de la méiose qui donne lieu aux gamètes). Conclusion : les facteurs mendéliens (que l’on appelera « gènes ») se situent dans les chromosomes, et possèdent donc un support matériel a priori identifiable. Rapide survol de la suite de l’histoire : les molécules biochimiques qui sont le substrat des gènes s’avèrent ne pas être des protéines, comme on le pensaient initialement, mais des acides nucléiques et plus précisément l’ADN.
II. Conséquences épistémologiques.
La force et la faiblesse de la génétique formelle résident inséparablement dans une caractéristique singulière de son épistémologie : il est possible de passer directement de l’observation d’un phénotype final, à des inférences sur les facteurs génétiques sous-jacents, en court-circuitant toutes les étapes intermédiaires de la chaîne causale par laquelle une différence dans un facteur génétique produit une différence dans le phénotype correspondant en traversant tous les niveaux d’organisation intermédiaires (ARN-messager, protéine, métabolisme, physiologie cellulaire, physiologie des organes, systèmes physiologiques, organisme….).
C’est sa force, car cette caractéristique permet d’inférer les propriétés essentielles des facteurs génétiques, et de les suivre à la trace des différences phénotypiques qu’ils provoquent, sans jamais regarder à l’intérieur de l’organisme (cf I ci-dessus).
Malgré sa puissance, cette caractéristique singulière de la génétique formelle est en même temps une grande faiblesse ; car en court-circuitant toute la châine causale qui relie le génotype au phénotype, elle instaure une coupure entre la génétique et la biologie. Le fait qu’aujourd’hui la biologie semble bien souvent se réduire à séquencer l’ADN, en oubliant l’organisme vivant en tant que tel, est une conséquence fâcheuse de cette singularité épistémologique de la génétique (cf le délaissement des disciplines traditionnelles qu’étaient la physiologie, l’embryologie, l’histoire naturelle et l’écologie). Il faut souligner que la génétique formelle (et à sa suite la biologie moléculaire qui en dérive) est constitutivement aveugle à tout ce qui est invariant dans l’espèce – et qui est néanmoins la condition de possibilité pour qu’une différence dans un génotype puisse donner lieu à une différence dans un phénotype. Exemple primordial : l’autopoièse. Deuxième exemple, révélateur : la génétique, contrairement à ce qu’on dit habituellement, n’est pas une science de l’hérédité, car elle n’explique pas comment il se fait qu’une progéniture ressemble à ses parents, mais bien plutôt comment elle peut en être différente (et corrélativement, comment des frères et soeurs peuvent être différents entre eux).
III. Conclusion.
Afin de rétablir une articulation entre la génétique et une biologie des organismes entiers, il sera nécessaire d’étudier dans le détail la totalité de la chaîne causale qui conduit d’une différence dans un facteur génétique à une différence dans le caractère phénotypique correspondant. Cette thèse sera illustrée en prenant le cas des maladies génétiques multifactorielles.
[Annexe. Les maladies génétiques « classiques » (par exemple la chorée de Huntingdon ou la mucoviscidose) sont « monogéniques », c’est-à-dire que la présence ou l’absence de la maladie est imputable à des différences dans un seul facteur génétique parmi les 20 ou 30 mille que comporte le génôme humain. Il est à noter que même dans ce cas, il est tout sauf trivial d’élucider la totalité de la chaîne causale conduisant du facteur génétique au phénotype final.
Aujourd’hui, il y a un intérêt croissant pour les maladies dites « multifactorielles ». Ici, des facteurs génétiques et des facteurs environemmentaux sont tous les deux importants (l’héritabilité, que l’on peut estimer par le taux de concordance des jumeaux monozygotes, est généralement de l’ordre de 50%). Depuis peu, grâce notamment aux marqueurs microsatellites, on sait que le nombre de facteurs génétiques impliqués est moyennement élevé (de l’ordre de 10 à 30). Ce nombre dépend évidemment de la précision et spécificité de la définition de la maladie en termes cliniques : plus la définition est spécifique, moins sera le nombre de facteurs génétiques. Un exemple probablement assez typique est fourni par le diabète type-1 (il s’agit d’une forme spécifique de diabète où une déficience en insuline est provoqué par la destruction auto-immune des cellules _ du pancréas). On pense aujourd’hui (conforté en cela par un modèle chez la souris) que le nombre de facteurs génétiques est de l’ordre de 15.
La fréquence du diabète type-1 dans la population générale est approximativement 0.4%. Ainsi, comme pour les autres maladies multifactorielles, la fréquence de cette maladie est plusieurs ordres de grandeur plus élevée que celles des maladies monogéniques. Ceci soulève une question intéressante : quelle est la fréquence des allèles responsables de la maladie ? Pour prendre des repères, examinons deux cas extrêmes :
(a) Si chacun des 15 facteurs est à lui tout seul une cause suffisante pour la maladie, la fréquence de chacun sera de (0.4/15)% = 2,7 . 10-4. On se rapproche des fréquences des maladies monogéniques ; et en fait, dans ce cas, on pourrait considérer qu’il s’agit non pas d’une maladie, mais de 15 maladies monogéniques différentes que la recherche clinique aurait pour tâche de différencier. Mais il existe une autre possibilité.
(b) Il se peut aussi que tous les 15 facteurs doivent être présents simultanément pour que la maladie de manifeste. Dans ce cas, la fréquence de chaque facteur, fs, serait donné par : fs15 = 0.004, c’est-à-dire fs = 0,7. Autrement dit, la forme « anormale » de chaque facteur génétique serait présent chez 70% des individus normaux.
Selon toute vraisemblance, la situation réelle est intermédiaire entre ces deux extrêmes. Ce qu’il faut retenir, c’est que plus les interactions entre les différents facteurs génétiques sont fortes (c’est-à-dire plus le nombre de facteurs génétiques qui doivent être présents simultanément pour que la maladie se manifeste est élevé), plus grande sera la fréquence des allèles « anormaux » dans la population générale.
Il est possible d’établir un calcul reliant la fréquence d’une maladie multifactorielle chez les frères et les soeurs d’invidus atteints, à la fréquence dans la populations des allèles prédisposant à la maladie. Pour le cas du diabète type-1, (fréquence 0.4%, héritabilité 0.34, fréquence chez les frères et soeurs de 6%), on en conclut que la fréquence des allèles prédisposant à la maladie est élevée, de l’ordre de 30%. Si ce résultat se confirme et se généralise, cela représenterait un changement considérable dans notre vision des gènes impliqués dans les maladies multifactorielles. Jusqu’ici, en se basant sur les maladies monogéniques, on tend à penser que toutes les maladies génétiques sont imputables à des « mauvais gènes », très rares dans la population, de sorte qu’une thérapie génique soit envisageable. Mais si les fréquences sont de l’ordre de 30%, les allèles ne seraient pas « anormaux » en soi, mais seulement dans certaines combinaisons rares ; dans d’autres combinaisons, ces mêmes allèles pourraient être neutres ou même bénéfiques. Une approche en termes de thérapie génique serait alors à la fois impratiquable et imprudente.
Cette fréquence élevée signifie que les allèles seraient présents chez un grand nombre d’individus normaux. Elle signifie aussi, corrélativement, que les différents facteurs génétiques interagissent fortement entre eux (au moins 8 des 15 facteurs doivent être présents simultanément pour causer la maladie). Pour comprendre ce genre de maladie multifactorielle, il faudra donc comprendre comment les différents facteurs génétiques intéragissent entre eux ; et il faudra également pouvoir suivre à la trace chacun des facteurs individuellement, d’abord pour les détecter chez des individus normaux dans la population, ensuite pour élucider leurs modes d’action spécifiques. Pour voir ce que cela implique, revenons au schème des articulations entre niveaux d’organisation.
On peut considérer, a priori, que les interactions entre deux facteurs génétiques donnés ont lieu au moment du passage entre deux niveaux d’organisation bien précis, que l’on peut désigner par les niveaux « n » et « (n+1) ». J’appelerai « sub-phénotype » un phénotype provenant d’observations à un niveau d’organisation intermédiaire entre le phénotype final et le niveau génétique élémentaire. Par construction, les sub-phénotypes au niveau n sont affectés par un et un seul facteur génétique ; ce sont ce que je propose d’appeler des « phénotypes mendéliens ». Par contre, les sub-phénotypes au niveau (n+1) sont affectés par plusieurs facteurs génétiques. La tâche qui nous incombe, pour comprendre les maladies multifactorielles, est d’identifier et d’observer les sub-phénotypes aux niveaux n et (n+1).
Cette approche générale peut être illustrée concrètement par le cas du diabète type-I. Il s’agit d’une maladie auto-immune. En descendant les niveaux d’organisation (l’auto-immunité peut être due soit à une déficience dans la sélection négative des lympohocytes auto-réactives dans le thymus ; soit à une déficience dans la sélection positive de lymphocytes « régulateurs » dans le thymus et/ou dans la périphérie ; soit à une hyper-susceptibilité de l’organe cible, à savoir les cellules _ du pancréas ; ces sous-catégories se sous-divisent encore), le nombre de loci impliqué dans chaque sub-phénotype ne peut que diminuer ; et on doit logiquement et systématiquement aboutir à l’identification des niveaux « (n+1) » et « n » tels que je les ai définis ci-dessus.
Cette approche, basée sur une synergie entre l’analyse génétique et une biologie capable d’articuler des multiples niveaux d’organisation, est donc conceptuellement faisable. Si elle est néanmoins difficile à appliquer immédiatement, c’est en raison du sous-développement regrettable de la physiologie du système immunitaire.]