Processus de Markov à temps continu
En théorie des probabilités, un processus de Markov à temps continu, ou chaîne de Markov à temps continu est une variante à temps continu du processus de Markov. Plus précisément, c'est un modèle mathématique à valeur dans un ensemble dénombrable, les états, dans lequel le temps passé dans chacun des états est une variable aléatoire réelle positive, suivant une loi exponentielle.
Cet objet est utilisé pour modéliser l'évolution de certains systèmes, comme les files d'attente.
Idée générale
modifierUne chaîne de Markov à temps continu (Xt)t≥0 est un processus stochastique. Chaque Xt est une variable aléatoire qui indique dans quel état le système se trouve à l'instant t. Par exemple, il peut faire beau ou alors pleuvoir. Supposons qu'il fasse beau au début, autrement X0 = beau. Le processus reste pendant un moment dans l'état beau. Par exemple X0 = ... = X0.001... = X0.401... = X0.499... = beau. Puis par exemple, le processus change d'état au temps 0.5, et va dans l'état pluie. Le temps d'attente dans l'état beau suit une loi exponentielle (voir fonctions de densité dans la figure de droite) d'un certain paramètre. Là dans l'exemple, le temps d'attente était de 0.5. Puis le processus reste un moment dans l'état pluie X0.5 = ... = X0.656... = pluie.
Définitions formelles
modifierDans cette section, nous donnons d'abord les éléments qui permettent de caractériser une chaîne de Markov à temps continu. Puis nous donnerons plusieurs définitions équivalentes alternatives qui utilisent ces éléments pour définir le processus (Xt)t≥0.
Caractérisation
modifierUne chaîne de Markov est caractérisée par :
- un ensemble S fini ou dénombrable d'états ;
- une distribution initiale sur l'ensemble des états ;
- une matrice Q de taux de transition, aussi appelée générateur infinitésimal.
La matrice Q est de dimension |S|². Étant donnés deux états différents i ≠ j, les éléments qij de la matrice Q sont des réels positifs qui quantifient la vitesse de transition de l'état i vers l'état j. Les éléments qii sont choisis pour que les colonnes de chaque ligne somment à zéro, i.e.
- .
Définitions équivalentes
modifierIl existe plusieurs façons équivalentes de définir le processus (Xt)t≥0[1].
Définition infinitésimale
modifierSoit Xt la variable aléatoire décrivant l'état du processus au temps t. Pour tous t et h positifs, conditionnellement à {Xt = i}, Xt + h est indépendant de (Xs : s≤ t) et, pour h tendant vers 0, on a pour tout états i et j,
où δij vaut 1 si i=j et 0 sinon (il s'agit d'un delta de Kronecker), qij est l'élément à la ligne i et à la colonne j dans la matrice Q, et désigne une fonction négligeable devant (voir notation de Landau).
Définition par les sauts
modifierLe processus peut rester dans un état un certain temps puis changer d'état : on parle de saut. Soit Yn l'état du processus après son n-ième saut et Sn le temps passé dans l'état Yn. Alors (Yn)n≥0 est une chaîne de Markov à temps discret et, conditionnellement à (Y0, ..., Yn), les temps d'attente (S0, ..., Sn) sont des variables exponentielles indépendantes de paramètres respectifs .
Définition par les probabilités de transitions
modifierPour tous les instant t0, t1, ... et pour tous les états i0, i1, ... correspondants, on a
où pij est la fonction solution de l'équation de Kolmogorov (en) :
avec pour condition initiale P(0) = I, la matrice identité. La résolution de cette équation conduit alors à
Propriétés
modifierIrréductibilité
modifierUn état j est dit accessible à partir d'un autre état i (écrit i → j) s'il est possible d'obtenir j à partir de i. C'est-à-dire, si :
On dit d'un état i qu'il communique avec un état j (écrit i ↔ j) si i → j et j → i. Un ensemble d'états C est une classe communicante si chaque paire d'états dans C communiquent entre eux, et si aucun état dans C ne communique avec un état non-présent dans C. Puisque la communication est une relation d'équivalence, l'espace d'états S peut être partitionné en un ensemble de classes communicantes. Un processus de Markov à temps continu est irréductible si l'espace S entier est une classe communicante unique.
Pour tout et dans une même classe communicante C, on peut montrer (en utilisant des propriétés de sous-additivité) que la limite
existe et ne dépend ni de ni de ; on la note .
Par exemple, dans une chaîne où l'état 0 est absorbant, où les états {1,2,...} forment une classe communicante et où le système est absorbé par l'état 0 presque sûrement, la limite donne le taux d'absorption de la chaîne, parfois appelé paramètre de Kingman.
Autre exemple. Considérons la marche aléatoire sur l'ensemble des entiers relatifs dont le générateur est donné par , , et pour les autres indices. La matrice est une matrice de Toeplitz tridiagonale. Alors
On remarque que la limite est strictement négative si et nulle si .
Applications
modifierThéorie des files d'attente
modifierUn domaine d'application des processus de Markov à temps continu est la théorie des files d'attente. Par exemple une file M/M/1 (selon la notation de Kendall) est un modèle où un processeur doit traiter des requêtes, qui s'accumulent (dans l'ordre) dans une file d'attente. Les requêtes arrivent suivant une loi exponentielle de taux et le processeur les traite avec une loi exponentielle de taux . La chaîne sous-jacente est la suivante :
Et la matrice (générateur infinitésimal) de taux est :
Notes et références
modifier- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Continuous-time Markov chain » (voir la liste des auteurs).
- (Norris 1997, Théorème 2.8.2)
Bibliographie
modifier- P. Désesquelles : Les processus de Markov en biologie, sociologie, géologie, chimie, physique et applications industrielles. Ellipses, 2016.
- E. Pardoux : Processus de Markov et applications. Dunod, 2007.
- B. Sericola : Chaînes de Markov - Théorie, algorithmes et applications. Lavoisier, 2013.
- (en) J. R. Norris, Markov Chains, Cambridge University Press,
- J.F.C. Kingman : The exponential decay of Markov transition probabilities. Proc. London Math. Soc. (1963) 337-358.
Lien externe
modifierChapitre « Processus de Poisson » du cours de maîtrise « Modèles stochastiques » (2002) de Dominique Bakry sur le sujet, plus orienté vers la théorie de la mesure.