「マルコフ連鎖」の版間の差分
削除された内容 追加された内容
m ロボットによる 変更: es:Cadena de Markov |
m 曖昧さ回避ページ有限へのリンクを解消、リンク先を有限集合に変更(DisamAssist使用) |
||
(31人の利用者による、間の37版が非表示) | |||
1行目:
{{出典の明記|date=2018年1月}}
'''マルコフ連鎖'''(マルコフれんさ、{{lang-en-short|Markov chain}})とは、[[確率過程]]の一種である[[マルコフ過程]]のうち、とりうる状態が離散的([[有限集合|有限]]または[[可算]])なもの(離散状態マルコフ過程)をいう。また特に、[[時間]]が離散的なもの(時刻は添え字で表される)を指すことが多い
==定義==
マルコフ連鎖は、一連の[[確率変数]] ''X''<sub>1</sub>, ''X''<sub>2</sub>, ''X''<sub>3</sub>, ... で、現在の状態が決まっていれば、過去および未来の状態は[[独立
:<math>\Pr(X_{n+1}=x|X_n=x_n, \ldots, X_1=x_1, X_0=x_0) =
33 ⟶ 34行目:
時刻''n'' での状態に関する確率([[周辺確率]])は次のように書ける:
: <math> \Pr(X_{n}=j) = \sum_{r \in S} p_{rj} \Pr(X_{n-1}=r) = \sum_{r \in S} p_{rj}^{(n)} \Pr(X_0=r)</math>
ここで右上付き添え字 <math>(n)</math> は整数値である。もしマルコフ連鎖が時間に対して定常的ならば、この添え字は"n乗"という意味にとってもよい(下記参照)。
52 ⟶ 53行目:
形式的には、ある状態の周期は次のように定義される:
: <math> k = \operatorname{gcd}\{ n: \Pr(X_n = i | X_0 = i) > 0\}</math>
(ここで "gcd" は[[最大公約数]]のこと)
66 ⟶ 67行目:
として、「''T<sub>i</sub>'' が有限でない」確率が 0 でないならば、状態''i'' は一時的である:
: <math> \Pr(T_i < \infty) < 1</math>
状態''i'' は、一時的でない(状態iからiに戻る確率 1 で有限な到達時間を持つ)ならば、'''再帰的'''(recurrentまたはpersistent)という。
到達時間が有限でも、その[[平均値]]が有限であるとは限らない。
99 ⟶ 100行目:
==有限状態マルコフ連鎖==
状態空間が有限ならば、遷移確率分布は[[行列]]で表現され、これは'''遷移行列'''(transition matrix)と呼ばれる。この行列'''P'''の第(''i'', ''j'')要素は
:<math>p_{ij} = \Pr(X_{n+1}=j\mid X_n=i) \,</math>
117 ⟶ 118行目:
:<math>\lim_{k\rightarrow\infty}\mathbf{P}^k=\mathbf{1}\pi</math>
(ここで'''1'''はすべての成分が1である列ベクトル)となる([[ペロン・フロベニウスの定理]])。つまり、時間が経つにつれてマルコフ連鎖は、初期分布に関わりなく、定常分布に収束するということである。
マルコフ連鎖は、次で示される''π'':
123 ⟶ 124行目:
:<math>\pi_i p_{i,j} = \pi_j p_{j,i}</math>
が存在するならば、'''可逆'''(reversible)であるという。可逆マルコフ連鎖では、''π'' は常に定常分布である。
マルコフ連鎖の特別な場合で、遷移確率行列の行がすべて同じであるものを、[[ベルヌーイ系]](Bernoulli scheme)という。これは次の状態が現在の状態からも独立ということである。さらに可能な状態が2つしかないベルヌーイ系が、[[ベルヌーイ過程]]([[ベルヌーイ試行]]を連続して行うもの)である。
134 ⟶ 135行目:
ただしここで''o(h)'' とは、''h'' が0となる極限で''h'' より速く0に近づく項を表す。またここで''h'' = 1とおけば、普通のマルコフ連鎖と同じ形になる。
この連続時間マルコフ過程から離散的に取り出した系列が、連続時間マルコフ連鎖である。
==N階マルコフ連鎖と単純マルコフ連鎖==
155行目:
マルコフ連鎖はまた[[待ち行列理論]]や[[統計学]]でモデル化に用いられる。
[[クロード・シャノン]]が[[情報理論]]を創始した論文"A mathematical theory of communication"([[通信の数学的理論]])では、マルコフ連鎖を利用して[[エントロピー]]の概念を導入している。さらにこのような方法は、[[データ圧縮]]や[[パターン認識]]に応用されている。
マルコフ連鎖は[[強化学習]]でも重要である。
162行目:
遷移確率が初め不明でデータからそれを見積らなければならない場合には、[[隠れマルコフモデル]]が用いられ、これは[[音声認識]]や[[バイオインフォマティクス]]([[塩基配列]]からの[[遺伝子]]の探索など)にも広く用いられている。
==脚注==
===注釈===
{{Notelist}}
== 関連項目 ==
* [[マルコフ過程]]
* [[マルコフ決定過程]]
* [[マルコフ再生過程]]
* [[マルコフ連鎖モンテカルロ法]]
* [[アンドレイ・マルコフ]]
* [[隠れマルコフモデル]]
* [[人工知能]]
* [[ベイズの定理]]
* [[
== 外部リンク ==
{{DEFAULTSORT:まるこふれんさ}}▼
* {{MathWorld|title=Markov Chain|urlname=MarkovChain}}
{{確率論}}
{{Normdaten}}
[[Category:確率論]]
[[Category:アンドレイ・マルコフ]]
[[Category:数学のエポニム]]
[[Category:数学に関する記事]]
|