পর্ব ১৭ · প্রোবাবিলিটি ও পরিসংখ্যান
Monte Carlo পদ্ধতি
Integration কঠিন? — random sample দিয়ে estimate করো।
শেখার লক্ষ্য
- MC estimator
- variance ও convergence
- MCMC ধারণা
পূর্বপ্রয়োজন
expectation, law of large numbers।
Estimator
Unbiased; variance σ²/N → error O(1/√N), dimension-নির্ভর নয় (curse of dimensionality উপশম)।
Variance reduction
Importance sampling: q থেকে sample, weight p/q। Control variate, antithetic — variance কমানোর কৌশল।
MCMC ও AI
Metropolis–Hastings, Gibbs — intractable posterior থেকে sample। Diffusion model-এর reverse process একধরনের learned Langevin MCMC; RL-এ policy gradient = MC estimator of ∇E[R]।