পর্ব ১৭ · প্রোবাবিলিটি ও পরিসংখ্যান

Monte Carlo পদ্ধতি

Integration কঠিন? — random sample দিয়ে estimate করো।

শেখার লক্ষ্য

  • MC estimator
  • variance ও convergence
  • MCMC ধারণা

পূর্বপ্রয়োজন

expectation, law of large numbers।

Estimator

E[f(X)] ≈ (1/N) ∑ f(xᵢ), xᵢ ∼ p

Unbiased; variance σ²/N → error O(1/√N), dimension-নির্ভর নয় (curse of dimensionality উপশম)।

Variance reduction

Importance sampling: q থেকে sample, weight p/q। Control variate, antithetic — variance কমানোর কৌশল।

MCMC ও AI

Metropolis–Hastings, Gibbs — intractable posterior থেকে sample। Diffusion model-এর reverse process একধরনের learned Langevin MCMC; RL-এ policy gradient = MC estimator of ∇E[R]।