পর্ব ১৯ · মেশিন লার্নিং-এ ক্যালকুলাস

অপ্টিমাইজেশন → ML সেতু

কেন ML মূলত একটি optimization problem।

শেখার লক্ষ্য

loss, gradient descent, probability।

θ* = argmin_θ (1/N) ∑ ℓ(f_θ(xᵢ), yᵢ) + λ R(θ)

Loss = data fit term + regularizer।

Full gradient O(N) প্রতি step — বড় ডেটায় অসম্ভব। Minibatch unbiased estimate: noise injects exploration, escape saddle।

Train loss vs test loss-এর gap = generalization error। Bias-variance, Rademacher, PAC-Bayes — পরের পর্বে আরও।