🧮ML গণিত গুরু
probability-statsমাঝারি14 মিনিট

Bayes Theorem — বেইজের সূত্র

Bayes Theorem

🏥

ডাক্তার আর COVID টেস্টের গল্প

ধর ভাই, ঢাকায় COVID-এর সময়। তোর গলা ব্যথা, তুই ল্যাবে গেলি টেস্ট করাতে। রিপোর্ট আসল — Positive! তুই ভয়ে কাঁপতেছিস। কিন্তু তোর ডাক্তার মামা (পুরান ঢাকার ফেমাস ডাক্তার) শান্ত গলায় বলল 'ঘাবড়াস না মিয়া। এই টেস্টের accuracy 99% ঠিকই, কিন্তু ঢাকায় আসলে COVID আছে মাত্র 1% মানুষের। তোর actually COVID হওয়ার chance মাত্র 50%!' তুই অবাক — 99% accurate test, তাও 50% chance? ডাক্তার মামা বলল 'এইটাই Bayes Theorem-এর ম্যাজিক, বাবা!'

এইটাই Bayes Theorem, মামা! Test positive আসছে — এইটা evidence। কিন্তু actual probability বাইর করতে তোকে prior probability (আগে থেকে কত % মানুষের COVID) আর test-এর accuracy — দুইটাই consider করতে হবে। P(COVID | Positive) = P(Positive | COVID) × P(COVID) / P(Positive)। Prior কে evidence দিয়া update করাই Bayes-এর কাজ!

সংজ্ঞা

Bayes Theorem conditional probability-কে 'উল্টায়া' দেয়। P(A|B) জানা থাকলে P(B|A) বাইর করা যায়, অথবা prior belief কে নতুন evidence দিয়া update করা যায়। ML-এর backbone এই theorem।

Bayes Theorem — Posterior = (Likelihood × Prior) / Evidence
\[P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}\]

ব্যাখ্যা

Prior, Likelihood, Posterior কী?

Prior P(A) = নতুন data দেখার আগে তোর বিশ্বাস। ঢাকায় 1% মানুষের COVID — এইটা prior। Likelihood P(B|A) = COVID থাকলে test positive আসার chance = 99%। Posterior P(A|B) = test positive আসার পরে actually COVID হওয়ার chance। Evidence P(B) = যেকোনোভাবে test positive আসার overall chance।

\[\underbrace{P(A|B)}_{\text{Posterior}} = \frac{\overbrace{P(B|A)}^{\text{Likelihood}} \cdot \overbrace{P(A)}^{\text{Prior}}}{\underbrace{P(B)}_{\text{Evidence}}}\]

Evidence (P(B)) কিভাবে Calculate করি?

P(B) বাইর করতে Law of Total Probability লাগে। Test positive আসতে পারে দুইভাবে: (১) সত্যিই COVID আছে আর test ধরছে, (২) COVID নাই কিন্তু test ভুল করছে (false positive)। দুইটা path-ই consider করতে হবে।

\[P(B) = P(B|A) \cdot P(A) + P(B|A^c) \cdot P(A^c)\]

Base Rate Fallacy

এইটা মানুষের common ভুল — test-এর accuracy দেখে ভাবে 99% sure COVID আছে। কিন্তু base rate (prior) ignore করে! যদি 1% মানুষের COVID থাকে, তাইলে 99% accurate test-ও অনেক false positive দেয়। ঢাকার ডাক্তার মামা এই fallacy-টা ভালো বুঝে!

\[\text{High accuracy} \neq \text{High posterior if prior is low!}\]

Bayesian Update — বারবার Update করা

Bayes Theorem-র আসল power হইল iterative update। আজকের posterior কালকের prior হয়। নতুন evidence আসলে আবার update। ঢাকার আবহাওয়া ভবিষ্যদ্বাণীও এইভাবে কাজ করে — প্রতি ঘণ্টায় নতুন data আসে, prediction update হয়।

\[P(A|B_1, B_2) \propto P(B_2|A) \cdot P(A|B_1)\]

COVID Test — ডাক্তার মামার Calculation

ঢাকায় 1% মানুষের COVID আছে। একটা test-এর sensitivity 99% (COVID থাকলে positive আসে) আর specificity 99% (COVID না থাকলে negative আসে)। তোর test positive আসছে — actually COVID হওয়ার probability কত?

Step 1: Given তথ্য সাজাও

P(COVID) = 0.01 (prior), P(+|COVID) = 0.99 (sensitivity), P(-|No COVID) = 0.99 (specificity), তাই P(+|No COVID) = 0.01 (false positive rate)

\[P(C) = 0.01, \quad P(+|C) = 0.99, \quad P(+|C^c) = 0.01\]

Step 2: Evidence P(+) Calculate কর

Total probability of positive = COVID থাকলে positive + COVID না থাকলে false positive

\[P(+) = P(+|C) \cdot P(C) + P(+|C^c) \cdot P(C^c) = 0.99 \times 0.01 + 0.01 \times 0.99 = 0.0198\]

Step 3: Bayes Theorem Apply কর

Posterior = Likelihood × Prior ÷ Evidence

\[P(C|+) = \frac{P(+|C) \cdot P(C)}{P(+)} = \frac{0.99 \times 0.01}{0.0198} = \frac{0.0099}{0.0198} = 0.5\]

Step 4: ব্যাখ্যা

99% accurate test দিয়াও positive আসলে actually COVID-এর chance মাত্র 50%! কারণ base rate মাত্র 1%। 99 জন healthy মানুষের মধ্যে ~1 জনেও false positive আসে, আর 1 জন actual COVID patient-এরও positive আসে। তাই 50-50!

উত্তর:

P(COVID | Positive) = 0.5 বা 50%। 99% accurate test-এও positive মানে 50% chance! এই জন্যই ডাক্তার মামা বলছে 'ঘাবড়াস না' — base rate low হইলে false positive অনেক বেশি হয়!

ML-এ কোথায় লাগে?

💡

মনে রাখার ট্রিক

Bayes মনে রাখ ঢাকার ডাক্তারের style-এ: 'আগে কী ভাবতি (Prior) × নতুন কী দেখলি (Likelihood) ÷ overall কত chance (Evidence) = এখন কী ভাবিস (Posterior)'। আর Base Rate Fallacy মনে রাখ — ঢাকায় যদি মাত্র 1% মানুষ ক্রিকেটার হয়, তাইলে তুই bat ধইরা পোজ দিলেই তোকে ক্রিকেটার ভাবার কোনো মানে নাই!

#bayes-theorem#prior#posterior#likelihood#evidence#base-rate-fallacy#bayesian-inference#bayesian-optimization