Bayes Theorem — বেইজের সূত্র
Bayes Theorem
ডাক্তার আর COVID টেস্টের গল্প
ধর ভাই, ঢাকায় COVID-এর সময়। তোর গলা ব্যথা, তুই ল্যাবে গেলি টেস্ট করাতে। রিপোর্ট আসল — Positive! তুই ভয়ে কাঁপতেছিস। কিন্তু তোর ডাক্তার মামা (পুরান ঢাকার ফেমাস ডাক্তার) শান্ত গলায় বলল 'ঘাবড়াস না মিয়া। এই টেস্টের accuracy 99% ঠিকই, কিন্তু ঢাকায় আসলে COVID আছে মাত্র 1% মানুষের। তোর actually COVID হওয়ার chance মাত্র 50%!' তুই অবাক — 99% accurate test, তাও 50% chance? ডাক্তার মামা বলল 'এইটাই Bayes Theorem-এর ম্যাজিক, বাবা!'
এইটাই Bayes Theorem, মামা! Test positive আসছে — এইটা evidence। কিন্তু actual probability বাইর করতে তোকে prior probability (আগে থেকে কত % মানুষের COVID) আর test-এর accuracy — দুইটাই consider করতে হবে। P(COVID | Positive) = P(Positive | COVID) × P(COVID) / P(Positive)। Prior কে evidence দিয়া update করাই Bayes-এর কাজ!
সংজ্ঞা
Bayes Theorem conditional probability-কে 'উল্টায়া' দেয়। P(A|B) জানা থাকলে P(B|A) বাইর করা যায়, অথবা prior belief কে নতুন evidence দিয়া update করা যায়। ML-এর backbone এই theorem।
ব্যাখ্যা
Prior, Likelihood, Posterior কী?
Prior P(A) = নতুন data দেখার আগে তোর বিশ্বাস। ঢাকায় 1% মানুষের COVID — এইটা prior। Likelihood P(B|A) = COVID থাকলে test positive আসার chance = 99%। Posterior P(A|B) = test positive আসার পরে actually COVID হওয়ার chance। Evidence P(B) = যেকোনোভাবে test positive আসার overall chance।
Evidence (P(B)) কিভাবে Calculate করি?
P(B) বাইর করতে Law of Total Probability লাগে। Test positive আসতে পারে দুইভাবে: (১) সত্যিই COVID আছে আর test ধরছে, (২) COVID নাই কিন্তু test ভুল করছে (false positive)। দুইটা path-ই consider করতে হবে।
Base Rate Fallacy
এইটা মানুষের common ভুল — test-এর accuracy দেখে ভাবে 99% sure COVID আছে। কিন্তু base rate (prior) ignore করে! যদি 1% মানুষের COVID থাকে, তাইলে 99% accurate test-ও অনেক false positive দেয়। ঢাকার ডাক্তার মামা এই fallacy-টা ভালো বুঝে!
Bayesian Update — বারবার Update করা
Bayes Theorem-র আসল power হইল iterative update। আজকের posterior কালকের prior হয়। নতুন evidence আসলে আবার update। ঢাকার আবহাওয়া ভবিষ্যদ্বাণীও এইভাবে কাজ করে — প্রতি ঘণ্টায় নতুন data আসে, prediction update হয়।
COVID Test — ডাক্তার মামার Calculation
ঢাকায় 1% মানুষের COVID আছে। একটা test-এর sensitivity 99% (COVID থাকলে positive আসে) আর specificity 99% (COVID না থাকলে negative আসে)। তোর test positive আসছে — actually COVID হওয়ার probability কত?
Step 1: Given তথ্য সাজাও
P(COVID) = 0.01 (prior), P(+|COVID) = 0.99 (sensitivity), P(-|No COVID) = 0.99 (specificity), তাই P(+|No COVID) = 0.01 (false positive rate)
Step 2: Evidence P(+) Calculate কর
Total probability of positive = COVID থাকলে positive + COVID না থাকলে false positive
Step 3: Bayes Theorem Apply কর
Posterior = Likelihood × Prior ÷ Evidence
Step 4: ব্যাখ্যা
99% accurate test দিয়াও positive আসলে actually COVID-এর chance মাত্র 50%! কারণ base rate মাত্র 1%। 99 জন healthy মানুষের মধ্যে ~1 জনেও false positive আসে, আর 1 জন actual COVID patient-এরও positive আসে। তাই 50-50!
P(COVID | Positive) = 0.5 বা 50%। 99% accurate test-এও positive মানে 50% chance! এই জন্যই ডাক্তার মামা বলছে 'ঘাবড়াস না' — base rate low হইলে false positive অনেক বেশি হয়!
ML-এ কোথায় লাগে?
মনে রাখার ট্রিক
Bayes মনে রাখ ঢাকার ডাক্তারের style-এ: 'আগে কী ভাবতি (Prior) × নতুন কী দেখলি (Likelihood) ÷ overall কত chance (Evidence) = এখন কী ভাবিস (Posterior)'। আর Base Rate Fallacy মনে রাখ — ঢাকায় যদি মাত্র 1% মানুষ ক্রিকেটার হয়, তাইলে তুই bat ধইরা পোজ দিলেই তোকে ক্রিকেটার ভাবার কোনো মানে নাই!