🧮ML গণিত গুরু
probability-statsসহজ11 মিনিট

Random Variables — র‍্যান্ডম ভেরিয়েবল

Random Variables

🛺

রিকশা ভাড়ার গল্প

ধর ভাই, তুই প্রতিদিন ফার্মগেট থেকে নিউমার্কেট রিকশায় যাস। কিন্তু প্রতিদিন ভাড়া একরকম না! সোমবার ২০ টাকা, মঙ্গলবার ৩০ টাকা (জ্যামের জন্য বেশি চাইল), বুধবার ২৫ টাকা, বৃহস্পতিবার ২০ টাকা, শুক্রবার ১৫ টাকা (ছুটির দিন, রাস্তা ফাঁকা)। তোর বন্ধু রহিম জিজ্ঞেস করল 'রিকশা ভাড়া কত?' তুই কী বলবি? Fixed কোনো answer দিতে পারবি না — কারণ ভাড়াটা random! কিন্তু তুই বলতে পারিস কোন ভাড়া কত chance-এ আসে।

এইটাই Random Variable, মামা! X = রিকশা ভাড়া — এইটা একটা variable যার value randomly change হয়, কিন্তু প্রতিটা value-র একটা probability আছে। X fixed কোনো number না, X হইল একটা function যেইটা random outcome-কে number-এ map করে। ML-এ data নিজেই random variable — প্রতিটা observation একটা realization!

সংজ্ঞা

Random Variable হইল একটা function যেইটা sample space-র প্রতিটা outcome-কে একটা real number-এ map করে। Discrete random variable-র value গণনাযোগ্য (countable), আর continuous random variable-র value যেকোনো real number হতে পারে।

Random Variable — Outcome থেকে Number-এ Mapping
\[X: S \rightarrow \mathbb{R}, \quad P(X = x) \text{ or } f_X(x)\]

ব্যাখ্যা

Discrete vs Continuous

Discrete: গোনা যায়। রিকশা ভাড়া ১৫, ২০, ২৫, ৩০ টাকা — নির্দিষ্ট কয়েকটা value। ডাইসের ফল ১-৬। Continuous: গোনা যায় না। তোর ঢাকায় অফিসে পৌঁছানোর exact সময় — ৪৫.৩২১ মিনিট, ৪৫.৩২২ মিনিট... অসীম possibilities!

\[\text{Discrete: } P(X = x_i), \quad \text{Continuous: } f_X(x)dx\]

PMF — Probability Mass Function

Discrete random variable-র জন্য PMF বলে প্রতিটা value-র probability কত। রিকশা ভাড়ার PMF: P(X=15)=0.2, P(X=20)=0.4, P(X=25)=0.2, P(X=30)=0.2। সব probability যোগ করলে ১ হয় — মামা, কিছু না কিছু তো হবেই!

\[\sum_{i} P(X = x_i) = 1, \quad P(X = x_i) \geq 0\]

PDF — Probability Density Function

Continuous random variable-র জন্য exact value-র probability = ০! কারণ অসীম possibilities। তাই density function ব্যবহার হয়। P(a ≤ X ≤ b) = curve-র নিচের area। মানে exact ৪৫ মিনিট লাগার probability ০, কিন্তু ৪৪-৪৬ মিনিটের মধ্যে লাগার probability calculate করা যায়!

\[P(a \leq X \leq b) = \int_a^b f_X(x) \, dx, \quad \int_{-\infty}^{\infty} f_X(x) \, dx = 1\]

CDF — Cumulative Distribution Function

CDF বলে X এর value কোনো number-র চেয়ে ছোট বা সমান হওয়ার probability কত। F(x) = P(X ≤ x)। রিকশা ভাড়া ২৫ বা তার কম হওয়ার chance? F(25) = P(X≤25) = P(15)+P(20)+P(25) = 0.8!

\[F_X(x) = P(X \leq x) = \begin{cases} \sum_{x_i \leq x} P(X = x_i) & \text{discrete} \\ \int_{-\infty}^{x} f_X(t) \, dt & \text{continuous} \end{cases}\]

রিকশা ভাড়ার Distribution

ফার্মগেট-নিউমার্কেট রিকশা ভাড়া X এর distribution: P(X=15)=0.2, P(X=20)=0.4, P(X=25)=0.2, P(X=30)=0.2। (a) এইটা valid PMF কিনা check কর। (b) ভাড়া ২০ টাকার বেশি হওয়ার probability কত? (c) CDF বানাও।

Step 1: Valid PMF Check

সব probability non-negative আর যোগফল = 1 কিনা দেখি

\[0.2 + 0.4 + 0.2 + 0.2 = 1.0 \quad \checkmark\]

Step 2: P(X > 20)

২০-এর বেশি মানে ২৫ বা ৩০

\[P(X > 20) = P(X=25) + P(X=30) = 0.2 + 0.2 = 0.4\]

Step 3: CDF বানাও

F(x) = P(X ≤ x) — ধাপে ধাপে যোগ করি

\[F(15) = 0.2, \quad F(20) = 0.6, \quad F(25) = 0.8, \quad F(30) = 1.0\]

Step 4: CDF থেকে Verify

P(X > 20) = 1 - F(20) = 1 - 0.6 = 0.4 — আগের answer match করে!

\[P(X > 20) = 1 - F(20) = 1 - 0.6 = 0.4 \quad \checkmark\]
উত্তর:

Valid PMF (যোগফল ১, সব non-negative)। ভাড়া ২০-র বেশি হওয়ার chance 40%। CDF: F(15)=0.2, F(20)=0.6, F(25)=0.8, F(30)=1.0।

ML-এ কোথায় লাগে?

💡

মনে রাখার ট্রিক

Random Variable মনে রাখ রিকশা দিয়া: রিকশা ভাড়া = Random Variable (X)। তুই জানিস না exact কত নিবে, কিন্তু জানিস ১৫-৩০ এর মধ্যে হবে। Discrete = রিকশা ভাড়া (গোনা যায়: ১৫, ২০, ২৫, ৩০)। Continuous = রিকশায় কত সময় লাগবে (exact বলা impossible)। PMF = প্রতিটা ভাড়ার chance chart, CDF = 'এত টাকা বা কম' হওয়ার chance!

#random-variable#discrete#continuous#pmf#pdf#cdf#distribution#sampling