اکتبر 27, 2025

Mahbod

نزدیک ترین همسایه

🧠 الگوریتم KNN — یکی از ساده‌ترین و قوی‌ترین الگوریتم‌های یادگیری ماشین

مقدمه

اگر تازه وارد دنیای یادگیری ماشین (Machine Learning) شدی، احتمالاً اسم الگوریتم KNN یا «نزدیک‌ترین همسایه‌ها» زیاد به گوشت خورده.
این الگوریتم از ساده‌ترین روش‌های طبقه‌بندی (Classification) و پیش‌بینی (Prediction) است که بدون نیاز به آموزش مدل پیچیده، فقط با تکیه بر شباهت داده‌ها تصمیم‌گیری می‌کند.

📘 مفهوم کلی الگوریتم KNN

KNN مخفف K-Nearest Neighbors به معنی “K همسایه‌ی نزدیک‌تر” است.
ایده‌ی اصلی این الگوریتم خیلی ساده است:

وقتی می‌خواهیم برچسب (label) یک نقطه‌ی جدید را پیش‌بینی کنیم، به داده‌های اطرافش نگاه می‌کنیم و براساس رأی اکثریت همسایه‌های نزدیک، تصمیم می‌گیریم.

به زبان ساده، اگر بیشتر همسایه‌های اطراف یک نقطه از کلاس “مثبت” باشند، احتمال زیادی دارد که خود آن نقطه هم “مثبت” باشد.

⚙️ مراحل اجرای الگوریتم KNN

مقدار K را انتخاب می‌کنیم (مثلاً 3 یا 5)
برای داده‌ی جدید، فاصله‌ی آن را با تمام نقاط موجود در دیتاست محاسبه می‌کنیم (معمولاً با فاصله اقلیدسی)
K تا از نزدیک‌ترین نقاط را پیدا می‌کنیم
از بین آن‌ها، کلاس پرتکرارتر را به عنوان خروجی انتخاب می‌کنیم

📏 فرمول فاصله اقلیدسی

اگر دو نقطه‌ی داده‌ای به شکل زیر باشند:

[
A(x_1, y_1), \quad B(x_2, y_2)
]

فاصله‌ی بین آن‌ها برابر است با:

[
d = \sqrt{(x_1 – x_2)^2 + (y_1 – y_2)^2}
]

🧩 انتخاب مقدار K مناسب

انتخاب مقدار K خیلی مهم است:

اگر K خیلی کوچک باشد → مدل نویزی و حساس به داده‌های اشتباه می‌شود.
اگر K خیلی بزرگ باشد → مدل بیش از حد کلی‌سازی می‌کند.

به طور معمول، مقدار K فرد انتخاب می‌شود (مثلاً 3، 5 یا 7) تا در رأی‌گیری، مساوی نشود.

🧠 مثال ساده

فرض کنید می‌خواهیم تصمیم بگیریم که یک فرد، بر اساس قد و وزنش، ورزشکار است یا نه.
اگر داده‌ی جدید به افرادی نزدیک‌تر باشد که ورزشکارند، مدل هم پیش‌بینی می‌کند او ورزشکار است.

💻 پیاده‌سازی ساده با Python

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# بارگذاری دیتاست معروف Iris
data = load_iris()
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.2, random_state=42)

# ساخت مدل KNN با k=3
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# پیش‌بینی و ارزیابی
y_pred = knn.predict(X_test)
print("دقت مدل:", accuracy_score(y_test, y_pred))

📈 خروجی نمونه:

دقت مدل: 0.97

✅ مزایا و معایب KNN

مزایا	معایب
ساده و قابل درک	سرعت پایین در داده‌های زیاد
بدون نیاز به آموزش مدل	حساس به داده‌های نویزی
مناسب برای داده‌های کوچک	نیاز به نرمال‌سازی ویژگی‌ها

🧭 جمع‌بندی

الگوریتم KNN یکی از بهترین نقطه‌های شروع برای ورود به دنیای یادگیری ماشین است.
با وجود سادگی‌اش، در مسائل واقعی (مثل تشخیص دست‌خط، توصیه‌گرها، یا تشخیص بیماری) کاربردهای زیادی دارد.

اگر تازه شروع کردی، توصیه می‌شود KNN را با داده‌های خودت تمرین کنی و تأثیر مقدار K و نوع فاصله را بررسی کنی.

Ai Ba Ma

الگوریتم K-nn چیست؟

🧠 الگوریتم KNN — یکی از ساده‌ترین و قوی‌ترین الگوریتم‌های یادگیری ماشین

مقدمه

📘 مفهوم کلی الگوریتم KNN

⚙️ مراحل اجرای الگوریتم KNN

📏 فرمول فاصله اقلیدسی

🧩 انتخاب مقدار K مناسب

🧠 مثال ساده

💻 پیاده‌سازی ساده با Python

✅ مزایا و معایب KNN

🧭 جمع‌بندی

دیدگاهتان را بنویسید لغو پاسخ

یک پاسخ به “الگوریتم K-nn چیست؟”

About Me

Chesung Subba

Follow Me