آشنایی با ماژول آمار در زبان برنامه‌نویسی پایتون


ماژول statistics در زبان پایتون یک ماژول استاندارد است که توابع آماری پایه را برای داده‌های عددی فراهم می‌کند. این ماژول از نسخه‌ی 3.4 پایتون به بعد در دسترس است و برای تحلیل‌های آماری ساده بسیار مفید می‌باشد.


📌 توابع مرکزی و میانگین‌ها (Measures of Central Tendency)

تابعتوضیح
mean(data)میانگین حسابی: مجموع داده‌ها تقسیم بر تعداد آن‌ها.
fmean(data)میانگین حسابی دقیق‌تر و سریع‌تر: مشابه mean ولی با دقت اعشاری بیشتر و استفاده از float. (از نسخه 3.8+)
geometric_mean(data)میانگین هندسی: ریشه nام حاصل‌ضرب n مقدار. فقط برای داده‌های مثبت.
harmonic_mean(data)میانگین هارمونیک: n / (1/x₁ + 1/x₂ + ... + 1/xₙ). مناسب برای نرخ‌ها.
median(data)میانه: مقدار میانی داده‌های مرتب‌شده.
median_low(data)کوچک‌ترین مقدار میانه در صورت وجود دو میانه (در داده‌های زوج).
median_high(data)بزرگ‌ترین مقدار میانه در صورت وجود دو میانه.
median_grouped(data, interval=1)میانه گروهی: برای داده‌های دسته‌بندی‌شده. از میانگین بین گروه‌ها استفاده می‌کند.
mode(data)مد یا نما: بیشترین مقدار تکرارشده در داده‌ها. اگر داده‌ها چند مد داشته باشند، فقط اولین را برمی‌گرداند.
multimode(data)همه‌ی مقادیری که بیشترین تکرار را دارند (لیستی از مدها). (از نسخه 3.8+)

📊 توابع پراکندگی (Measures of Spread)

تابعتوضیح
pstdev(data, mu=None)انحراف معیار جمعیت: میزان پراکندگی کل جمعیت نسبت به میانگین.
pvariance(data, mu=None)واریانس جمعیت: مربع انحراف معیار جمعیت.
stdev(data, xbar=None)انحراف معیار نمونه: انحراف معیار برای نمونه‌ای از داده‌ها.
variance(data, xbar=None)واریانس نمونه: مربع انحراف معیار نمونه.

تفاوت pvariance و variance: در حالت نمونه، تقسیم بر (n-1) انجام می‌شود، ولی در حالت جمعیت، تقسیم بر n.


📌 توابع دیگر

تابعتوضیح
quantiles(data, *, n=4, method='exclusive')داده‌ها را به بخش‌های مساوی تقسیم می‌کند (مثل چارک‌ها). پیش‌فرض: 4 قسمت (چارک‌ها).
covariance(x, y)کوواریانس دو لیست عددی. از نسخه 3.10+.
correlation(x, y)ضریب همبستگی پیرسون بین دو لیست عددی. از نسخه 3.10+.
linear_regression(x, y)خروجی: یک شیء شامل شیب و عرض از مبدأ، نمایانگر خط رگرسیون خطی. قابل استفاده از نسخه ۳٫۱۰ به بعد.
NormalDistکلاس توزیع نرمال: شامل ابزارهای آماری برای کار با توزیع نرمال، مانند تابع چگالی احتمال (PDF)، تابع توزیع تجمعی (CDF)، و تولید نمونه‌ها. قابل استفاده از نسخه ۳٫۸ به بعد.

🎯 نمونه کد کوتاه از کاربرد ماژول آمار:

import statistics as stats

data = [2, 4, 4, 6, 8, 10]

print(stats.mean(data))
print(stats.median(data))
print(stats.mode(data))
print(stats.stdev(data))
print(stats.quantiles(data))
Python Program
Statistics Module.py

💻 اجرای کد:

5.666666666666667
5.0
4
2.943920288775949
[3.5, 5.0, 8.5]