ماژول statistics در زبان پایتون یک ماژول استاندارد است که توابع آماری پایه را برای دادههای عددی فراهم میکند. این ماژول از نسخهی 3.4 پایتون به بعد در دسترس است و برای تحلیلهای آماری ساده بسیار مفید میباشد.
📌 توابع مرکزی و میانگینها (Measures of Central Tendency)
| تابع | توضیح |
mean(data) | میانگین حسابی: مجموع دادهها تقسیم بر تعداد آنها. |
fmean(data) | میانگین حسابی دقیقتر و سریعتر: مشابه mean ولی با دقت اعشاری بیشتر و استفاده از float. (از نسخه 3.8+) |
geometric_mean(data) | میانگین هندسی: ریشه nام حاصلضرب n مقدار. فقط برای دادههای مثبت. |
harmonic_mean(data) | میانگین هارمونیک: n / (1/x₁ + 1/x₂ + ... + 1/xₙ). مناسب برای نرخها. |
median(data) | میانه: مقدار میانی دادههای مرتبشده. |
median_low(data) | کوچکترین مقدار میانه در صورت وجود دو میانه (در دادههای زوج). |
median_high(data) | بزرگترین مقدار میانه در صورت وجود دو میانه. |
median_grouped(data, interval=1) | میانه گروهی: برای دادههای دستهبندیشده. از میانگین بین گروهها استفاده میکند. |
mode(data) | مد یا نما: بیشترین مقدار تکرارشده در دادهها. اگر دادهها چند مد داشته باشند، فقط اولین را برمیگرداند. |
multimode(data) | همهی مقادیری که بیشترین تکرار را دارند (لیستی از مدها). (از نسخه 3.8+) |
📊 توابع پراکندگی (Measures of Spread)
| تابع | توضیح |
pstdev(data, mu=None) | انحراف معیار جمعیت: میزان پراکندگی کل جمعیت نسبت به میانگین. |
pvariance(data, mu=None) | واریانس جمعیت: مربع انحراف معیار جمعیت. |
stdev(data, xbar=None) | انحراف معیار نمونه: انحراف معیار برای نمونهای از دادهها. |
variance(data, xbar=None) | واریانس نمونه: مربع انحراف معیار نمونه. |
تفاوت pvariance و variance: در حالت نمونه، تقسیم بر (n-1) انجام میشود، ولی در حالت جمعیت، تقسیم بر n.
📌 توابع دیگر
| تابع | توضیح |
quantiles(data, *, n=4, method='exclusive') | دادهها را به بخشهای مساوی تقسیم میکند (مثل چارکها). پیشفرض: 4 قسمت (چارکها). |
covariance(x, y) | کوواریانس دو لیست عددی. از نسخه 3.10+. |
correlation(x, y) | ضریب همبستگی پیرسون بین دو لیست عددی. از نسخه 3.10+. |
linear_regression(x, y) | خروجی: یک شیء شامل شیب و عرض از مبدأ، نمایانگر خط رگرسیون خطی. قابل استفاده از نسخه ۳٫۱۰ به بعد. |
NormalDist | کلاس توزیع نرمال: شامل ابزارهای آماری برای کار با توزیع نرمال، مانند تابع چگالی احتمال (PDF)، تابع توزیع تجمعی (CDF)، و تولید نمونهها. قابل استفاده از نسخه ۳٫۸ به بعد. |
🎯 نمونه کد کوتاه از کاربرد ماژول آمار:
import statistics as stats
data = [2, 4, 4, 6, 8, 10]
print(stats.mean(data))
print(stats.median(data))
print(stats.mode(data))
print(stats.stdev(data))
print(stats.quantiles(data))
💻 اجرای کد:
5.666666666666667
5.0
4
2.943920288775949
[3.5, 5.0, 8.5]