Статистика
📐 Алгебра · 9 класс
Зачем нужна статистика
Статистика изучает, как собирать, обрабатывать и описывать числовые данные. Когда чисел много, отдельные значения мало о чём говорят, поэтому их сжимают в несколько характеристик: средние и меры разброса. Это помогает сравнивать наборы данных и делать выводы об изучаемом явлении.
Генеральная совокупность и выборка
Генеральная совокупность — это все объекты, которые нас интересуют (например, рост всех учеников страны). Изучить их целиком обычно невозможно, поэтому берут выборку — часть совокупности — и по ней судят о целом. Чтобы выводы были верными, выборка должна быть представительной, то есть отражать совокупность без перекоса.
Основные характеристики
| Характеристика | Что показывает | Как находят |
|---|---|---|
| Среднее арифметическое | типичное значение | сумма всех чисел делить на их количество |
| Мода | самое частое значение | значение, встречающееся чаще всего |
| Медиана | значение посередине | среднее по упорядоченному ряду |
| Размах | ширину разброса | наибольшее минус наименьшее |
| Дисперсия | меру разброса вокруг среднего | среднее квадратов отклонений от среднего |
Разбор примера
Задача: для ряда 4, 6, 6, 8, 11 найти среднее, моду и дисперсию.
Шаг 1. Среднее: (4 + 6 + 6 + 8 + 11)/5 = 35/5 = 7.
Шаг 2. Мода: чаще всего встречается 6, значит мода = 6.
Шаг 3. Отклонения от среднего:
4−7=−3; 6−7=−1; 6−7=−1; 8−7=1; 11−7=4.
Шаг 4. Квадраты отклонений: 9; 1; 1; 1; 16. Сумма = 28.
Шаг 5. Дисперсия = 28/5 = 5,6.
Ответ: среднее 7, мода 6, дисперсия 5,6.
Частые ошибки. Медиану ищут только в упорядоченном ряду — если ряд не отсортировать, ответ будет неверным. Дисперсию считают по квадратам отклонений; если складывать сами отклонения, сумма всегда даст ноль и смысла в этом нет.
Когда среднее обманывает
Среднее арифметическое удобно, но иногда оно вводит в заблуждение. Если в наборе есть одно очень большое значение, оно сильно «тянет» среднее вверх, хотя большинство данных совсем другие. Например, в ряду зарплат, где у одного человека доход в десять раз больше остальных, среднее окажется выше типичной зарплаты. В таких случаях надёжнее опираться на медиану: она показывает значение, которое делит упорядоченный ряд пополам, и не зависит от единичных выбросов.
Зачем нужна дисперсия
Два набора данных могут иметь одинаковое среднее, но сильно различаться по разбросу. Дисперсия как раз и измеряет, насколько значения отклоняются от среднего: чем она больше, тем сильнее данные разбросаны. Квадратный корень из дисперсии называют стандартным отклонением — оно выражено в тех же единицах, что и сами данные, поэтому его удобнее истолковывать. Малая дисперсия означает, что данные кучно собраны вокруг среднего, большая — что они сильно разбросаны.
Кратко о главном
- Генеральная совокупность — все объекты, выборка — изучаемая часть.
- Среднее арифметическое — сумма значений, делённая на их количество.
- Мода — самое частое значение, медиана — центральное в упорядоченном ряду.
- Размах показывает ширину разброса, дисперсия — разброс вокруг среднего.
- Дисперсию считают по квадратам отклонений от среднего.