P
pro·school.ru
Каталог школ

Статистика

📐 Алгебра · 9 класс

Зачем нужна статистика

Статистика изучает, как собирать, обрабатывать и описывать числовые данные. Когда чисел много, отдельные значения мало о чём говорят, поэтому их сжимают в несколько характеристик: средние и меры разброса. Это помогает сравнивать наборы данных и делать выводы об изучаемом явлении.

Генеральная совокупность и выборка

Генеральная совокупность — это все объекты, которые нас интересуют (например, рост всех учеников страны). Изучить их целиком обычно невозможно, поэтому берут выборку — часть совокупности — и по ней судят о целом. Чтобы выводы были верными, выборка должна быть представительной, то есть отражать совокупность без перекоса.

Основные характеристики

ХарактеристикаЧто показываетКак находят
Среднее арифметическоетипичное значениесумма всех чисел делить на их количество
Модасамое частое значениезначение, встречающееся чаще всего
Медианазначение посерединесреднее по упорядоченному ряду
Размахширину разбросанаибольшее минус наименьшее
Дисперсиямеру разброса вокруг среднегосреднее квадратов отклонений от среднего

Разбор примера

Задача: для ряда 4, 6, 6, 8, 11 найти среднее, моду и дисперсию. Шаг 1. Среднее: (4 + 6 + 6 + 8 + 11)/5 = 35/5 = 7. Шаг 2. Мода: чаще всего встречается 6, значит мода = 6. Шаг 3. Отклонения от среднего: 4−7=−3; 6−7=−1; 6−7=−1; 8−7=1; 11−7=4. Шаг 4. Квадраты отклонений: 9; 1; 1; 1; 16. Сумма = 28. Шаг 5. Дисперсия = 28/5 = 5,6. Ответ: среднее 7, мода 6, дисперсия 5,6.
Частые ошибки. Медиану ищут только в упорядоченном ряду — если ряд не отсортировать, ответ будет неверным. Дисперсию считают по квадратам отклонений; если складывать сами отклонения, сумма всегда даст ноль и смысла в этом нет.

Когда среднее обманывает

Среднее арифметическое удобно, но иногда оно вводит в заблуждение. Если в наборе есть одно очень большое значение, оно сильно «тянет» среднее вверх, хотя большинство данных совсем другие. Например, в ряду зарплат, где у одного человека доход в десять раз больше остальных, среднее окажется выше типичной зарплаты. В таких случаях надёжнее опираться на медиану: она показывает значение, которое делит упорядоченный ряд пополам, и не зависит от единичных выбросов.

Зачем нужна дисперсия

Два набора данных могут иметь одинаковое среднее, но сильно различаться по разбросу. Дисперсия как раз и измеряет, насколько значения отклоняются от среднего: чем она больше, тем сильнее данные разбросаны. Квадратный корень из дисперсии называют стандартным отклонением — оно выражено в тех же единицах, что и сами данные, поэтому его удобнее истолковывать. Малая дисперсия означает, что данные кучно собраны вокруг среднего, большая — что они сильно разбросаны.

Кратко о главном

  • Генеральная совокупность — все объекты, выборка — изучаемая часть.
  • Среднее арифметическое — сумма значений, делённая на их количество.
  • Мода — самое частое значение, медиана — центральное в упорядоченном ряду.
  • Размах показывает ширину разброса, дисперсия — разброс вокруг среднего.
  • Дисперсию считают по квадратам отклонений от среднего.