Что такое частота в статистике?

В статистике частота — это количественная мера, показывающая, сколько раз конкретное значение признака (так называемый «вариант») встречается в исследуемой совокупности данных (выборке). Это одно из базовых понятий, на котором строится первичный анализ и представление информации. Проще говоря, частота отвечает на вопрос: «Как часто это значение у нас встречается?».

Частота — это основа для построения таблиц, графиков (гистограмм, полигонов) и вычисления многих других статистических показателей.

Понятие частоты используется повсеместно: от анализа результатов социологических опросов и контроля качества продукции до обработки научных экспериментов и данных в машинном обучении.

Основные виды частот

В статистике принято различать два основных типа частот: абсолютную и относительную.

Абсолютная частота

Абсолютная частота (nᵢ) — это простое целое число, которое указывает, сколько раз вариант xᵢ появился в выборке. Это «сырой» подсчёт.

Пример: В опросе 30 человек о любимом цвете (красный, синий, зеленый) ответы распределились так: красный — 12, синий — 10, зеленый — 8. Здесь числа 12, 10 и 8 являются абсолютными частотами для каждого цвета.

Относительная частота (частость)

Относительная частота (wᵢ или fᵢ), которую также называют частостью, показывает долю или процент, которую составляет абсолютная частота данного варианта от общего объема выборки (N).

Она вычисляется по формуле: wᵢ = nᵢ / N.

Частость удобна для сравнения распределений, полученных из выборок разного размера. Её часто выражают в процентах, умножая на 100%.

Пример (продолжение): Для цвета «красный» относительная частота (частость) составит: 12 / 30 = 0.4 или 40%. Для «синего»: 10 / 30 ≈ 0.333 (33.3%), для «зеленого»: 8 / 30 ≈ 0.267 (26.7%). Сумма всех частостей всегда равна 1 (или 100%).

Как работать с частотами: вариационные ряды

Для упорядочивания данных и их частот используют вариационные ряды — таблицы, в которых варианты значений расположены в определенном порядке (возрастания или убывания) вместе с соответствующими частотами.

Различают:

  • Дискретный вариационный ряд: Составляется для признака, принимающего отдельные, изолированные значения (например, количество детей в семье: 0, 1, 2, 3).
  • Интервальный вариационный ряд: Составляется для непрерывного признака или признака с большим числом значений. Значения группируются в интервалы (например, доход: 0-20000 руб., 20001-40000 руб. и т.д.). Частота в этом случае показывает, сколько наблюдений попало в каждый интервал.

Пример таблицы (дискретный ряд)

Допустим, в группе из 25 студентов проверили количество правильно решенных задач (от 0 до 5). Результаты можно представить так:

Количество решенных задач (xᵢ)Абсолютная частота (nᵢ)Относительная частота (wᵢ)Относительная частота, %
020.088%
140.1616%
270.2828%
380.3232%
430.1212%
510.044%
Итого (Σ)251.00100%

Накопленная (кумулятивная) частота

Ещё одно важное производное понятие — накопленная частота. Она показывает, сколько наблюдений (или какая их доля) накопилось «сверху» или «снизу» до определенного значения.

Пример: В таблице выше накопленная абсолютная частота для значения «3 задачи» будет равна сумме частот для 0, 1, 2 и 3 задач: 2+4+7+8 = 21 студент. Это означает, что 3 задачи или меньше решили 21 человек из 25.

Где и зачем это применяется?

Понятие частоты является краеугольным камнем для:

  1. Построения графиков: Гистограммы, полигоны частот и кумуляты строятся именно на основе частот.
  2. Расчёта статистических показателей: Мода (наиболее часто встречающееся значение) определяется непосредственно по максимальной частоте. Медиана и среднее арифметическое для сгруппированных данных также вычисляются с использованием частот.
  3. Проверки гипотез: В статистических критериях (например, критерий хи-квадрат) сравниваются наблюдаемые частоты с теоретически ожидаемыми.
  4. Анализа распределений: Оценка того, соответствует ли распределение нормальному, равномерному или иному закону.
  5. Визуализации данных: Любые диаграммы (столбчатые, круговые) в первую очередь отображают частоты различных категорий.

Таким образом, частота — это не просто число, а инструмент, который превращает необработанные данные в структурированную информацию, готовую для глубокого анализа и интерпретации. Умение работать с частотами — первый и необходимый шаг в освоении статистической грамотности.

Источники