Статистическая обработка результатов
При установлении нормативов по влажности теста, упеку, а также по оценке эффективности применении улучшителей и при проверке дозировочной аппаратуры, делителей теста и другого обордования получаемые результаты требуют математической обработки. Цифровые данные позволяют показать точность используемого метода, степень варьирования изучаемого показателя, достоверность получаемых данных. Поэтому в настоящее время в производстве все шире начинают применять методы статистической обработки результатов. Наиболее простые и распространенные методы приведены ниже.
Ошибка измерения
Точность метода характеризуется величиной случайной ошбибки.
Эта величина должна быть известна наряду с чувствительностью метода, так как иногда применяют методы, точность которых меньше подлежащих изучению значений. Например, нельзя измерять массу хлеба с точность до 1 г на весах, точность которых равна ±10 г.
Случайная погрешность метода характеризуется величиной квадратичной ошибки измерения σ. В 2/3 случаев погрешность метода не превышает значение σ, а в 95% случаев — удвоенной величины.
Определение квадратичной ошибки измерения можно вести двумя способами.
Первый способ. Например, определяют содержание сахара в одной и той же пробе с 10 повторностями (табл. 1).
Находят среднее арифметическое М = 6,09%. Вычисляют отклонение (α) каждого измерения от М, не обращая внимания на знаки. Возводят отклонение в квадрат (α2) и находят сумму квадратов отклонений
Следовательно, абсолютная величина квадратичной ошибки одного определения сахара вхлебных изделиях равна ± 0,13%, или относительная ошибка коэффициента вариации
Второй способ. Можно вычислить квадратичную ошибку измерения в результате параллельных измерений, произведенных при анализе различных сортов хлебных изделий. В ряде случаев этот способ предпочтительнее первого.
Например, сделано 10 параллельных определений содержания сахара в различных сортах хлебобулочных изделий (табл.2).
Отклонение (α) между результатами параллельных проб находят, не обращая внимания на знаки. Возводят отклонение в квадрат (α2) и находят сумму квадратов отклонений между результатами параллельных проб: ∑α2=0,51.
Квадратичная ошибка одиночного измерения равна
При таком способе определения ошибки, варьирование величин, измеряемых по разным сортам изделий, не оказывает существенного влияния на результаты,так как при расчете учитывается лишь разница между результатами параллельных проб.
Знание величины ошибки измерения имеет значение для выбора метода исследования, оценки результатов и их записи. Результаты измерений записывают с таким количеством знаков, которое отвечает точности измерения, т. е. предпоследний знак должен быть точным, а последний сомнительным. Не следует результаты измерений рассчитывать с излишней недостоверной точностью.
Часто результаты измерений рассчитывают с излишней точностью.
Например, влажность изделий определяют взвешиванием до 0,01 г. При вычислении процента разницу между взвешиваниями, выраженную с точностью до 0,01 г, умножают на 100 и таким образом в расчетах точным является знак перед запятой, а знак после запятой является сомнительным, следовательно, влажность, определяемую на технических весах, следует выражать только с точностью до десятых долей процента.
При округлении пользуются следующим правилом: при цифрах следующего порядка от 1 до 4 их просто отбрасывают, а при цифрах от 6 до 9 их отбрасывают, но прибавляют единицу к цифре предыдущего порядка, при цифре 5 прибавляют единицу к цифре предыдущего порядка, если она нечетная, и ничего не прибавляют, если она четная.
Если измерения проводились все время с одинаковой точностью, например до ±0,01 г, то результаты следует записывать до двух знаков после запятой. Нельзя отбрасывать значащие нули. При постоянстве метода измерения все цифры в таблице должны быть приведены с одинаковой степенью точности.
Средняя арифметическая величина и квадратичное отклонение
Среднеарифметическая величина М недостаточно полно характеризует исследуемый показатель. Принято вариационный ряд, полученный в результате измерений, характеризовать квадратичным (стандартным, основным) отклонением а и коэффициентом вариации и (в%).
Например, содержание сахара по табл. 1 6,05; 6,25; 6,0 и т. д. По первому способу определения ошибки измерений М = 6,09%, а=±0,13%, и = 2,1 %.
По этим данным, на основании правил статистики, можно считать, что в 2/з случаев (68%) содержание сахара варьирует в пределах 5,96—6,22% (М±σ), а в 95% случаев — в пределах 5,84— 6,34% (М±2σ).
Из приведенного примера видно, что при помощи средней арифметической величины и квадратичного отклонения можно кратко, но достаточно наглядно и полно представлять результаты многочисленных наблюдений, не загромождая материал излишними цифрами и таблицами.
Определение достоверности различий
Для определения достоверности результатов ряда полученных данных вычисляют среднюю величину ошибки (m), которая уменьшается пропорционально корню квадратному из числа наблюдений (n).
Вычисление m из значения среднего квадратичного отклонения (σ) и числа измерений (n) производят по формуле
Наибольшее распространение получил способ обработки немногочисленных наблюдений при помощи так называемых таблиц t, предложенных Стьюдентом. Этот способ позволяет вычислить степень достоверности различий при небольшом числе измерений на основании значений М, σ, m и n.
Сначала рассчитывают значение средних арифметических (М) для каждой группы. На основе М вычисляют величины квадратичных отклонений (σ) для каждой группы.
По значению σ и числу опытов (n) вычисляют среднюю ошибку (m).
Из значений М и m определяют показатель существенной разницы (t), т. е. число, показывающее, во сколько раз разность между средними арифметическими величинами больше значения корня квадратного из суммы квадратов средних ошибок:
На основании величины t и числа наблюдений по таблице определяют вероятность совпадения (или различия) (Р). При пользовании таблицей из числа опытов (n) вычисляют степень свободы (n'). При сравнении двух рядов
где n1 и n2 — числа вариантов в рядах.
Например, при испытании улучшителя типа Т2 получены следующие данные по объемному выходу хлеба на 100 г муки (табл. 3).
По табл. 4 на основании n'=18 находим, что наибольшее значение t равно 3,92, следовательно, Р при этом равно 0,001, а при t = 8,8 величина Р будет еще меньше, т. е. достоверность получения более высокого объемного выхода хлеба при введении улучшителя Т2 больше 99,9%.
Коэффициент корреляции
В ряде случаев необходимо определить степень взаимосвязи между двумя признаками и количественно выразить достоверность связи.
Для этого вычисляют коэффициент корреляции. Коэффициент парной линейной корреляции между признаками вычисляют по формуле
Среднюю квадратичную ошибку коэффициента корреляции считывают по формуле
Например, качество клейковины определяли по показателю растяжимости над линейкой (х) и по показаниям ИДК-1 (y). Результаты определений и обработки приведены в табл. 5
Коэффициент корреляции имеет предельные значения от 0 до 1: при отрицательном значении гху — обратная корреляция; при положительном значении — прямая; при r —0 линейная связь отсутствует, но может существовать нелинейная корреляционная связь.
В отдельных случаях приходится рассматривать статистические связи между несколькими величинами одновременно.
Множественный линейный коэффициент корреляции рассчитывают по формуле
В данном случае рассчитывают коэффициенты корреляции rух; rуz, rxz (как указано выше) и затем определяют RXyx.