Коэффициент ранговой корреляции rs Спирмена. Коэффициент корреляции Спирмена

Дисциплина "высшая математика" у некоторых вызывает неприятие, так как поистине не всем дано ее понять. Но те, кому посчастливилось изучать этот предмет и решать задачи, используя различные уравнения и коэффициенты, могут похвастаться практически полной в ней осведемленности. В психологической науке существует не только гуманитарная направленность, но и определенные формулы и способы для математической проверки выдвигаемой в ходе исследований гипотезы. Для этого применяются различные коэффициенты.

Коэффициент корреляции Спирмена

Это распространенное измерение по определению тесноты связи между какими-либо двумя признаками. Коэффициент еще называют непараметрическим методом. Он показывает статистику связи. То есть мы знаем, например, что у ребенка агрессия и раздражительность связаны между собой, а коэффициент корреляции рангов Спирмена показывает статистическую математическую связь этих двух признаков.

Как вычисляется ранговый коэффициент?

Естественно, что для всех математических определений или величин существуют свои формулы, по которым они вычисляются. Ею обладает и коэффициент корреляции Спирмена. Формула у него следующая:

С первого взгляда формула не совсем понятна, но если разобраться, все очень легко вычисляется:

  • n - это количество признаков или показателей, которые проранжированы.
  • d - разность определенных двух рангов, соответствующих конкретным двум переменным каждого испытуемого.
  • ∑d 2 - сумма всех квадратов разностей рангов признака, квадраты которых вычисляются отдельно для каждого ранга.

Область применения математической меры связи

Для применения рангового коэффициента необходимо, чтобы количественные данные признака были проранжированы, то есть им был присвоен определенный номер в зависимости от места, на котором расположен признак, и от его значения. Доказано, что два ряда признаков, выраженных в числовом виде, несколько параллельны между собой. Коэффициент ранговой корреляции Спирмена определяет степень этой параллельности, тесноты связи признаков.

Для математической операции по расчету и определению связи признаков с помощью указанного коэффициента нужно произвести некоторые действия:

  1. Каждому значению какого-либо испытуемого или явления присваивается номер по порядку - ранг. Он может соответствовать значению явления по возрастанию и по убыванию.
  2. Дальше сопоставляются ранги значения признаков двух количественных рядов для того, чтобы определить разность между ними.
  3. В отдельном столбце таблицы для каждой полученной разности прописывается ее квадрат, а внизу результаты суммируются.
  4. После этих действий применяется формула, по которой рассчитывается коэффициент корреляции Спирмена.

Свойства коэффициента корреляции

К основным свойствам коэффициента Спирмена относят следующие:

  • Измерение значений в пределах от -1 до 1.
  • Знак коэффициента интерпретаций не имеет.
  • Теснота связи определяется по принципу: чем выше величина, тем теснее связь.

Как проверить полученное значение?

Для проверки связи признаков между собой необходимо выполнить определенные действия:

  1. Выдвигается нулевая гипотеза (H0), она же основная, затем формулируется другая, альтернативная первой (H 1). Первая гипотеза будет заключаться в том, что коэффициент корреляции Спирмена равняется 0 - это значит, что связи не будет. Вторая, наоборот, гласит, что коэффициент не равен 0, тогда связь есть.
  2. Следующим действием будет нахождение наблюдаемого значения критерия. Оно находится по основной формуле коэффициента Спирмена.
  3. Далее находятся критические значения заданного критерия. Это можно сделать только с помощью специальной таблицы, где отображаются различные значения по заданным показателям: уровень значимости (l) и число, определяющее (n).
  4. Теперь нужно сравнить два полученных значения: установленного наблюдаемого, а также критического. Для этого необходимо построить критическую область. Нужно начертить прямую линию, на ней отметить точки критического значения коэффициента со знаком "-" и со знаком"+". Слева и справа от критических значений полукругами от точек откладываются критические области. Посередине, объединяя два значения, отмечается полукругом ОПГ.
  5. После этого делается вывод о тесноте связи между двумя признаками.

Где лучше использовать эту величину

Самой первой наукой, где активно использовался этот коэффициент, была психология. Ведь это наука, не основывающаяся на цифрах, однако для доказательства каких-либо важных гипотез, касающихся развития отношений, черт характера людей, знаний студентов, требуется статистическое подтверждение выводов. Также его используют в экономике, в частности, при валютных оборотах. Здесь оцениваются признаки без статистики. Очень удобен коэффициент ранговой корреляции Спирмена в этой области применения тем, что оценка производится независимо от распределения переменных, так как они заменяются ранговым числом. Активно применяется коэффициент Спирмена в банковском деле. Социология, политология, демография и другие науки также используют его в своих исследованиях. Результаты получаются быстро и максимально точно.

Удобно и быстро используется коэффициент корреляции Спирмена в Excel. Здесь существуют специальные функции, которые помогают быстро получить необходимые значения.

Какие еще коэффициенты корреляции существуют?

Кроме того, что мы узнали про коэффициент корреляции Спирмена, существуют еще различные корреляционные коэффициенты, позволяющие измерить, оценить качественные признаки, связь между количественными признаками, тесноту связи между ними, представленными в ранговой шкале. Это такие коэффициенты, как биссериальный, рангово-биссериальный, контенгенции, ассоциации, и так далее. Коэффициент Спирмена очень точно показывает тесноту связи, в отличие от всех остальных методов ее математического определения.

Краткая теория

Ранговая корреляция – это метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения.

Ранги - это порядковые номера единиц совокупности в ранжированном ряду. Если проранжировать совокупность по двум признакам, связь между которыми изучается, то полное совпадение рангов означает максимально тесную прямую связь, а полная противоположность рангов - максимально тесную обратную связь. Ранжировать оба признака необходимо в одном и том же порядке: либо от меньших значений признака к большим, либо наоборот.

Для практических целей использование ранговой корреляции весьма полезно. Например, если установлена высокая ранговая корреляция между двумя качественными признаками изделий, то достаточно контролировать изделия только по одному из признаков, что удешевляет и ускоряет контроль.

Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин.

Величина коэффициента корреляции Спирмена лежит в интервале +1 и -1. Он может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.

Ранговый коэффициент корреляции Спирмена подсчитывается по формуле:

Разность между рангами по двум переменным

число сопоставляемых пар

Первым этапом расчета коэффициента ранговой корреляции является ранжирование рядов переменных. Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречается несколько равных по значению переменных, им присваивается усредненный ранг.

Преимущество коэффициента корреляции рангов Спирмена состоит в том, что ранжировать можно и по таким признакам, которые нельзя выразить численно: можно проранжировать кандидатов на занятие определенной должности по профессиональному уровню, по умению руководить коллективом, по личному обаянию и т. п. При экспертных оценках можно ранжировать оценки разных экспертов и найти их корреляции друг с другом, чтобы затем исключить из рассмотрения оценки эксперта, слабо коррелированные с оценками других экспертов. Коэффициент корреляции рангов Спирмена применяется для оценки устойчивости тенденции динамики. Недостатком коэффициента корреляции рангов является то, что одинаковым разностям рангов могут соответствовать совершенно отличные разности значений признаков (в случае количественных признаков). Поэтому для последних следует считать корреляцию рангов приближенной мерой тесноты связи, обладающей меньшей информативностью, чем коэффициент корреляции числовых значений признаков.

Пример решения задачи

Условие задачи

Опрос случайно выбранных 10 студентов, проживающих в общежитии университета, позволяет выявить зависимость между средним баллом по результатам предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку.

Определите тесноту связи при помощи коэффициента ранговой корреляции Спирмена.

Если возникли сложности с решением задач, то сайт сайт оказывает онлайн помощь студентам по статистике с домашними контрольными или экзаменами.

Решение задачи

Рассчитаем коэффициент корреляции рангов.

Ранжирование Сравнение рангов Разность рангов 1 26 4.7 8 1 3.1 1 8 10 -2 4 2 22 4.4 10 2 3.6 2 7 9 -2 4 3 8 3.8 12 3 3.7 3 1 4 -3 9 4 12 3.7 15 4 3.8 4 3 3 0 0 5 15 4.2 17 5 3.9 5 4 7 -3 9 6 30 4.3 20 6 4 6 9 8 1 1 7 20 3.6 22 7 4.2 7 6 2 4 16 8 31 4 26 8 4.3 8 10 6 4 16 9 10 3.1 30 9 4.4 9 2 1 1 1 10 17 3.9 31 10 4.7 10 5 5 0 0 Сумма 60

Коэффициент ранговой корреляции Спирмена:

Подставляя числовые значения, получаем:

Вывод к задаче

Связь между средним баллом по результатам предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку, умеренной тесноты.

Если сроки со сдачей контрольной работы поджимают, на сайте всегда можно заказать cрочное решение задач по статистике .

Средняя стоимость решения контрольной работы 700 - 1200 рублей (но не менее 300 руб. за весь заказ). На цену сильно влияет срочность решения (от суток до нескольких часов). Стоимость онлайн-помощи на экзамене/зачете - от 1000 руб. за решение билета.

Все вопросы по стоимости можете задать прямо в чат, предварительно скинув условие задач и сообщив необходимые вам сроки решения. Время ответа - несколько минут.

Примеры близких по теме задач

Коэффициент Фехнера
Приведена краткая теория и рассмотрен пример решения задачи на расчет коэффициента корреляции знаков Фехнера.

Коэффициенты взаимной сопряженности Чупрова и Пирсона
Страница содержит сведения по методам изучения взаимосвязей между качественными признаками с помощью коэффициентов взаимной сопряженности Чупрова и Пирсона.

​ Коэффициент ранговой корреляции Спирмена – это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

1. История разработки коэффициента ранговой корреляции

Данный критерий был разработан и предложен для проведения корреляционного анализа в 1904 году Чарльзом Эдвардом Спирменом , английским психологом, профессором Лондонского и Честерфилдского университетов.

2. Для чего используется коэффициент Спирмена?

Коэффициент ранговой корреляции Спирмена используется для выявления и оценки тесноты связи между двумя рядами сопоставляемых количественных показателей . В том случае, если ранги показателей, упорядоченных по степени возрастания или убывания, в большинстве случаев совпадают (большему значению одного показателя соответствует большее значение другого показателя - например, при сопоставлении роста пациента и его массы тела ), делается вывод о наличии прямой корреляционной связи. Если ранги показателей имеют противоположную направленность (большему значению одного показателя соответствует меньшее значение другого - например, при сопоставлении возраста и частоты сердечных сокращений ), то говорят об обратной связи между показателями.

    Коэффициент корреляции Спирмена обладает следующими свойствами:
  1. Коэффициент корреляции может принимать значения от минус единицы до единицы, причем при rs=1 имеет место строго прямая связь, а при rs= -1 – строго обратная связь.
  2. Если коэффициент корреляции отрицательный, то имеет место обратная связь, если положительный, то – прямая связь.
  3. Если коэффициент корреляции равен нулю, то связь между величинами практически отсутствует.
  4. Чем ближе модуль коэффициента корреляции к единице, тем более сильной является связь между измеряемыми величинами.

3. В каких случаях можно использовать коэффициент Спирмена?

В связи с тем, что коэффициент является методом непараметрического анализа , проверка на нормальность распределения не требуется.

Сопоставляемые показатели могут быть измерены как в непрерывной шкале (например, число эритроцитов в 1 мкл крови), так и в порядковой (например, баллы экспертной оценки от 1 до 5).

Эффективность и качество оценки методом Спирмена снижается, если разница между различными значениями какой-либо из измеряемых величин достаточно велика. Не рекомендуется использовать коэффициент Спирмена, если имеет место неравномерное распределение значений измеряемой величины.

4. Как рассчитать коэффициент Спирмена?

Расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

5. Как интерпретировать значение коэффициента Спирмена?

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее - показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

Статистическая значимость полученного коэффициента оценивается при помощи t-критерия Стьюдента. Если расчитанное значение t-критерия меньше табличного при заданном числе степеней свободы, статистическая значимость наблюдаемой взаимосвязи - отсутствует. Если больше, то корреляционная связь считается статистически значимой.

В случаях, если измерения исследуемых признаков проводятся в шкале порядка, или же форма взаимосвязи отличается от линейной, исследование взаимосвязи между двумя случайными величинами осуществляется с помощь ранговых коэффициентов корреляции. Рассмотрим коэффициент ранговой корреляции Спирмена. При его вычислении необходимо ранжировать (упорядочить) варианты выборки. Ранжированием называется группировка экспериментальных данных в определенном порядке, либо по возрастанию, либо по убыванию.

Проведение операции ранжирования осуществляется по следующему алгоритму:

1. Меньшему значению начисляется меньший ранг. Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Наименьшему значению начисляется ранг равный 1. Например, если n=7, то наибольшее значение получит ранг под номером 7, за исключением случаев, которые предусмотрены вторым правилом.

2. Если несколько значений равны, то им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. В качестве примера рассмотрим упорядоченную по возрастанию выборку, состоящую из 7 элементов: 22, 23, 25, 25, 25, 28, 30. Значения 22 и 23 встречаются по одному разу, поэтому их ранги соответственно равны R22=1, а R23=2. Значение 25 встречается 3 раза. Если бы эти значения не повторялись, то их ранги были бы равными 3, 4, 5. Поэтому их ранг R25 равен среднему арифметическому 3, 4 и 5: . Значения 28 и 30 не повторяются, поэтому их ранги соответственно равны R28=6, а R30=7. Окончательно имеем следующее соответствие:

3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:

где n - общее количество ранжируемых значений.

Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. В этом случае необходимо найти и исправить ошибку.

Коэффициент ранговой корреляции Спирмена является методом, позволяющим определить силу и направленность взаимосвязи между двумя признаками или двумя иерархиями признаков. Применение коэффициента ранговой корреляции имеет ряд ограничений:

  • а) Предполагаемая корреляционная зависимость должна носить монотонный характер.
  • б) Объем каждой из выборок должен быть больше или равен 5. Для определения верхней границы выборки пользуются таблицами критических значений (Таблица 3 Приложения). Максимальное значение n в таблице - 40.
  • в) При проведении анализа вероятна возможность возникновения большого количества одинаковых рангов. В этом случае, необходимо вносить поправку. Наиболее благоприятным является случай когда, обе изучаемые выборки представляют собой две последовательности несовпадающих значений.

Для проведения корреляционного анализа исследователь должен располагать двумя выборками, которые могут быть ранжированы, например:

  • - два признака, измеренные в одной и той же группе испытуемых;
  • - две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков;
  • - две групповые иерархии признаков;
  • - индивидуальная и групповая иерархии признаков.

Расчет начинаем с ранжирования изучаемых показателей отдельно по каждому из признаков.

Проведем анализ случая с двумя признаками, измеренными в одной и той же группе испытуемых. Сначала ранжируют индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку. Если меньшим рангам одного показателя соответствуют меньшие ранги другого показателя, а большим рангам одного показателя соответствуют большие ранги другого показателя, то два признака связаны положительно. Если же большим рангам одного показателя соответствуют меньшие ранги другого показателя, то два признака связаны отрицательно. Для нахождения rs, определяем разности между рангами (d) по каждому испытуемому. Чем меньше разности между рангами, тем ближе коэффициент ранговой корреляции rs будет к «+1». Если взаимосвязь отсутствует, то между ними не будет никакого соответствия, следовательно rs окажется близким к нулю. Чем больше разности между рангами испытуемых по двум переменным, тем ближе к «-1» будет значение коэффициента rs. Таким образом, коэффициент ранговой корреляции Спирмена является мерой любой монотонной зависимости между двумя исследуемыми признаками.

Рассмотрим случай с двумя индивидуальными иерархиями признаков, выявленными у двух испытуемых по одному и тому же набору признаков. В данной ситуации ранжируют индивидуальные значения, полученные каждым из двух испытуемым по определенной совокупности признаков. Признаку с самым низким значением необходимо присвоить первый ранг; признаку с более высоким значением - второй ранг и т.д. Следует обратить особое внимание на то, чтобы все признаки были измерены в одних и тех же единицах. Например, невозможно ранжировать показатели, если они выражены в различных по «цене» баллах, поскольку невозможно определить, какой из факторов будет занимать первое место по выраженности, пока все значения не будут приведены к единой шкале. Если признаки, имеющие низкие ранги у одного из испытуемых так же имеют низкие ранги у другого, и наоборот, то индивидуальные иерархии связаны положительно.

В случае с двумя групповыми иерархиями признаков, ранжируют средне-групповые значения, полученные в двух группах испытуемых по одинаковому для исследуемых групп, набору признаков. Далее следует придерживаемся алгоритма, приведенного в предыдущих случаях.

Проведем анализ случая с индивидуальной и групповой иерархией признаков. Начинают с того, что ранжируют отдельно индивидуальные значения испытуемого и средне-групповые значения по тому же набору признаков, которые получены, при исключении того испытуемого, который не участвует в средне-групповой иерархии, так как с ней будет сопоставляться его индивидуальная иерархия. Ранговая корреляция позволяет оценить степень согласованности индивидуальной и групповой иерархии признаков.

Рассмотрим, как определяется значимость коэффициента корреляции в перечисленных выше случаях. В случае с двумя признаками она будет определяться объемом выборки. В случае с двумя индивидуальными иерархиями признаков значимость зависит от количества признаков, входящих в иерархию. В двух последних случаях значимость обуславливается числом изучаемых признаков, а не численностью групп. Таким образом, значимость rs во всех случаях определяется числом ранжированных значений n.

При проверке статистической значимости rs пользуются таблицами критических значений коэффициента ранговой корреляции, составленных для различных количеств ранжируемых значений и разных уровней значимости. Если абсолютная величина rs, достигает критического значения или превышает его, то корреляция достоверна.

При рассмотрении первого варианта (случай с двумя признаками, измеренными в одной и той же группе испытуемых) возможны следующие гипотезы.

Н0: Корреляция между переменными x и y не отличается от нуля.

Н1: Корреляция между переменными x и y достоверно отличается от нуля.

Если мы работаем с любым из трех оставшихся случаев, то необходимо выдвинуть другую пару гипотез:

Н0: Корреляция между иерархиями x и y не отличается от нуля.

Н1: Корреляция между иерархиями x и y достоверно отличается от нуля.

Последовательность действий при вычислении коэффициента ранговой корреляции Спирмена rs такова.

  • - Определить, какие два признака или две иерархии признаков будут участвовать в сопоставлении как переменные x и y.
  • - Ранжировать значения переменной x, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования. Поместить ранги в первую колонку таблицы по порядку номеров испытуемых или признаков.
  • - Ранжировать значения переменной y. Поместить ранги во вторую колонку таблицы по порядку номеров испытуемых или признаков.
  • - Вычислить разности d между рангами x и y по каждой строке таблицы. Результаты поместить в следующую колонку таблицы.
  • - Вычислить квадраты разностей (d2). Полученные значения поместить в четвертую колонку таблицы.
  • - Вычислить сумму квадратов разностей? d2.
  • - При возникновении одинаковых рангов вычислить поправки:

где tx - объем каждой группы одинаковых рангов в выборке x;

ty - объем каждой группы одинаковых рангов в выборке y.

Вычислить коэффициент ранговой корреляции в зависимости от наличия или отсутствия одинаковых рангов. При отсутствии одинаковых рангов коэффициент ранговой корреляции rs рассчитать по формуле:

При наличии одинаковых рангов коэффициент ранговой корреляции rs рассчитать по формуле:

где?d2 - сумма квадратов разностей между рангами;

Tx и Ty - поправки на одинаковые ранги;

n - количество испытуемых или признаков, участвовавших в ранжировании.

Определить по таблице 3 Приложения критические значения rs, для данного количества испытуемых n. Достоверное отличие от нуля коэффициента корреляции будет наблюдаться при условии, если rs не меньше критического значения.

Корреляционный анализ является методом, позволяющим обнаруживать зависимости между определенным количеством случайных величин. Цель корреляционного анализа, сводится к выявлению оценки силы связей между такими случайными величинами либо признаками, характеризующими определенные реальные процессы.

Сегодня мы предлагаем рассмотреть, как применяется корреляционный анализ по Спирмену, для наглядного отображения форм связи в практическом трейдинге.

Корреляция по Спирмену или основа корреляционного анализа

Для того чтобы понять, что такое корреляционный анализ, изначально следует уяснить понятие корреляции.

При этом, если цена начнет двигаться в нужном Вам направлении необходимо вовремя произвести разлокирование позиций.


Для данной стратегии в основу которой положен корреляционный анализ, наилучшим образом подходят торговые инструменты имеющие высокую степень корреляции (EUR/USD и GBP/USD, EUR/AUD и EUR/NZD, AUD/USD и NZD/USD, контракты CFD и тому подобные).

Видео: Применение корреляции Спирмена на рынке Форекс



error: Контент защищен !!