Коэффициент корреляции — AI ставит CORREL и строит матрицу
Корреляция Пирсона измеряет силу линейной связи между двумя рядами в диапазоне от −1 до +1. Excel предоставляет CORREL и PEARSON — обе считают одно и то же, разница только в обработке нулей. Сложность не в формуле, а в правильной интерпретации: 0.3 — слабая корреляция, 0.7 — сильная, 0.99 — подозрительно высокая (часто признак того, что одна колонка производная от другой). На отчёт «выручка vs трафик» аналитик тратит 15–30 минут на формулу + матрицу + интерпретацию. AI решает задачу за 5 секунд: вы говорите «коэффициент корреляции между трафиком (B) и выручкой (D)», и SideGenius пишет =CORREL(B2:B201;D2:D201) и сразу подписывает интерпретацию рядом. Понимает «матрица корреляций по всем числовым колонкам» (через Data → Data Analysis → Correlation, или через массив CORREL), «корреляция Спирмана для рангов» (RANK + CORREL), «корреляция за конкретный период» (с OFFSET или фильтром), «значимость корреляции» (через t-критерий по формуле).
H1: =CORREL(B2:B201;D2:D201) = 0.78 — сильная положительная связь. H2-H4 — матрица 4×4: трафик-выручка 0.78, трафик-конверсия −0.12, конверсия-выручка 0.51. Подсветили красным значения > 0.7 (сильная), голубым −1..−0.7.
Почему не ChatGPT
ChatGPT может объяснить формулу, но не строит матрицу для нескольких колонок и не подсвечивает значимые корреляции. SideGenius пишет CORREL, разворачивает матрицу через массив и применяет условное форматирование. Работает в РФ без VPN.
Как использовать за 3 шага
Зарегистрируйтесь на sidegenius.ru — мастер онбординга подключит SideGenius к Excel за 2 минуты.
Укажите две колонки или попросите матрицу корреляций по всем числовым.
Подтвердите — формула CORREL появится, матрица заполнится с условным форматированием.
Вопросы и ответы
Как интерпретировать значение корреляции?
От 0 до ±0.3 — слабая связь, ±0.3 до ±0.7 — средняя, выше ±0.7 — сильная. Знак показывает направление: положительная — оба растут вместе, отрицательная — один растёт, другой падает. Корреляция 0 — связи нет (но может быть нелинейная, которую CORREL не видит).
Корреляция = причинность?
Нет. Высокая корреляция означает только статистическую связь — может быть случайной (на малых выборках) или вызванной третьим фактором. Классический пример: продажи мороженого и утопления коррелируют, но причина — летняя жара. Делайте тест на значимость и проверяйте смысловую связь.
Чем CORREL отличается от PEARSON?
Математически — ничем, обе считают коэффициент Пирсона. Разница в обработке логических и текстовых ячеек: CORREL их игнорирует, PEARSON может выдать ошибку. Для чистых числовых данных результат одинаков. Microsoft рекомендует CORREL.
А что если данные не нормально распределены?
Корреляция Пирсона предполагает нормальное распределение. Если данные сильно скошены, лучше Спирман — корреляция рангов. В Excel: =CORREL(RANK(B2;B$2:B$201);RANK(C2;C$2:C$201)) с массивным вводом. SideGenius подскажет, если данные требуют непараметрического метода.
Можно ли строить матрицу корреляций сразу по 10 колонкам?
Да. Самый быстрый путь — Data → Data Analysis → Correlation (нужен Analysis ToolPak, включается в Параметрах). Альтернатива — массив CORREL по парам. SideGenius может развернуть матрицу 10×10 одной командой.
Сколько это стоит?
Бесплатный старт — 20 кредитов на пробу. Подписка Pro — 399 ₽/мес, оплата картами банков РФ через ЮKassa, без VPN.
Попробуйте SideGenius бесплатно
20 кредитов на старт, без карты. Работает в РФ без VPN, оплата картами РФ.
Установить в Excel