Что такое регресс и почему мы так часто о нем слышим?


Большинство решений, особенно важных, полагаются не только на интуицию. Когда задействованы данные и когда есть что-то, что нужно предсказать или объяснить, регрессия часто находится в центре процесса. Это не просто статистический метод. Это способ понять, как вещи связаны и как изменения в одной области могут повлиять на другую.

В бизнесе, здравоохранении, финансах или технологиях регрессия является одним из самых простых способов превратить необработанные данные в ответы. Это поможет вам понять, что важно, насколько это важно и чего ожидать дальше.

Давайте разберемся, что такое регрессия, как она работает и почему она появляется почти в каждой области, которая зависит от данных.

Что на самом деле означает регрессия?

Регрессия — это инструмент, используемый для изучения взаимосвязей между вещами. В частности, она помогает вам увидеть, как одна переменная, например цена продукта, влияет на другую, например ежемесячные продажи. Переменная, которую вы пытаетесь предсказать, называется зависимой переменной. Остальные, те, которые, по вашему мнению, оказывают влияние, являются независимыми переменными.

При правильном выполнении регрессия позволяет вам построить модель, которая не только объясняет, что произошло в прошлом, но и дает вам возможность предсказать, что может произойти в будущем.

Почему люди используют регрессию?

Короткий ответ — ясность. Регрессия помогает людям понять, какие факторы на самом деле имеют значение. Если вы пытаетесь принять решение, такая ясность меняет все.

Например, маркетинговая команда может захотеть узнать, влияют ли кампании в социальных сетях на регистрацию клиентов. Врач может захотеть узнать, какие факторы образа жизни способствуют сердечным заболеваниям. Хедж-фонд может захотеть узнать, какие экономические показатели влияют на процентные ставки. Регрессия дает им способ измерить и ранжировать эти влияния.

И как только вы узнаете, что движет результатами, вы можете начать их прогнозировать. Вот почему регрессия так часто встречается в прогнозировании, моделях риска и стратегическом планировании.

Различные типы регрессии


Вам не нужно запоминать каждый тип, но полезно знать основы того, чем они отличаются.

Линейная регрессия является наиболее распространенной. Она ищет прямолинейную связь между двумя переменными. Например, если расходы на рекламу растут, растут ли продажи с постоянной скоростью? Этот вид регрессии дает вам простую формулу, которая помогает ответить на этот вопрос.

Множественная линейная регрессия обрабатывает ситуации с более чем одним фактором. Допустим, вы пытаетесь оценить цену дома. Площадь имеет значение, но также важны количество ванных комнат и местоположение. Множественная регрессия объединяет эти переменные в одно уравнение.

Логистическая регрессия обрабатывает вопросы типа «да» или «нет». Продлит ли клиент свою подписку или нет? Разовьется ли у пациента заболевание или нет? Вместо того чтобы дать вам число, он дает вам вероятность от нуля до единицы.

Полиномиальная регрессия вступает в действие, когда связь не является прямой линией. Возможно, влияние температуры на продажи мороженого сначала резко возрастает, а затем выравнивается. Полиномиальная регрессия фиксирует эти кривые.

Регрессия гребня и лассо помогает навести порядок, когда в вашей модели слишком много переменных. Они предотвращают чрезмерную реакцию модели на шум, добавляя штрафы за сложность.

Как это на самом деле работает

Каждая регрессия начинается с данных. Вы выбираете, что хотите предсказать, и какие факторы могут это объяснить. Затем вы подгоняете модель, находя наилучшую комбинацию чисел, которая связывает входы с выходами. Результатом обычно является уравнение.

Это уравнение не случайно. Каждое число в нем что-то вам говорит. Положительное значение означает, что по мере увеличения входных данных результат также имеет тенденцию к увеличению. Отрицательное значение предполагает обратное. Размер числа говорит вам, насколько силен эффект.

Отсюда вы проверяете, насколько хороша модель. Вы проверяете, насколько хорошо она соответствует данным, насколько много вариаций она объясняет и действительно ли важна каждая переменная. Хорошие модели точны, но они также просты и осмысленны.

Ключевые идеи, которые часто возникают

Коэффициент каждой переменной говорит вам, насколько она влияет на результат. Большие абсолютные значения означают более сильные связи.

R-квадрат показывает, насколько хорошо модель объясняет данные. Оценка, близкая к единице, означает, что модель объясняет большую часть вариации. Оценка, близкая к нулю, означает, что это не так.

P-значение говорит вам, является ли влияние переменной статистически надежным. Низкие P-значения (ниже 0,05) означают, что вы можете доверять результату.

Ни один из них не идеален сам по себе. Они работают лучше всего, когда вы интерпретируете их вместе.

Где вы увидите использование регрессии

Регрессия проявляется в десятках областей, поскольку она гибкая и надежная.

В маркетинге команды используют ее, чтобы выяснить, что движет вовлеченностью клиентов или какая кампания оказала реальное влияние.

В финансах аналитики используют ее для моделирования кредитного риска, прогнозирования доходности акций и измерения чувствительности портфелей к движениям рынка.

В здравоохранении исследователи используют его для изучения эффектов лечения, прогнозирования результатов и понимания того, какие факторы риска имеют наибольшее значение.

В машинном обучении регрессионные модели составляют основу многих задач прогнозирования, особенно в контролируемом обучении.

Почему регрессия работает и когда она терпит неудачу

Она хорошо работает, потому что дает четкие, интерпретируемые ответы. Она показывает взаимосвязи таким образом, что их легко сообщать и защищать. И он масштабируется до больших наборов данных, не превращаясь в черный ящик.

Но у него также есть ограничения.

Регрессия предполагает, что связь между переменными остается одинаковой во всем наборе данных. Если связь изменяется при разных значениях или если шаблон не является линейным, он может упустить важные детали.

Он также чувствителен к выбросам. Несколько экстремальных значений могут исказить результаты. А когда переменные сильно коррелируют друг с другом, это может запутать модель и привести к нестабильным результатам.

Вот почему вы всегда должны проверять данные, проверять модель и подвергать сомнению свои предположения.

Регрессия — один из важнейших инструментов в анализе данных. Она помогает вам соединять точки, измерять то, что имеет значение, и принимать более обоснованные решения. Независимо от того, делаете ли вы прогнозы, исследуете взаимосвязи или проверяете теорию, регрессия дает вам основу для выполнения этого со структурой и ясностью.

Она не ответит на все вопросы. Но при использовании с осторожностью и в контексте он становится одним из самых ценных навыков, которые может иметь любой аналитик, стратег или лицо, принимающее решения.

Если вы работаете с данными, регрессия обучения не является необязательной. Она является основополагающей.

BofA: предложение стейблкоинов может вырасти до $75 млрд после гениального акта — ETF BlackRock на Ethereum стал третьим по скорости достижения цели в $10 млрд активов под управлением
BofA: Предложение стейблкоинов может вырасти на $75 млрд после принятия закона GENIUS Bank of America (BofA) прогнозирует, что закон GENIUS, подписанный президентом США Дональдом Трампом на прошлой неделе, спровоцирует значительный рост рынка стейблкоинов. По данным банка, предложение стейблкоинов может увеличиться на $25–75 млрд в краткосрочной перспективе. Ожидается, что этот рост будет обусловлен...
Отчёт Белого дома о криптовалютах выйдет 30 июля: FTX выплатит $1,9 млрд в сентябре
Отчет Белого дома по криптовалютам выйдет 30 июля Отчет Белого дома по криптовалютам, подготовленный в рамках 180-дневного мандата Трампа, будет опубликован 30 июля и может включать в себя стратегический план резерва Bitcoin. По словам Элеоноры Терретт, отчет может также включать рекомендации по национальному запасу цифровых активов, мерам национальной безопасности и расширению банковского доступа...
Сенат публикует проект реструктуризации рынка криптовалют и ожидает отзывов — JPMorgan Chase рассматривает планы предоставления клиентам кредитов, обеспеченных криптовалютой
Сенат США опубликовал проект закона о реструктуризации рынка криптовалют и запросил обратную связь Сенат США продолжает работу над проектом новых правил для рынка криптовалют и опубликовал 35-страничный проект закона о реструктуризации рынка. В этом проекте даны более четкие определения цифровых активов и описано, как эти активы могут быть освобождены от существующих правил. В частности, в проекте...
Что такое Кусама (КСМ)?
Поскольку технология блокчейн продолжает развиваться, спрос на масштабируемые, совместимые и экспериментальные сети существенно вырос. Одним из проектов, выделяющихся на этом фоне, является Kusama (KSM) — публичная предпроизводственная среда для Polkadot, призванная позволить разработчикам тестировать и совершенствовать свои децентрализованные приложения (dApps) и протоколы блокчейнов в реальной среде...
Что такое монета UMA?
Экосистема децентрализованных финансов (DeFi) продолжает развиваться и расширяться благодаря возможностям, предоставляемым технологией блокчейн. Одним из выдающихся проектов в этой области является UMA (Universal Market Access), инновационный протокол, разработанный для обеспечения всеобщего доступа к финансовым контрактам. Собственный токен UMA, UMA Coin, играет жизненно важную роль как в управлении,...


Завести аккаунт

Теперь создайте учетную запись, где вы сможете использовать свои знания.