ОТАВИАНО ЭЛЕНЕ*
Рассмотрение данных из разных исследовательских агентств имеет то преимущество, что увеличивает объем информации, но увеличивает флуктуацию.
Опросы электоральных предпочтений населения дают представление о том, что могло бы произойти, если бы выборы состоялись в это время. Однако при оценке результатов исследований в более общем плане, особенно в отношении возможных тенденций, которые они могут выявить, необходимо проявлять определенную осторожность. Проиллюстрируем это на примере результатов предпочтения четырех основных кандидатов в избирательных опросах президента, проведенных несколькими организациями в период с февраля по март 2022 года.[1] до, следовательно, партийных изменений, определений списков и консолидации кандидатур, хотя и не окончательно, вещей, которые произошли в начале апреля.
Данные, подлежащие анализу, показаны на рисунке 1. Ордината (ось y) каждой из точек на рисунке 1 показаны предпочтения, выраженные опрошенными людьми в ходе опроса, проведенного на дату, соответствующую абсциссе (ось x).[2] Когда в одном и том же исследовании рассматривалось более одного набора кандидатов (обычно в средствах массовой информации это называется сценарием), различные результаты были представлены на одной и той же оси абсцисс.
Рисунок 1 – Результаты электоральных опросов; кандидаты с большими предпочтениями.
Обычно результаты исследования представляются вместе с приблизительной оценкой «погрешности», обычно порядка 2–3%. Эта «погрешность» означает, что, если исследование проводилось в один и тот же день, с использованием одних и тех же процедур и с участием людей с одинаковым профилем (возраст, пол, образование, доход, географический регион, религия и т. д.), результаты могут быть разными в этом диапазоне. Эти «допуски погрешности» носят исключительно статистический характер, то есть они не включают в себя неопределенности, связанные с принятой методологией или гипотезами относительно профиля голосующего населения. Более того, эта разница действительна для кандидатов с хорошими предпочтениями; в случае кандидатов с более низким уровнем предпочтений «допуск на ошибку» меньше, как обсуждается позже.
Таким образом, различия ниже предела погрешности между двумя последовательными опросами, проведенными одной и той же компанией, не позволяют нам предположить, что имело место безопасное и действительное изменение в предпочтениях электората. Этот вывод был бы возможен только в том случае, если бы выполнялось хотя бы одно из следующих условий: отклонение превышало «предел погрешности»; изменение в том же направлении происходит снова в новом опросе, проведенном той же компанией; эквивалентное изменение произошло в опросах, проведенных другой компанией в те же даты.
Эти обычные 2 или 3% — это приблизительная оценка погрешности. Фактически эта разница зависит от степени предпочтений кандидата. Например, как видно на рисунке 1, хотя максимальные и минимальные предпочтения для двух возможных кандидатов с наиболее высоким рейтингом (Лула и Болсонару) варьировались соответственно в пределах 13% и 12% за период, предпочтения кандидаты Чиро и Моро варьировались в гораздо меньших пределах: 5% и 4% соответственно. Эта погрешность порядка 2–3% справедлива для наиболее предпочтительных кандидатов.
Как правило, чем ближе к 50% предпочтение той или иной кандидатуры, тем больше эта «погрешность». Так, 3%-ное изменение предпочтения кандидата, например, от 50% до 53%, может ничего не означать, тогда как такое же изменение предпочтения кандидата с низким рейтингом, скажем, от 5% до 8%, может быть весьма существенным. .
При сравнении исследований, проведенных разными компаниями, диапазон отклонений («допуск погрешности») может быть больше, как описано ниже.
Помимо чисто случайных изменений, также могут быть различия в результатах из-за принятия разных методологий и гипотез относительно профиля населения, которое будет голосовать (как оно распределяется по доходам, образованию, возрасту, регионам страны и т. д.). . .).
Например, среди данных, показанных на рисунке 1, есть два типа опроса: личный и телефонный. Различия между этими двумя результатами весьма существенны. В опросах, проведенных по телефону, кандидат Лула получил в среднем примерно на 2–3% меньше голосов, чем в опросах, проведенных лично. Что касается кандидата, занявшего второе место, то ситуация обратная: на телефонных консультациях голосов больше, чем на очных.
Подобные факты необходимо учитывать при сравнении результатов, опубликованных разными исследовательскими компаниями.
Данные, показанные на рисунке 1, опубликованные в феврале и марте, не показывают какой-либо тенденции в предпочтениях четырех возможных кандидатов с течением времени.[3] Если бы выборы состоялись в этот период и эти кандидаты были бы включены в опросы, результаты показали бы, что за Лулу проголосовали от 39 до 42%, а за другого кандидата - от 26 до 29%. Что касается действительных голосов, то у Лулы будет от 45 до 49% из них.
Необходимо сказать, что тот факт, что данные не указывают на какие-либо доказательства существенных изменений за рассматриваемые два месяца, не является свидетельством того, что каких-либо изменений не было: отсутствие доказательств эффекта не является свидетельством его отсутствия. .
Помимо случайных изменений, типичных для процессов выборки, и различий между результатами, полученными разными опросными компаниями из-за разных методологий и гипотез о профиле избирателей, существует эффект корреляции между результатами, который может привести к неверным выводам.
Чтобы понять это, предположим ситуацию, в которой есть только два кандидата. Опрашивается тысяча человек, и, скажем, 600 говорят, что предпочитают А и 400, Б: 60% и 40% соответственно. Через несколько дней на той же улице опрашивают еще 1000 человек (той же компанией, с использованием тех же методологий и гипотез и т. д.). Даже если бы не было разницы в предпочтениях электората, число людей, заявивших, что они предпочитают вариант А, случайно могло оказаться чуть выше или чуть ниже 600. Допустим, их 630 (63%). Поэтому число людей, которые заявят, что предпочитают кандидата Б, обязательно будет меньше — 370 (37%). При этом может сложиться впечатление, что предпочтения электората различались: предпочтение одного из кандидатов возросло и, «подтверждая это изменение позиции электората», предпочтение другого уменьшилось; разница между ними увеличилась на 6%, что намного превышает типичную погрешность.
Но данные не позволяют сделать такой вывод, и предложение в кавычках выше неверно. Тот факт, что B снизился, вместо «подтверждения тенденции» отражает лишь тот факт, что сумма процентных предпочтений двух кандидатур фиксирована, 100%: если одна растет, другая обязательно уменьшается.
Когда кандидатов более двух, этот эффект менее выражен; однако, когда двое из них имеют большую долю от общего числа голосов, как показано на рисунке 1, эффект значителен. Этот эффект означает, что, хотя предпочтения двух основных кандидатов варьировались в пределах от 12% до 13%), разница между их предпочтениями варьировалась за тот же период на 22%.
Сочетание всех описанных эффектов должно было иметь место в исследованиях в течение рассматриваемого периода. Например, в регионе, выделенном слева на рисунке 2, похоже, что кандидатура Лулы сильно упала бы, причем в течение первой половины февраля произошла почти полная смена позиций.
Однако этот факт может быть просто комбинацией рассмотренных эффектов. Во-первых, различия примерно в 3% в явном предпочтении того или иного кандидата не являются значительными. Во-вторых, из-за эффекта, обсуждавшегося выше, увеличение, просто случайным колебанием, балла одного из этих двух наиболее проголосовавших кандидатов, скорее всего, влечет за собой снижение другого, что вызывает различия в разнице порядка двойного значения. значение 6% может быть статистически незначимым. Третий эффект заключается в том, что в конце периода, показанного на рисунке 2, включаются телефонные опросы; Телефонные опросы в анализируемый период в среднем дали меньше голосов за Лулу и больше за Болсонару.
Таким образом, данные не позволяют сделать вывод о систематическом изменении в этот период.
Рисунок 2 – То же, что и рисунок 1, но только для двух кандидатов с наибольшими предпочтениями. Выделенный регион может ошибочно указывать на тенденцию: снижение предпочтений одной кандидатуры и рост другой.
Заключение
Мы можем анализировать результаты электоральных опросов, рассматривая только результаты, представленные одной компанией с течением времени, что предотвращает влияние на наблюдаемые различия различных гипотез относительно социально-экономического профиля голосующего населения и принятых методологий (телефонных и электронных). человек, например). Однако это ограничивает объем информации, которую мы можем проанализировать.
Преимущество рассмотрения данных различных исследовательских агентств заключается в увеличении объема информации, но в то же время в увеличении колебаний из-за различных принятых гипотез и методологий.
Каким бы ни был вариант анализа, необходимо избегать поспешных выводов. Также важно помнить, что электоральные предпочтения со временем меняются медленно, если только не появляются очень поразительные факты или новости, правдивые или ложные.
* Отавиано Элен Он является старшим профессором Физического института USP.
Примечания
[1] Исследования проведены следующими агентствами: Quaest, Ipespe, Datafolha, Paraná Pesquisas, MDA, Ideia, Futura, PoderData, Gerp.
[2] Даты соответствуют датам проведения исследования, а не датам публикации результатов.
[3] Это не означает, что предпочтения избирателей не различаются; просто нет этому доказательств.