"В продолжение разговора про "обоняние" как ключевое слово, статистика запросов по которому отражает динамику и сравнительную силу эпидемии коронавируса. У каждого города (из тех, в которых уже была заметная вспышка) своя динамика запросов", - пишет аналитик на своей странице в Facebook.
"На приведенном здесь графике для каждого города показаны две характеристики:
1) дата, на которую пришелся пик запросов ("Яндекс" показывает динамику только по месяцам и неделям, но не по дням; однако вероятную дату пика можно оценить примерно через сопоставление показателей рекордной недели с предыдущей и последующей - если например количество запросов на неделе перед рекордной и после рекордной примерно одинаковое, значит максимум скорее всего пришелся на середину рекордной недели; если рекордная неделя лишь чуть выше предыдущей и сильно выше последующей - значит, максимум был ближе к началу рекордной недели);
2) интенсивность пика - определяемую через долю запросов со словом "обоняние" от всех запросов к "Яндексу" из данного города на пиковой неделе (можно ожидать, что интенсивность пика запросов будет коррелировать не с общей силой эпидемии, определяемой через долю переболевших в населении, а именно с интенсивностью эпидемии на пике - с долей одновременно болевших; при равной высоте пика запросов больше переболевших следует ожидать в том городе, где рост и снижение запросов были более пологими, и пик шире). Чтобы не перегружать график еще больше, я показываю только города с интенсивностью пика 0,008% и больше.
Тут уместно несколько слов про качество и надежность данных. Первое: большинство пиков ярко выраженные. Медианная разница между частотой запросов на пиковой неделе и в среднем за 2 недели до и после пика - 1,7 раза. Медианная разница между основным пиком и максимальным значением за периоды, отстающие от основного пика более чем на 2 недели, - 1,5 раза. И это с учетом фонового уровня (несвязанные с эпидемией запросы про обоняние + общая для всей России "медийная" компонента), если его вычесть, то разница между пиком и остальными периодами будет намного более выпуклой.
Второе: помимо силы эпидемии, на соотношение относительного количества запросов про "обоняние" на пиках в разных городах может влиять множество других факторов - частота упоминания (на пике эпидемии) потери обоняния как симптома коронавируса в местных СМИ и неформальных коммуникациях; накопленная к моменту вспышки осведомленность населения о симптомах коронавируса; возрастной состав интернет-аудитории (притом не всей, а той примерно половины, которая пользуется "Яндексом"); различия в преобладающей лексике (количество запросов про потерю запахов или "не чувствую запахи" в %% от количества запросов про обоняние варьируется от 11% в Архангельске до 37% в Махачкале); возможные различия между "популяциями" вируса и, соответственно, частотой появления тех или иных симптомов; возможные различия - обусловленные культурой, средой обитания или климатом - по важности обоняния как органа чувств и т.д. Однако среди этих факторов я не вижу ни одного, который мог бы давать отклонения больше, чем примерно х1,3. Различия между городами по высоте пика намного больше - так что все же я считаю, что сравнение городов по частоте запросов про обоняние на локальных пиках индикативно для сравнения пиковой интенсивности эпидемии в этих городах.
Приведенный график - это такая хронология: где и когда прошел локальный для данного города пик количество запросов про "обоняние". И я предполагаю, что это совпадает или почти совпадает с пространственной хронологией самой эпидемии, с датами прохождения соответствующими городами пиков по количеству новых заболевших.
Если исходить из этой логики, то первыми - в самом конце апреля или самом начале мая - пик прошли Махачкала и Ингушетия (в виду малочисленности населения и поисковых запросов для Ингушетии и Тывы я в порядке исключения учитываю запросы не по отдельным городам, а по региону в целом). При этом в силу повышенного уровня скепсиса и неверия на старте эпидемии скорость распространения и уровень на пике и в Дагестане, и в Ингушетии оказались существенно выше, чем в других регионах.
Вторая "пространственная волна" - это Москва с областью, а также Обнинск (про то, что там в апреле-мае ситуация была существенно хуже, чем в областном центре, в Калуге, было известно и без поисковой статистики) и Тверь (вот Тверь меня удивила - я в это время уже находился на территории Тверской области, так что к местным новостям относился с повышенным вниманием, но вспышки в Твери, в отличие от Конаково и Кимр, не заметил ни по официальной статистике, ни по разговорам в соцсетях и оффлайне). Судя по статистике запросов со словом "обоняние", пик во всех перечисленных местах случился практически одновременно, 5-9 мая, и с одинаковой интенсивностью. При этом если Обнинск и Тверь совпали с Москвой по времени пика, то другие крупные города вокруг столицы не совпали.
Дальше наступила пауза - и до конца мая через пик из всех рассматриваемых мною городов (более 90) прошел еще только Владикавказ. Зато с приходом июня сразу началась третья "пространственная волна": 1-3 июня через пик прошли географически близкие Саранск, Пенза, Липецк, Курск и Брянск (притом это не сплошной ареал - в Тамбове пик был примерно на 10 дней позже, а в Орле и Белгороде всплеска запросов не было до сих пор), а также Тольятти. Выше всего интенсивность запросов на локальном пике из перечисленных городов была в Саранске.
Чуть позже, 5-6 июня, через пик прошли Северодвинск, Черкесск и Санкт-Петербург. Объединяет эти три кейса только время. Северодвинск - первый пример сверхмощной (превосходящей уровень Махачкалы и Ингушетии) локальной вспышки, ограниченной одним городом. Потом будут еще Норильск и Когалым. Черкесск (вспышка в котором судя по поисковой статистике на тот момент была четвертой по силе с момента начала эпидемии после Махачкалы, Ингушетии и Северодвинска) продолжил северокавказскую "традицию", в которой у каждого региона и регионального центра своя динамика и свое время прохождения пика; после Черкесска будет еще Нальчик - с пиком на неделю позже, тогда как Грозный доберется до пика только в июле, и то не факт, что это уже пик. Петербург же почти в точности совпал с Москвой по высоте пика, только на 4 недели позже (и "колокол" запросов в Питере сильнее растянут во времени, чем в Москве).
Более чем в десятке городов пик пришелся на 10-13 июня. Основу этой четвертой "пространственной волны" (в которой при этом только некоторые города связаны между собой тем, что можно назвать логикой движения эпидемии по карте) составляют города вокруг Московской области - Владимир, Рязань, Тула, Калуга, Смоленск (при этом Тверь и Обнинск прошли пик на месяц раньше, в Ярославле, Иваново и Рыбинске в начале июня тоже был подъем - но слабый, с максимумами на 0,006-00075%, а в Костроме, Вологде и Череповце подъема вовсе не было). Чуть раньше и слабее был пик в Нижнем Новгороде. В те же дни через пик прошли Архангельск (через неделю после Северодвинска - и с интенсивностью пика примерно в 5 раз меньше), уже упоминавшийся Нальчик и (с существенно большей интенсивностью) Петропавловск-Камчатский. И в эти же дни были пройдены пики в трех очень мощных всплесках - в Чебоксарах, Набережных Челнах и Воркуте (можно предположить, что интенсивность эпидемии на пике здесь, особенно в двух первых случаях, была обусловлена совпадением во времени нарастания эпидемии и снятия существенной части общероссийских ограничений в начале июня).
После 13 июня наступило новое затишье - и в следующие 3 недели через локальные пики прошли только 7 городов. Это (в хронологическом порядке) Новосибирск (в котором, как и в Нижнем Новгороде, запросы про обоняние росли долго и с небольшой скоростью, а пик был небольшим по высоте), Новый Уренгой (первая по времени вспышка в нефтегазовых округах), Тыва, "сверхмощные" вспышки в Норильске и Когалыме, Якутск и Красноярск.
7-11 июля - это пятая "пространственная волна" пиков с достаточно четкой географической локализацией: Среднее Поволжье и Урал. На эти дни пришлись пики (перечисляю в порядке нарастания интенсивности на пике) в Перми, Йошкар-Оле, Челябинске, Ульяновске, Нижнем Тагиле, Екатеринбурге, Уфе, Казани, а также в Мурманске и Омске. Омск и Казань - на данный момент рекордсмены среди всех городов-"миллионников" по высоте пика: в Омске он составил 0,0193% от всех запросов к "Яндексу", в Казани 0,0166%, далее идут Уфа, Петербург, Москва и Екатеринбург с 0,0138-0,0126%.
В эти же дни или чуть позже свои пики прошли несколько городов в ХМАО - Сургут, Нефтеюганск и Нижневартовск. Во всех трех у пиков большая высота - примерно на уровне Омска или даже чуть выше (но все же ниже Нового Уренгоя и тем более Когалыма).
Неделя 13-19 июля стала рекордной по частоте "обонятельных" запросов для Грозного (у которого очень специфичный график количества запросов, с несколькими "полупиками" начиная еще с апреля, так что уверенности в том, что там пик действительно пройден, нет никакой), Южно-Сахалинска, Самары, Ноябрьска и Березников. Следующая неделя (последняя учтенная на данный момент) - рекордная для Астрахани. На графике для нее условно поставлена дата 26 июля (конец той недели) - но судя по доступным на сейчас неполным данным за следующую неделю, рост в Астрахани продолжается.
По мере появления данных за новые периоды на графике могут появляться новые города - в которых пока не пройден порог в 0,008% от всех запросов к "Яндексу", но может быть пройден в будущем. Наиболее вероятные кандидаты на шестую "пространственную волну" - это юг России от Волгограда до Сочи".