Игра в напёрстки

Как манипулируют цифрами интернет-статистики

Один из лидеров отрасли автоматизированного мониторинга СМИ в России — компания «Медиалогия» — по итогам 2015 года признала Псковское агентство информации самым цитируем СМИ Псковской области. 11 марта ПАИ поделилось этой приятной новостью со своими читателями, и эта публикация не осталась незамеченной. Уже через несколько дней на сайте Центра деловой информации (ЦДИ) [спойлера Псковской ленты новостей (ПЛН), также входящей в состав холдинга «Гражданская пресса»] вышла в свет заметка под заголовком «Поле битвы — медиаметрия». В ней предпринята попытка дискредитировать достоверность данных рейтинга цитируемости. Не отказывая никому в праве на пресловутое декартовское сомнение, редакция ПАИ считает необходимым всё же сделать несколько замечаний по содержанию указанной статьи, чтобы не допустить манипулирования мнением читателей, не знакомых с нюансами работы интернет-медиа и составления подобных рейтингов. 

Напомним, в минувшем году индекс цитирования Псковского агентства информации по данным «Медиалогии» составил 138,4 пункта. На втором месте - Псковская лента новостей (115,48 пунктов), на третьем - газета «Псковская губерния» (99,78 пункта). Четвёртое место досталось газете «Псковская правда» (35,4 пункта), замыкает ТОП-5 ГТРК «Псков» (31,68 пункта). Следом издания распределились следующим образом: газета «Комсомольская правда - Псков» (26,12 пункта), газета «Псковская провинция» (25,5 пункта), газета «Новый день» (18,42 пункта), псковский выпуск газеты «Аргументы и факты» (16,29 пункта). Замыкает ТОП-10 псковских СМИ по цитируемости в других медиа газета «КурьерЪ» (10,91 пункта).

Обозреватель Центра деловой информации Леонид Смыслов так откликнулся на эти данные: «Недавно одно из псковских электронных изданий во всеуслышание заявило, что является самым цитируемым в регионе согласно индексу цитирования от «Медиалогии». Действительно, существует мнение, что для оценки эффективности работы СМИ нужно смотреть не только на счетчик посещений. Учитывается также и показатель цитируемости, то есть то, как часто коллеги по цеху, упоминая ту или иную информацию, ссылаются на твой портал. Причем аналитики утверждают, что показатель этот также можно измерить и «взвесить». Называется это индексом цитирования (ИЦ). Впрочем, мнение это небесспорное». 

Далее журналист ЦДИ рассказывает своим читателям, что «одни СМИ с удовольствием агрегируют исключительно «желтые» новости и чернуху, другие охотно подхватывают позитивный официоз», и «в последнем случае, приближенные к местным администрациям издания, конечно, привлекают больше внимания со стороны прокремлевских федеральных СМИ и тем более со стороны сайтов региональной власти», а «наоборот, оппозиционные порталы будут активно цитировать те издания, работа которых буквально заточена на торпедирование действующей власти и губернатора». Кроме того, он отмечает, что «федеральные СМИ нередко «забывают» ссылаться на источник, публикуя региональные новости, видимо, считая это ниже своего достоинства», а «тратить время на разбирательства у местных изданий просто нет возможности, поэтому определить объективную картину по цитированию на самом деле не так-то просто».

Все эти в общем и целом справедливые тезисы являются подводкой к основной мысли заметки - что первое место Псковского агентства информации в рейтинге цитируемости, якобы, сомнительно. 

В качестве доказательства этого мнения автор приводит статистику сайтов ПЛН, ЦДИ и ПАИ по данным счётчика Mail.ru:

«Как объяснить такое неравенство показателей информационных сайтов, которые, грубо говоря, окучивают одну событийную поляну и у которых при этом, проговорим это еще раз, разительно отличается посещаемость», - пишет г-н Смыслов. 

И вот здесь начинается своеобразная игра в напёрстки с цифрами и фактами. Счётчик mail.ru [кстати, гораздо реже употребимый в отрасли при анализе посещаемости сайтов, чем общепринятые Яндекс.Метрика, Google Analytics и Liveinternet] здесь выбран не случайно: то, что в нём названо «визитами», во всех других счётчиках именуется гораздо более понятно и недвусмысленно: просмотры страниц. Этот показатель, как известно, с посещаемостью сайта (количеством уникальных посетителей) прямо никак не коррелируется: например, на разницу в просмотрах (так называемую «глубину просмотра») может влиять то, что один сайт имеет более удобный для пользователя интерфейс, не заставляющий его по много раз загружать новые страницы, а другой, напротив, построен таким образом, чтобы к каждом удобном случае заставить читателя открыть новую ссылку, чтобы «нагнать» счётчик.

А если посмотреть на цифры по уникальным посетителям в месяц, то окажется, что ни о каком четырёхкратном преимуществе речи уже не идёт: по данным на утро 23 марта счётчика Liveinternet [именно он позволяет посмотреть ключевые цифры статистики у любого зарегистрированного в этой системе сайта], у ПЛН месячная посещаемость составила 334,6 тысячи уникальных посетителей, у ПАИ — 149 тысяч посетителей, у ЦДИ — 118,5 тысяч.

И так — практически во всех приведённых в статье на ЦДИ тезисах, которые призваны убедить неискушенного читателя в непрозрачности методики составления рейтинга «Медиалогии». 

Между тем автор статьи пишет: «К сожалению, методика подсчета «Медиалогии» является коммерческой тайной. Работает эта компания за деньги, проводя исследования по заказам тех или иных изданий, которые в свою очередь потом активно используют красивые циферки в промо-целях. Сложно что-то утверждать, не понимая принципов подсчета, попробуем работать с тем, что есть в открытом доступе». В качестве доказательства он приводит «любопытную таблицу»:

«В ней отражено количество упоминаний издания в ТОП ИЦ «Медиалогии». Кто же там кого на самом деле цитирует? — отмечает обозреватель. — Обратите внимание на потрясающие результаты ПАИ и ПП [газеты «Псковская правда»] в газетах «Комсомольская правда» и «Аргументы и факты». На самом деле здесь нет ничего удивительного, если мы вспомним, что все эти издания, электронные и печатные, входят в одну госструктуру — Медиа-холдинг Псковской области. Чего бы и не поцитировать друг друга по-братски?»

Не совсем ясно, что понимается под «количеством упоминаний изданий в ТОП ЦИ «Медиалогии» — не указан период выборки, не указано, по каким категориям СМИ идёт выборка (региональные, федеральные, международные?)... Тем не менее, здесь есть, на что обратить внимание в связи с рассуждениями о «дружественном» цитировании, которые позволяют исчерпывающе раскрыть принципы системы «Медиалогии» и игры с цифрами в заметке ЦДИ.

В приведённой таблице показано, якобы, некое рекордное количество ссылок «Комсомольской правды» и «Аргументов и фактов» на ПАИ и «Псковскую правду», причём на последнюю - в каких-то нездоровых пропорциях: например, указано 1610 ссылок на «Псковскую правду» в «Комсомольской правде» (при этом на ПАИ — 136, на ПЛН — 55). То же самое - с «АиФ» (1740, 34, 29). По логике автора, это должно было бы дать какие-то явные преимущества в рейтинге. Но «Псковская правда» по итогам года — лишь на 4-й позиции с более чем трехкратным отставанием от тройки лидеров по индексу цитируемости. 

Всё это объясняется теми самыми алгоритмами «Медиалогии», которая определяет индекс цитируемости СМИ не только и не столько по количеству его упоминаний, сколько по влиятельности источников, цитирующих заметку. Благодаря этому одна публикация в действительно влиятельных и авторитетных СМИ, на которые, как правило, массово ссылаются сотни и тысячи других медиа (а-ля «Коммерсантъ», «Ведомости», Лента.ру, Газета.ру, ТАСС, РИА Новости etc), «весит» больше, чем сотни публикаций в изданиях второго-третьего ряда. Если конкретнее: одна ссылка в газете «Ведомости» даёт СМИ плюс более чем 1,5 пункта к индексу цитируемости, тогда как более 200 (!) ссылок на сайте межрегионального медиа, но менее авторитетного (например, «Первый региональный») - лишь несколько десятых пункта. 

«У многих экспертов эта система вызывает скепсис, более того звучат обвинения, что результаты подгоняются под конкретного заказчика», - пишет автор ЦДИ. И вот тут впору развеять ещё один миф, рассчитанный лишь не тех, кто не видел и не тестировал систему «Медиалогия» «вживую». Результаты анализа выдаются любым пользователям про любые СМИ и бренды без ограничений — то есть никаких «заказчиков», под которых что-то подгоняется, тут в принципе нет. Более того, в отчётах системы указаны не какие-то абстрактные цифры упоминаний и их индексы цитируемости, а конкретные гиперссылки на публикации и скриншоты этих заметок. При этом достоверность полноты приведённого системой перечня легко проверяется обычными поисковыми запросами по конкретному сайту в «Яндексе» или Google.

Кстати, что касается приведённой выше таблицы, то для 2015 года, по которому были опубликованы результаты замеров, с учётом исследования именно федеральных выпусков «Комсомольской правды» и «Аргументов и фактов», она выглядит так:

Итоговые суммы — даже несмотря на весьма урезанную (а потому не слишком репрезентативную) выборку источников — в принципе отражают указанное «Медиалогией» в официальном отчете соотношение упоминаний псковских СМИ.

Показатели индексов цитируемости ПАИ и ПЛН за 2015 год по месяцам

Обозреватель ЦДИ приводит ещё несколько таблиц — например, с указанием количества внешних ссылок на ресурсы по данным сервиса linkpad.ru:

При этом не ясно, что должны продемонстрировать эти данные, поскольку, во-первых, нет указания, что они ограничены конкретно исследуемым 2015-м годом, а, во-вторых, данные не ограничены категорией «упоминания в СМИ», то есть не говорят ни о чём, кроме огромной и в большинстве своём «мёртвой» ссылочной массы в Сети на практически любые СМИ из-за существования всевозможных автоматизированных сайтов-агрегаторов, которые не имеют реальной аудитории и существующих исключительно для торговли пресловутыми ссылками. О том же, в общем-то, говорит и апеллирование в статье к тематическому индексу цитирования «Яндекса» (так называемому тИЦу), который определяется не за год, а за «всё время» и имеет более обобщённую методику исчисления, в которой под мониторинг попадают не только упоминания в СМИ, но и на других сайтах.

При этом в статье на ЦДИ ни с того ни с сего упоминаются факты, никак не связанные с Псковской областью и местным медиаполем. Объяснить это странное обстоятельство нам помог все тот же «Яндекс»: в тексте множество прямых заимствований из интервью руководителя информагентства «Татар-информ» Леонида Толчинского, так же, как и ПЛН, обиженного на «Медиалогию». 

В этом интервью, кстати, есть множество примеров откровенной дезинформации, перекочевавших в текст ЦДИ. «Еще один важный момент - существует большой бизнес по продаже и покупке ссылок, в том числе и в значимые федеральные издания. И дополнительного контроллера, который бы отсекал купленные ссылки, который есть у «Яндекса», у «Медиалогии» нет», - утверждается в тексте. Но, как мы уже отмечали, в таблицах «Медиалогии» приводятся лишь конкретные ссылки на статьи, в который прямо подсвечено упоминание СМИ - такие ссылки попросту не покупаются. 

Всё это, конечно, происходит от банального желания скорректировать неудобные данные, вместо того, чтобы, как сказано в той же статье ЦДИ, «с открытым забралом презентовать свои конкурентные преимущества». 

Никто не спорит, что индекс цитируемости — прямо не связанный с посещаемостью показатель. Скорее, это мерило качества работы журналистов, оперативности, точности и полноты публикуемых новостей, профессиональное признание коллег. На посещаемости же может сказываться ещё множество факторов — от особенностей поисковой оптимизации и инерционности привычек аудитории до «игры за гранью фола» - банальных «накруток» за счёт покупки трафика. 

Но для предметного разговора об этой теме необходимо иметь открытую статистику по ведущим метрикам. У Псковского агентства информации все данные статистики давным давно полностью открыты. У изданий холдинга «Гражданская пресса» — нет.

Сергей Васильев
Версия для печати












Рейтинг@Mail.ru
Идет загрузка...