ЕЛЕНА КОСТЫЛЕВА попыталась разобраться, как устроены рейтинги на главной странице «Яндекс-блогов»
Чтобы ответить на вопрос «как настроение?», мне нужно сначала посмотреть, что в новостях. Бывает, разрешат человеконенавистнический марш, а каких-нибудь нежненьких цветочков в очках арестуют. И вот сидишь, пока не выпустят, переживаешь. Тут же дают о себе знать наследственные заболевания — демшиза то есть.В том году плохих новостей было больше, чем хороших. Я стала даже заходить по ночам на сайт «Эха Москвы» и читать транскрипты разговоров Гельмана с Павловским. Кризис был, зима; зимой люди злые вообще. А потом как-то распогодилось, Дмитрий Анатольевич завел ЖЖ и приснился мне в эротическом сне — оттепель, в общем, пришла.
И только главная страница blogs.yandex.ru не давала мне покоя — в просторечии «морда».
Зайдешь туда, а там главная новость дня — день рождения комсомола. Какого комсомола?
Жалуюсь друзьям, а они говорят: портал федерального значения, что ты хочешь. Зеркало блогосферы. Шесть миллионов посетителей в день.
Я пристально следила за этой мордой, по ночам особенно. Помню, однажды был якобы самый популярный пост — о концерте никому не известного заезжего музыканта, а в топе — юзер dubva1, чей журнал уже к тому времени был засуспенжен.
Сам же сервис утверждал, что цветная революция в Молдавии породила 7900 записей, а главной новостью все равно было Благовещенье, постов — 1560.
И по запросу «Христос воскрес» были разные данные: число свидетельств данного события было разным на разных страницах поиска. Я чуть с ума не сошла.
Пришлось ехать на семинар «Яндекса» для разработчиков сайтов, смешиваться с толпой и выслушать там такие слова, как «кластер», «аппроксимация» и «механизмы релевантности».
После семинара я подошла к заслуженным работникам «Яндекса» Роману Иванову и Антону Волнухину со скриншотами: объясните, мол, пожалуйста, почему комсомол, что происходит с количеством записей и откуда берутся все эти поводы выпить типа «дня железнодорожника»?
— А, — говорят, — это у нас из «Яндекс-календаря». Когда робот приносит слова, он ищет совпадения в «Яндекс-календаре», а из «Яндекс-афиши» еще берет названия популярных фильмов.
— А заезжий музыкант, как его там?
— Покажите-ка… Это очевидная накрутка. Мы с этим боремся, как и со спамом, но не всегда получается вовремя заметить накрутчиков.
— А «дубва»?
— Топ юзеров высчитывается за полгода. Мы могли бы, конечно, его оттуда убрать, но не убираем специально. Сам уйдет со временем. Мы ничего не убираем вручную, у нас к минимуму сведен человеческий фактор. Это наша принципиальная позиция.
— А что делают контент-редакторы?
— Роботы приносят главные темы, ну представьте, какие. Проснулся юзер, не с той ноги встал, сходил в магазин — представляете, да, какие робот нам приносит слова. Наши контент-редакторы это все, конечно, вычищают. То есть могут, например, поправить название темы, для которой робот выбрал не нейтральный заголовок. Но вообще склеивать темы в одну и определять, что тема, а что нет, может только робот. Контент-менеджеры могут лишь решить, сделал он эту работу хорошо или нет.
— Как определяются популярные слова?
— Робот видит только резкие всплески популярности того или иного слова или словосочетания за последние сутки. В принципе, мем распространяется за шесть часов, а потом начинает перемещаться из главных тем дня во второстепенные. Если грубо, то темой дня считается то, о чем сегодня, то есть в последние сутки, внезапно стали говорить больше, чем обычно.
— А что же, — спрашиваю, — с самыми популярными запросами? Это же какой-то рак мозга. Почему ваши пользователи ищут в интернете «рассвет», «анаблепс» и «чак-чак»?
— А это, — говорит Роман, — те запросы из веб-поиска, про которые в блогах пишут чаще, чем в веб-поиске. Мы согласны, что странно получается. Мы вообще давно хотели это убрать. Слышишь, Антон, когда мы уже уберем с морды популярные запросы?
— Ни за что, — отвечает Волнухин, улыбаясь. — И никогда.
— Убирать, — объясняет Роман, — мы это не хотим, так как эти запросы иногда отражают картину быстрее, чем «темы дня». Но улучшать будем обязательно.
— А вот, — говорю, — перед прошлым Новым годом группа «Война» заварила дверь в ресторан «Опричник». 1 января по этому поводу было 1700 записей, а к 7 января уже только 800 — что их, съели, эти записи, куда они могли подеваться?
— А это, — говорит Роман, — у нас вообще неправда.
— То есть как, — говорю, — неправда?
— А так — неправда. Запрос, заданный пользователем, отображается неточно. Там вначале только кэшированные страницы считаются.
Спросить, что такое кэширование, значило выдать себя. Зато Роман рассказал, что с ним делать:
— Если вам нужно точно знать количество записей, вот вам маленький секрет: зайдите на шестую страницу результатов, на ней кэширование отключается.
— Ну хорошо, а что делать, если хочется выяснить, что происходит на самом деле?
— Вообще, blogs.yandex — наша любимая игрушка, и с ее помощью можно многое узнать. Но у нас семь миллионов блогов, триста тысяч постов в день и семьсот тысяч комментариев. Думать, что на морде blogs.yandex отражена картина дня в блогах, по меньшей мере странно. Кроме того, есть нерешенные проблемы с поиском и выдачей результатов. Если вас интересует, кто популярнее — Путин или Медведев или там панки или эмо, — есть такая кнопка, «Пульс блогосферы». Наберите там эти слова, вам покажут реальную картину, усредненную, за несколько месяцев.
Тут демшиза моя прошла. (Я попрощалась и ушла.)
Задумалась я: а чем так сильно медийная картина дня, то есть то, что мы видим в новостях, отличается от блогов с их роботами, почему она должна на мое настроение влиять и как я вообще дошла до такого? Ясно, что и новости, и «зеркало блогосферы» blogs.yandex — кривые зеркала.
С этой мыслью поехала я как можно дальше от интернета, на дачу, и там обратилась к книгам.
Прочла, наконец, биографию Хармса, в серии «ЖЗЛ» которая. Так вот Хармс газет не читал, считал, что в них мир «вымышленный, а не созданный». «Это только жалкий, сбитый типографский шрифт на плохой, занозистой бумаге», — писал он в письме актрисе Клавдии Пугачевой, «пустой и вздорной женщине», по словам биографа. А стихи — можно «снять с бумаги и бросить в окно, окно разобьется». «Созданный» мир, искусство, приравнивался Хармсом к «первой реальности», то есть к моим головокруженным дачным соснам и живым белкам — и он реальнее был для Даниила Ивановича, чем разделяемая большинством людей тоска газетная.
Но потом ему пришлось начать прессу читать, поскольку даже из советских газет можно было понять, к чему идет. Он понимал, что будет война. И что многие умрут с голоду, тоже понимал.
А я вот ничего не понимаю.
К чему идет-то? Похоже, что ни морда яндекса, ни новостная картина дня, ни какая-либо другая вымышленная реальность не могут нам этого сказать.
Кстати, в тот день, когда мне Дмитрий Анатольевич в приятном контексте приснился, я пересказала сон подружке. Она мне знаете что ответила? «Твой Дмитрий Анатольевич сегодня у себя в блоге написал что-то в том духе, что Ерофееву с Самодуровым надо по 12 лет дать».
Кроме шуток: мне еще никогда не было так неловко.
Другие колонки Елены Костылевой:
Декоративный фашизм, 23.04.2009
Шесть шестьсот, 07.04.2009
КомментарииВсего:1
Комментарии
- 29.06Продлена выставка World Press Photo
- 28.06В Новгороде построят пирамиду над «полатой каменой»
- 28.06Новый глава Росмолодежи высказался о Pussy Riot
- 28.06Раскрыта тайна разноцветных голубей в Копенгагене
- 27.06«Архнадзор» защищает объекты ЮНЕСКО в Москве
Самое читаемое
- 1. «Кармен» Дэвида Паунтни и Юрия Темирканова 3452219
- 2. Открылся фестиваль «2-in-1» 2343650
- 3. Норильск. Май 1270024
- 4. Самый влиятельный интеллектуал России 897952
- 5. Закоротило 822570
- 6. Не может прожить без ирисок 784771
- 7. Топ-5: фильмы для взрослых 761790
- 8. Коблы и малолетки 742014
- 9. Затворник. Но пятипалый 473384
- 10. ЖП и крепостное право 408265
- 11. Патрисия Томпсон: «Чтобы Маяковский не уехал к нам с мамой в Америку, Лиля подстроила ему встречу с Татьяной Яковлевой» 404529
- 12. «Рок-клуб твой неправильно живет» 371658
какой милый глагол.