При разговоре о медиа слово “данные” возникает в разных контекстах. Иногда речь идет о внутренней аналитике – например, успешно развивается основанный на данных (data-driven) маркетинг контента, тот же Buzzfeed определяет на ранней стадии потенциально вирусные материалы и дополнительно их продвигает. Иногда данные – это сырье для текстового или видеоконтента; выражения “журналистика данных” или “визуализация данных” уже не столько модные, сколько общепринятые.
Мне интересно чуть-чуть поговорить о самом непосредственном применении данных в медиапроектах – о той публичной базе данных, которая доступна пользователям.
Что это может быть:
-
каталоги (фильмов, компаний, рецептов, игр, так далее) – как самые простые (теги, по которым группируется контент, внутренние энциклопедии), так и сложно структурированные (например, музыкальные группы, их альбомы, издания, жанры, песни и участники);
-
цифры: финансовые показатели, спортивная статистика, оценки и прогнозы экспертов;
-
геолокальные данные (погода, пробки, цены на недвижимость);
-
данные активности пользователей (оценки, рейтинги популярности).
База данных может находиться отдельно от новостного/ контента как отдельный сервис, может дополнять его (на финансовых сайтах выводятся сниппеты курса акций компании рядом с ее названием сразу в тексте). Она может быть как совсем статичной (энциклопедией), так и в разной степени интерактивной.
Что дают медиапроекту данные
1. Контент, часто более “многоразовый” и ценный, чем новостной
Для примера: посетителям медиа о кино обычно важнее, кто играет в фильме, кто его снял и какой это жанр, чем рецензия кинокритика или какие-то новости о съемках. Причем если такие новости станут читать только в ожидании фильма, то хорошо структурированные данные о фильме пригодятся еще много-много раз.
2. Глубину, дополнение и даже замещение текстового контента
Зачем читать текст про новый Windows, если можно посмотреть на реакцию рынка.
А еще можно уйти сразу на страницу компании, чтобы быстро посмотреть графики финансовых показателей и заголовки новостей. Или сравнить ее с другими. Короче, понять что-то самому, не читая длинные абзацы с ненужными подробностями.
Аналогично, без ссылки на статистику голов новость о том, что “Спартак” купил нового нападающего, куда менее информативна.
3. Структуру, которую любят люди и поисковики
В том самом отчете NYTimes упоминалось, что огромный массив рецептов начал привлекать аудиторию лишь после того, как был обработан и превращен в полноценную базу данных – с возможностью сортировки по ингредиентам и кухням, фильтрам по времени приготовления и сложности.
Если данные разумно организованы, то на сайте появляются многочисленные внутренние ссылки и правильные страницы, которые любят поисковики. Многие сущности или списки будут сооответствовать реальным поисковым запросам, даже если вы об этом не задумывались.
4. Возможность дополнительной обработки данных, создания на их основе сервисов, продажи обработанных данных
5. Меньшую зависимость от языка
Данные легче переводятся на другие языки и адаптируются, чем чисто текстовый и тем более визуальный контент. Даже если они целиком состоят из текста (база компаний, допустим), сохраняются связи между объектами. Это может очень помочь при масштабировании вашего проекта на другие рынки или создании на его базе отдельных сервисов (как мы на Sports.ru поступили, например, со специализированным приложением Scores&Video).
Откуда берутся данные
1. Бесплатные и платные поставщики
Открытых данных очень много, часто существуют и удобные API. Например, когда нам понадобилось для одного из рекламных спецпроектов показывать текущую погоду в разных уголках мира, нашелся простой и удобный сервис. Что-то можно получить парсингом общедоступных ресурсов вроде Википедии.
2. Собственная служба информации
Многие данные проще вбить руками, чем тратить драгоценное для любого медапроекта время разработки. Помимо этого, служба информации может улучшать и структурировать данные поставщиков или пользователей. Даже если какие-то данные есть у всех, как спортивная статистика или погода, небольшая их обработка может сделать продукт уникальным.
3. Ваши активные пользователи
Если дать возможность пользователям наполнять вашу базу, многие с охотой этим займутся – я сам когда-то потратил немало времени на дополнение базы сайта Rate Your Music. Людям приятно приносить пользу, особенно если это связано с их хобби. Разумеется, вам нужно будет выстроить правильную систему защиты и проверки данных, но отдача в итоге может быть огромной.
4. Они уже есть
Сейчас каждый сайт или приложение основаны на базе данных, современные CMS хранят кучу информации – а значит, у вас есть как минимум данные об активности редакции и пользователей. На какие темы в этом году пишут больше? Что вызывает более противоречивую реакцию? Что вы хотите рассказать своим пользователей Все эти данные могут у вас уже быть, нужно просто их продемонстрировать.
Пара мыслей на тему
Проекты могут развиваться в разные стороны – от базы данных к медиа с редакцией (условный Кинопоиск) или наоборот (так часто бывает со спортивными проектами). Первый путь выглядит даже более надежным, менее зависит от человеческого фактора – старых заслуженных сайтов-баз данных в интернете не меньше, чем чисто редакционных проектов (или хотя бы просто старых блогов). Даже если авторы их забрасывают на какое-то время, проекты живут. При этом база данных сама по себе легко копируется полностью – поэтому нужно создавать дополнительную ценность, организовывая вокруг нее сообщество.
Идеальное современное медиа, видимо, должно активно использовать и редакцию, и UGC, и обширную и разнообразную базу данных. Хорошо организованные данные быстро воспринимаются, объективны и выразительны – это то, чего требуют от журналистики и чего в ней куда сложнее добиться. Работа с информацией, разумеется, не должна происходить отдельно от редакции: выбор того, что интересно было бы представить аудитории, и формат этого представления – вполне и в ее зоне ответственности тоже.
Собственно, это одна из сложных, но и особо интересных задач – какие именно данные будут интересны вашей аудитории постоянно? Зарплаты в отрасли и изменения цен? Календари событий? Контакты важных людей и организаций? Преступность и загрязненность? Или элементарные погода и пробки (уже сложно представить себе локальное медиа без этого)? Там где есть огромный простор для фантазии, есть и возможность огромных успехов.