Увидел в тексте про стратегии стартапов в области AI интересную картинку (переведу сам текст на днях, наверное). По замыслу автора, она иллюстрирует data network эффект: больше данных→лучше алгоритмы→лучше продукт→больше пользователей→… (повторить миллион раз) …→ПРИБЫЛЬ. Но вообще-то описанный в ней процесс стар как мир, если обращать внимание на его суть, а не на модные слова.
Дело в том, что “более умные алгоритмы” не всегда обозначают высшую математику. Улучшения в работе бывают разными, и если они основаны на реальном отклике (т.е. данных), то цикл уже работает. Улучшением может стать обычное “раньше даже не думали об этом, а сейчас появился ответственный сотрудник Валерий”. Или “раньше Валерий кидал в фейсбук все подряд, а теперь стал скрывать то, что плохо заходит”. Алгоритм – это порядок работы, а не только кусок кода (забавно, что на картинке умные алгоритмы проиллюстрировали шестеренками, которые люди используют больше двух тысяч лет).
Выводы из данных, кстати, могут делать любые сотрудники, а не только data scientists в белых халатах в худи MIT. Средневековый пекарь, который следил, что в его пекарне охотнее разбирают, был data-driven не меньше, чем современный маркетолог. Даже самые умные роботы – лишь еще одно средство, а не что-то радикально новое.
С другой стороны, Валериев на все случаи не напасешься, интенсивность их работы ограничена. Любой достаточно сложный бизнес (крупнее средневекового пекаря) должен использовать машинное обучение и прочие умные алгоритмы. Медиа это тоже касается, и данные им тоже нужны в промышленных масштабах. Но к этому вернемся чуть позже.