Глава 3. Данные – это новая нефть

Хэл Вариан, ведущий экономист Google, в обращении к Роберту Гойцуэте из Coca-Cola сказал в 2013 году: «Миллиард лет назад появился современный “человек разумный”. Миллиард минут назад зародилось христианство. Миллиард секунд назад выпустили IBM PC. А миллиард поисковых запросов назад… наступило сегодняшнее утро»[32]. И Google – не единственная компания с неохватным объемом данных. Для всех, от гигантов вроде Facebook и Microsoft до местных государственных органов и стартапов, сбор данных стал проще и дешевле, чем когда-либо. Эти данные обладают ценностью. Миллиарды поисковых запросов – это миллиарды строк данных, с которыми Google совершенствует свои службы. Данные даже называют «новой нефтью».

Прогностические машины полагаются на данные. Чем их больше и чем они лучше, тем качественнее прогнозы. Выражаясь языком экономистов, данные остаются ключевым компонентом прогнозирования, их ценность растет с удешевлением прогнозов.

В ИИ данные представлены в трех ипостасях. Первая – входные данные, которые загружаются в алгоритмы и используются для прогнозирования. Вторая – обучающие данные, необходимые для создания самих алгоритмов; с их помощью ИИ учится прогнозировать в реальной среде. И наконец, существуют также данные обратной связи, призванные постепенно улучшить эффективность алгоритмов. В некоторых случаях виды данных пересекаются, например одна и та же информация выполняет все три роли.

Но сбор данных может стоить дорого, следовательно, объем капиталовложений рассчитывается исходя из компромисса между выгодой от получения дополнительных данных и затратами на них. Чтобы принять оптимальное решение по инвестированию средств в данные, необходимо понимать, как машины их используют.

Более 800 000 книг и аудиокниг! 📚

Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением

ПОЛУЧИТЬ ПОДАРОК