Разработка функции вознаграждения

Прогностические машины выдают более точные и дешевые прогнозы, и нам необходимо решить, как использовать их наилучшим образом. Возможно заранее сформулировать суждение или нет, кто-то его должен выносить. Разработка функции вознаграждения – это процесс определения положительной отдачи от разных действий с учетом выданного ИИ прогноза. Качественная разработка требует понимания потребностей организации и технических возможностей машины.

Иногда в разработку функции вознаграждения входит кодирование суждения – программирование положительной отдачи до совершения прогноза с целью автоматизации действий. Примером запрограммированных вознаграждений являются беспилотные автомобили. Действие незамедлительно следует за прогнозом. Но вот правильно выбрать вознаграждение не так просто. Следует предусмотреть вероятность, что ИИ чрезмерно оптимизирует один критерий успеха и, как следствие, отклонится от общих целей организации. В сфере беспилотных автомобилей над этим трудятся целые комитеты; однако такой анализ понадобится для самых разных решений.

В других случаях количество возможных прогнозов повышает издержки на предварительное суждение обо всех вариантах отдачи. Человеку приходится дожидаться прогноза и только после этого оценивать отдачу, как это происходит почти во всех процессах принятия решений, с машинным прогнозом или без него. Как мы увидим в следующей главе, машины уже посягают и на это. В некоторых обстоятельствах прогностические машины могут научиться прогнозировать человеческое суждение на основе предыдущих решений.