Выводы

• Прогностические машины используют три типа данных:

• обучающие данные для ИИ;

• входные данные для прогнозирования;

• данные обратной связи для повышения точности прогноза.

• Сбор данных требует затрат – вложения. Его размер зависит от того, сколько данных вам необходимо и чем осложнен процесс сбора. Крайне важно уравновесить издержки на приобретение данных с выгодой от повышенной точности прогноза. Для определения оптимального подхода требуется оценить окупаемость затрат для каждого типа данных: сколько нужно вложить для сбора и насколько ценным окажется повышение точности соответствующих прогнозов?

• Увеличение ценности с поступлением дополнительных данных зависит от статистических и экономических причин. С точки зрения статистики у данных – убывающая отдача. Каждая следующая порция данных улучшает прогноз меньше, чем предыдущая; десятое наблюдение более существенно для прогноза, чем тысячное. С точки зрения экономики все не так однозначно. Добавление данных к существующему большому объему может быть эффективнее, чем к маленькому, – например, если дополнительные данные делают прогностическую машину пригодной к использованию, повышают ее продуктивность или позволяют обойти конкурента. Таким образом, организация должна понимать взаимосвязь между добавлением данных, повышением точности прогнозов и увеличением ценности.