Исследователи собрали базу сообщений с геометками, отправленных за год пользователями из Нью-Йорка и его окрестностей. Затем они отобрали сообщения с ключевыми словами, относящимися к спиртному, и отправили их на анализ работникам краудсорсинговой системы Mechanical Turk. Те должны были определить, действительно ли в сообщении говорится о потреблении алкоголя и, что более важно, пил ли сам автор сообщения. Аналогично исследователи поступили с информацией о местонахождении авторов сообщений. Полученные сведения были использованы для обучения алгоритма.
Ученые рассчитывают применить новую систему для анализа связи потребления алкоголя с географией и другими факторами, а также его влияния на здоровье жителей.