Мой спектрограф шарит в кофе

Казалось бы, где приготовление кофе, а где нанооптика. Все просто: в апреле Балашов вместе с другими сотрудниками лаборатории: Ильей Новиковым, Юрием Поймановым и программистами с кафедры ВМК МГУ Русланом Габдулиным и Евгением Бобровым заняли первое место в российском этапе конкурса Microsoft Imagine Cup с установкой, которая на основе спектральных данных кофе или вина делает вывод о вкусе напитка. На увесистом металлическом столе в лаборатории стоит прототип, принесший им победу: спектрометр, галогеновая лампа, кювета для жидкости и коллиматор. В прозрачную кювету наливают кофе или вино, загорается лампа, луч света проходит через емкость с напитком, частично им поглощается, частично рассеивается, а после этого собирается с помощью коллиматора и передается в спектрометр. Полученные данные обрабатываются на компьютере при помощи методов машинного обучения. — Мы пытаемся найти взаимосвязь между спектрами и вкусовыми параметрами, чтобы на основе спектральных данных делать вывод о вкусе напитка, — поясняет Балашов. За его спиной Новиков вставляет капсулу в кофеварку. Та шипит, булькает, и по лаборатории разносится запах свежесваренного кофе. Шестью секундами позже на экране компьютера появляются данные: две кривые красного цвета. Время анализа определяется временем экспозиции: около 0,5 секунды на одну спектрограмму. Для большей точности ребята записывают 10 спектрограмм, или снимают 10 фреймов, поэтому среднее время записи одного образца составляет 5 секунд, плюс еще одна секунда уходит на обработку данных. — Сейчас спектрометр слишком подробный. Мы можем взять диоды, которые будут существенно меньше, у которых есть определенная ширина покрытия, тоже в нанометрах, и тогда покроем весь этот диапазон чуть менее подробно. Это, «а», снизит стоимость, и, «бэ», позволит сделать прототип компактным, — говорит Новиков. — С помощью этого спектрометра мы снимаем 1024 параметра. С помощью метода главных компонент, — это классический метод машинного обучения и матстатистики для сжатия данных, — мы их сжимаем до двадцати. И этого достаточно, с лихвой. Было бы здорово уплотнить до пяти, — дополняет коллегу программист Руслан. Игорь же уверен, что после доработки — ребята собираются сделать прототип размером чуть больше фломастера, чтобы опускать его в чашечку с кофе, — аппарат будет снимать меньше данных, а значит работать быстрее. И на результаты будет меньше влиять окружающая среда, например, освещение. Тем временем на экране появляются две красные линии. — Ух-ты! Ничего себе! — восклицает Новиков. Я думаю, неужели он узнал по этим линиям, что сваренный кофе получился в меру крепким и слегка кислым? Но физик тут же сообщает, что эти данные лишь позволяют увидеть, что один сорт кофе отличается от другого. Как это выражено во вкусе, можно будет понять только благодаря методам машинного обучения. — Сначала мы набираем базу данных, готовя одним и тем же образом разные сорта кофе. Потом снимаем показания: коэффициент преломления, кислотность. Сейчас мы нашли корреляцию между двумя характеристиками: коэффициентом преломления и кислотностью, — рассказывает Балашов. — Но в дальнейшем мы планируем анализировать и содержание кофеина, горчинку. Например, горчинку будем оценивать с помощью спектрофотометрии. Это более точный спектральный метод, который позволяет найти пики, которые относятся к аминокислотам, кофеину, и распознавать процентное содержание с помощью резонансных методов — флуоресценции или еще как-то. Отсюда мы будем вычленять содержание кофеина, эту самую горчинку. По словам ученых, точность распознавания сортов кофе или марок вина с помощью их прибора составляет 90−100%. — Когда мы говорим о таких параметрах, как TDS (это доля растворенных твердых веществ в сваренном напитке — прим. «Чердака») и кислотность, то мы работаем с непрерывными данными, и пытаемся по результатам анализа спектральных данных восстановить непрерывную шкалу. В этом случае успешность нашего подхода характеризует параметр квадратичное отклонение, изменяющийся от нуля — полный провал — до единицы, в случае абсолютно точного попадания в численное значение, измеренного непосредственно с помощью рефрактометра или pH-метра. Так вот, в экспериментах нам удавалось добиться определения кислотности и TDS с квадратичным отклонением вплоть до 0,85, — продолжает Балашов. Исследователи уже собрали данные о 28 видах кофе, приготовленных одним и тем же способом. Один и тот же кофе, который отличается помолом или способом приготовления: например, сваренный в турке или заваренный кемекс, даст разные результаты. Я спрашиваю, почему именно кофе и вино? — Потому что это напитки с большим спектром вкусов, — отвечает Балашов. — А чай разве нет? — удивляюсь я. — Да. Но мы не очень по чаю. Мы любим кофе, — смеется Игорь. — А вино, ну, знаете, как-то само пришло, — широко улыбается Новиков. — У вас, наверное, в лаборатории часто пахнет или кофе, или вином? — интересуюсь я. — Нас за это постоянно ругают. Когда у нас пахнет вином, говорят, что запах, как в кабаке. Иногда так и есть. Но ничего, сейчас уже относятся с пониманием. А раньше скептически относились, говорили, что это как-то ненаучно, — добавляет Илья. — Я сам скептически относился, — перебивает его Балашов, — Мы исследуем саму форму спектральной линии. И именно это является необычным для физиков. Я не верил, что это будет работать. И первые месяца два-три на пятничных экспериментах я пытался сделать так, чтобы в результате анализа нам не удалось что-то распознать. Но раз за разом я убеждался, что это работает. Вино ребята исследовали только красное. Пятнадцать сортов, от сладкого до сухого. — А есть разница между вином в бутылке у пробки и вином на донышке? — спрашиваю я. — Да, отличия видны. Когда мы мерили спектр вина с верха бутылки или, наоборот, забирали его снизу, мы видели, как линия немного проседала, — отвечает Новиков. С вином ученые тоже поставили множество экспериментов. Сравнивали новое и старое (бутылка простояла открытой месяца два) вино одного и того же сорта. И выяснили, что по спектрам они отличаются друг от друга. Или анализировали сорта вина через стенку бутылки. Но стекло ведь будет влиять на данные измерений, предполагаю я. — Не-а, — качает головой Игорь, — Мы тоже так думали. Оно выступает как фильтр при снятии спектра, но тем не менее нам удается различать сорта. Для этого экспериментаторы взяли пять сортов вин, налили их в разные бутылки (всего девять), в том числе и из зеленого стекла, и перебрали все возможные комбинации, пытаясь определить, в какой бутылке какое вино. Точность распознавания составила порядка 90−95%. — Распознавание вина через бутылку может быть использовано на таможне для проверки контрафакта без необходимости вскрытия партии и проведения химических анализов. Сейчас приходится держать химическую лабораторию, которая анализирует выборочные бутылки из партии. Это существенно упростит и удешевит поиск контрафактов. Или производитель хочет достичь эталонного вкуса: на производственной линии идут бутылки, мы снимаем с них спектры. Если они будут отличать от эталонного, это сразу будет видно, — спускается Балашов с небес исследовательских задач на землю рыночных отношений. Стоимость прибора, по подсчетам ребят, не будет превышать 300 долларов. При этом, говорит Балашов, в хороших кафе сегодня бариста используют рефрактометр стоимостью около 700 долларов, который измеряет только один параметр кофе — TDS — процент растворенных твердых веществ в напитке, характеризующий уровень экстракции кофе. А разработка ученых может измерять 2−4 параметра. Когда методика распознавания будет отработана на одной жидкости, собрав необходимую базу данных, можно будет использовать прибор для исследования и других жидкостей. Игорь и Илья задумались об использовании методов машинного обучения для анализа вкусовых данных около года назад. Тогда эту идею им подсказал руководитель их проекта по хемометрике Андрей Грунин. И несколько месяцев ребята в лаборатории, как в свое время нобелевский лауреат Андрей Гейм, проводили пятничные эксперименты. Первоначально опыты проводили с помощью алгоритмов, разработанных выпускником физфака МГУ Дмитрием Пашковым. Убедившись, что метод работает, физики приняли участие в хакатоне, где познакомились со студентами с факультета ВМК Русланом Габдулиным и Евгением Бобровым. Программисты заново написали программную часть на основе уже собранных спектральных данных. Так и сложилась команда. — Когда я в первый раз здесь оказался, думал, мне сейчас выдадут халат и перчатки и скажут ничего не трогать, стоять на одном месте. Для меня тут все было удивительно. У математиков, максимум, что мы можем пощупать руками — это начинка компьютера, — вспоминает первые впечатления от лаборатории Габдулин. К середине апреля ребята собрали прототип и одержали победу во всероссийском финале конкурса Microsoft Imagine Cup. — К сожалению в конкурсе могут принимать участие только трое студентов, поэтому в Imagine Cup участвовали только Руслан, Евгений и я. Илья и Юра Пойманов — студент третьего курса, который работает над сбором установки и получением спектров, в заявку на конкурс не попали, — говорит Балашов. Дальше их ждет международный финал конкурса в Сиэтле (США), где в июле встретятся лучшие команды со всего мира и поборются за приз в 100 тысяч долларов.

Мой спектрограф шарит в кофе
© Чердак