Какие продукты чаще всего исследуют ученые

Представьте стандартную продуктовую корзину. Крупа, хлеб, молоко, картошка… - довольно скучный набор. Для среднестатистического потребителя эти продукты имеют приблизительно равную ценность. Однако в научной картине мира все иначе: одни компоненты повседневного рациона становятся предметом жгучего исследовательского интереса, другие не получают и сотой доли этого внимания.

Мы вместе с разработчиками технологии Meet Articles провели собственное исследование на основе анализа больших данных - обработали свыше 30 миллионов статей из авторитетных научных журналов и выяснили, какие составляющие потребительской корзины изучены лучше всего и что нового благодаря им узнали ученые.

Meet Articles - сервис для обработки и визуализации больших данных, созданный командой студентов Московского физико-технического института (МФТИ). Разработка основана на алгоритмах машинного обучения и технологии смыслового анализа неструктурированных текстов ABBYY Compreno. Сервис позволяет искать научные статьи по узко заданным параметрам, сравнивать публикации и выявлять тенденции и делать прогнозы.

Сравнивали мы 15 продуктов: рис, картофель, мясо, помидоры, молоко, чай, хлеб, бананы, йогурт, кофе, сыр, шоколад, морепродукты, острый перец и лакрицу. Иные, конечно, возразят: почему именно рис, а не греча? Те же, кто из магазина обычно выходит нагруженный пачками амарантовой крупы, банками фуа-гра и гроздьями лонганов, тихо посетуют на слишком уж прозаичный набор продуктов.

Ответ будет прост: большинство этих продуктов космополиты - распространены во всем мире, и, значит, объемы их производства существенно выше, чем у остальных. Как следствие, исследуют их тоже чаще. Рис, например, второй по популярности злак после пшеницы, так что греча и тем более амарант ему не конкуренты.

Однако экзотику в список мы все-таки добавили, но недорогую: острый перец и сладко-соленые конфеты из корня солодки (лакрицы), к которым люди относятся как к романам Франсуа Рабле, - либо обожают, либо терпеть не могут. Эти продукты нам понадобились для красоты эксперимента, а точнее, чтобы сделать более контрастными результаты сравнения. Ведь интересно сопоставлять не только объекты из одной весовой категории, но и, казалось бы, совершенно разнокалиберные. Порой можно обнаружить, что при всех различиях они обладают схожими свойствами.

Еще один важный момент: как бы нам ни хотелось включить в список блюда вроде торта, гамбургера, хашламы или борща, сделать это не позволяет научная совесть. Обычно исследуют отдельные ингредиенты или продукты с минимальным их составом типа хлеба. Научную работу а-ля "Влияние кислых щей на центральную нервную систему и развитие зависимости" можно встретить, наверное, только у кандидата на Игнобелевскую премию.

Определившись с наполнением потребительской корзины, мы задали параметры поиска сервису Meet Articles. Искать сведения о продуктах нужно было в самых разных статьях, отнюдь не только из области медицины, биологии и сельскохозяйственных наук. Хотя, как увидите, на них приходится бóльшая доля публикаций. Интересно было узнать, как часто еду исследуют социологи, психологи, антропологи, археологи. Неохваченными остались разве что физики да астрономы.

В итоге на все 15 объектов потребительской корзины мы составили досье, в которых указали количество статей с распределением по научным областям и дали небольшие аннотации к самым цитируемым публикациям. Такие выжимки помогают отследить, чем конкретный продукт привлек внимание ученых и что рассказал им о себе, о здоровье людей и об окружающем мире.

Всего алгоритм Meet Articles обработал 31 606 762 статьи из международных научных журналов, опубликованных в период с 1900 по 2017 год.