Лидеры опенсорса: зачем компании делятся своими разработками и как это развивает ИТ-рынок

На Российском интернет-форуме (РИФ-2025) прошла панельная дискуссия о роли ИИ-опенсорса в развитии российского ИТ-рынка. В дискуссии приняли участие представители ведущих технологических компаний: Сергей Бережной (директор по взаимодействию с разработчиками Яндекса), Даниил Гаврилов (T-Bank AI Research), Анатолий Шипов (Сбертех), Владислав Куренков (AIRI) и Алексей Анисимов (заместитель руководителя ДИТ Москвы). Модератором выступил Николай Никитин (ИТМО).
Спикеры обсудили мотивацию компаний для открытия исходного кода, влияние open source на развитие российского ИТ-рынка, вызовы воспроизводимости научных исследований и перспективы создания новых платформ для разработчиков.
В прошлом году ИТМО провел комплексное исследование российского рынка open source, основанное на сложной методике анализа открытых данных GitHub и PyPI, а также на мнениях экспертов ведущих технологических компаний. Результаты показали, что Яндекс занял первое место среди российских разработчиков open source-решений в области машинного обучения и работы с данными. Сбер занял второе место, а Т-Банк замкнул тройку лидеров. По словам Сергея Бережного, Яндекс опубликовал более 1500 репозиториев (хранилищ данных. - Прим. ред.), что подтверждает вклад компании в развитие рынка open source.
Воспроизводимость исследований является фундаментальным принципом научной деятельности, особенно в области искусственного интеллекта - в этом мнении сходятся эксперты рынка. Без открытого кода, сопровождающего научные публикации, работу нельзя считать полноценным научным исследованием.
"Open source - это не только код, но и большие датасеты, которые мы выкладываем. Это очень важный вклад в научное сообщество, потому что без большого массива структурированных данных проводить обучение, по сути, невозможно", - заявляет Сергей Бережной. К примеру, на международной конференции ACM RecSys исследователи компании представили открытый датасет для развития рекомендательных технологий Yambda. Это напрямую влияет на решение проблемы доступа к качественным данным, поскольку многим вузам и научным лабораториям критически не хватает данных для исследовательской деятельности.
Это подтверждает и Даниил Гаврилов из T-Bank AI Research: "Для исследовательского направления open source - это вопрос выживаемости".
Невоспроизводимые исследования не только теряют научную ценность, но и остаются невостребованными, поскольку новым ученым сложно продолжать работу на их основе.
Открытость кода и данных создает научную экосистему, где каждое исследование становится фундаментом для будущих работ. Когда исследователи предоставляют возможность легко воспроизвести и развить их результаты, это не только повышает индекс цитирования, но и способствует развитию всей научной области. Более того, рецензирование научных работ активно борется с попытками публикации невоспроизводимых исследований - рецензенты отклоняют статьи, построенные на закрытых моделях или не предоставляющие достаточной информации для воспроизведения. Такая принципиальная позиция защищает научное сообщество от распространения недостоверных результатов, которые могут ввести в заблуждение множество исследователей и направить их по ложному пути.
"Именно сообщества разработчиков играют ключевую роль для популяризации открытого кода в науке. Участники активно обмениваются своими разработками и результатами исследований. Они формируют особую среду, в которой открытый код становится нормой поведения, а нежелание делиться исходниками воспринимается негативно", - говорит Николай Никитин, лидер сообщества ITMO Opensource, руководитель лаборатории автоматического машинного обучения Института искусственного интеллекта Университета ИТМО.
Ранее на конференции Yandex Neuro Scale была представлена обновленная версия платформы для разработки SourceCraft. На ней появились ИИ-агент для полного цикла разработки, новые инструменты безопасности, расширенная кодонавигация и интеграция с облачной платформой Yandex Cloud для развертывания приложений. Она стала первым решением для командной разработки в России, где ИИ-агент встроен в полный цикл создания ПО внутри одной платформы.
"Хочется, чтобы SourceCraft стал следующим эволюционным витком развития платформ, потому что все существующие решения создавались более десяти лет тому назад", - говорит Сергей Бережной.
Российский бигтех развивает комплексную экосистему поддержки образования и молодых разработчиков. Компании предоставляют гранты как образовательным учреждениям, так и опенсорсерам, спонсируют и взаимодействуют с вузами через грантовые программы для совместной научной работы. По мнению участников, такая поддержка особенно важна для сильных студентов, которые создают проекты до того, как их затянет индустрия, - им нужны не только деньги и ресурсы, но и площадки для презентации проектов и поиска сообщества единомышленников.
"Мне, как представителю университета, кажется, что такого рода гранты - это классный способ поддержать студенческие инициативные проекты. У нас есть действительно талантливые ребята, которым пока удается балансировать между учебой и активной проектной деятельностью. Несмотря на плотный график, студенты создают удивительные проекты буквально на чистом энтузиазме. И такая поддержка, не только деньгами, ресурсами, даже и площадками для того, чтобы рассказать о своем проекте, найти сообщество единомышленников, чтобы не тянуть все в одиночку, очень важна", - делится Николай Никитин из ИТМО.
В России активно обсуждается создание государственной экосистемы open source с фокусом на безопасность и развитие локального экспертного сообщества. По мнению участников, важнее развивать локализованную экспертизу, которой можно доверять. Обсуждается законодательная инициатива обязательной публикации в открытом доступе любого кода, написанного за деньги налогоплательщиков, - такой эксперимент уже планируется, хотя массовое внедрение пока не утверждено. Предлагается расширить эту практику на все проекты со значимым госучастием, включая научные исследования. Это позволит не только увеличить объем качественного российского open source, но и добиться экономии бюджетных средств за счет переиспользования (использование одних успешных кейсов или проектов другими. - Прим. ред.) компонентов.

