
Он отметил, что в последнее время академическая деятельность часто приводит его к разговорам о современных технологиях, связанных с большими языковыми моделями.
- Конференции, рецензии на статьи, обсуждения в чатах и на форумах - все это не только отличный источник знаний, но и живые примеры того, как язык адаптируется к новым реалиям, - рассказывает Шульгинов. - Как говорят англичане, "раскрыть рот - значит себя разоблачить". Мне кажется, что выбираемые слова представляют собой своего рода одежду: как халат врача или бутсы футболиста.
Итак, лингвист поделился разными названиями искусственного интеллекта, которые показывают, кем является говорящий.
ИИ/АИ - удобный зонтичный (объемный) термин для обозначения всего спектра технологий, связанный с технологией нейронных сетей.
К сожалению, объяснил Шульгинов, этот "зонтик" имеет слишком широкие поля и скрывает незнание академических тонкостей.
- Я обычно встречаю этот термин в заявках на гранты или докладах на междисциплинарных конференциях, где он используется неспециалистами в качестве магического заклинания, - пояснил он.
В неформальном общении с коллегами так говорить вполне уместно, но в серьезной научной статье он вызывает вопросы и сомнения.
По мнению Валерия Шульгинова, здесь чаще всего идет речь о поверхностном уровне знакомства говорящего с технологией.
LLM/ЛЛМ - самый нейтральный и точный термин для больших языковых моделей (тип программы искусственного интеллекта, которая может распознавать и генерировать текст).
- Я встречаю его в серьезных научных статьях от разработчиков и исследователей, которые действительно работают с этими технологиями, - сообщает лингвист и добавляет, что в живом разговоре с коллегами из области машинного обучения часто слышит уменьшительные версии - вроде "ллмка" или "моделька". Добавление таких суффиксов, по его словам, как будто преуменьшает серьезность технологии и показывает иронию или даже снисходительность.
Это уровень знакомства с нейросетью - профессионалы, разработчики, исследователи в области машинного обучения и обработки естественного языка.
БЯМ - пример прямого калькирования англоязычного LLM (Большая Языковая Модель). Обычно используется в русскоязычных научных статьях и является следствием попытки русифицировать термин.
- Начинание хорошее, но БЯМы, постоянно мелькающие в научных статьях (в речи их предпочитают избегать), в какой-то момент начинают сильно раздражать, - признается Валерий Шульгинов. - Важно помнить: форма слова не менее важна, чем его содержание.
Это уровень знакомства с технологией - стихийный лингвист из мира технологий.
AGI (Artificial General Intelligence) - термин, любимый техническими специалистами, которые очень хотят выиграть грант, говорит Шульгинов, поэтому обещают разработать нечто, что пока не может существовать. Он часто встречается в блогах тех, кто хочет привлечь много читателей.
Уровень знакомства с технологией - знаток.
Гопотэ/Жэпэтэ (искаженное GPT) - это название, по мнению Валерия, используется блогерами, которые рассказывают о технологиях с иронией.
- Такое сознательное искажение названия - попытка поиграть со словом, но получается довольно неудачно и иногда вызывает улыбку скорее из-за странности самого пишущего, чем из-за тонкости юмора, - считает Шульгинов и называет этот знакомства с технологией - шарлатан.
И наконец, AMI (Advanced Machine Intelligence) - термин, придуманный спецами по машинному обучению, например, информатиком Яном Лекуном. - Он уже выиграл все возможные гранты и теперь может задумываться о более широких и нейтральных названиях для "умных" машин - без излишней антропоморфности и с уважением к разным точкам зрения, - поясняет лингвист.
Уровень знакомства с технологией: нейрогуру.
Валерий Шульгинов убежден, что со временем язык в этой области застынет в упорядоченном виде, как это уже случилось с терминологией в смежных областях науки и техники. Появятся общие для всех термины, четкие границы и понимание на всех уровнях - от новичков до экспертов.
- А пока мне кажется важным помнить, что язык - это не просто набор слов, а отражение нашего мышления и отношения к технологиям, которые мы создаем и используем", - подчеркнул он.