Технологии искусственного интеллекта: глубокие нейронные сети, большие языковые модели, фундаментальные модели, что дальше?
р.
р.
Воронцов Константин Вячеславович доктор физико-математических наук, профессор РАН, зав. кафедрой машинного обучения и цифровой гуманитаристики МФТИ, зав. кафедрой математических методов прогнозирования Института перспективных исследований проблем искусственного интеллекта и интеллектуальных систем — заведующий лабораторией машинного обучения и семантического анализа МГУ им. М.В. Ломоносова, Москва, Россия voron@mlsa-iai.ru
Аннотация Последняя зима искусственного интеллекта закончилась сначала прорывом в области компьютерного зрения (2012 год), затем в области обработки и понимания естественного языка, больших языковых моделей (2022 год). Глубокие нейронные сети для обработки и анализа изображений, сигналов, текстов, графов — что в них общего? Действительно ли можно говорить об интеллекте, или это лишь очередная его имитация? Возможно ли предсказать тренды дальнейшего развития этих технологий? Чем заниматься в первую очередь, чтобы не быть вечными догоняющими? Надо ли сконцентрировать все усилия на создании общего искусственного интеллекта (AGI), или есть дела поважнее? Возможно ли разглядеть среди хайпа искусственного интеллекта новые идеи, которые изменят правила игры?
Ключевые слова: машинное обучение, глубокое обучение, понимание естественного языка, генеративные предобученные трансформеры, обучаемая векторизация данных, фундаментальные модели