termometrix 10 февраля 2024, 13:48 2 Информационные технологии

Российские ученые создали самый эффективный алгоритм для обучения и адаптации ИИ

Следи за успехами России в Телеграм @sdelanounas_ru

Ученые из лаборатории исследований искусственного интеллекта (ИИ) Tinkoff Research создали самый эффективный среди мировых аналогов алгоритм для обучения и адаптации искусственного интеллекта.

Новый метод, названный ReBRAC (Revisited Behavior Regularized Actor Critic — пересмотренный актор-критик с контролируемым поведением), обучает ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов в области обучения с подкреплением (Reinforcement Learning, RL), адаптируя его к новым условиям на ходу.

Разработка российских ученых в области повышения эффективности алгоритмов обучения ИИ может способствовать преодолению технологического и цифрового разрыва в мире между разными странами — более эффективные алгоритмы требуют меньше вычислительных ресурсов. Страны с ограниченными вычислительными мощностями смогут создавать и развивать передовые технологии, адаптировать ИИ под конкретные прикладные задачи, существенно экономя на дорогостоящих экспериментах с ИИ.

Результаты исследования были признаны мировым научным сообществом и представлены на главной научной конференции в области ИИ в мире — международной конференции по машинному обучению и нейровычислениям NeurIPS (The Conference and Workshop on Neural Information Processing Systems).

Визуализация качества альтернативных подходов и алгоритма ReBRAC. По горизонтальной оси — качество алгоритма относительно «эксперта» (служит эталоном для обучения ИИ-агентов), где 100 — это уровень эксперта. По вертикальной оси — процент испытаний, в которых удалось превзойти выбранную отсечку качества. Чем выше линия, тем лучше. Метод, предложенный Tinkoff Research, стал первым превзошедшим эксперта более чем в половине испытаний

Суть открытия

Ученые из Tinkoff Research идентифицировали четыре компонента, которые были представлены в алгоритмах последних лет, но считались второстепенными и не подвергались детальному анализу:

Глубина нейронных сетей. Увеличение глубины сети помогает ей лучше понимать сложные закономерности в данных
Регуляризация актора и критика. В ИИ-агентах есть два компонента: «актор», который предпринимает действия, и «критик», который оценивает эти действия. Ученые использовали совместную регуляризацию обоих компонентов, чтобы актор избегал нежелательных действий, а критик более эффективно оценивал их. Ранее не было понятно, как сочетать оба подхода с наибольшей эффективностью
Увеличение эффективного горизонта планирования — позволяет модели балансировать между краткосрочными и долгосрочными аспектами задачи и улучшает ее способность принимать решения
Использование нормализации слоев (LayerNorm) — стабилизирует процесс обучения нейронных сетей

Ученые из Tinkoff Research интегрировали эти компоненты в алгоритм-предшественникBRAC (Behavior Regularized Actor Critic —актор-критикс контролируемым поведением) 2019 года и провели исследование, поочередно варьируя каждый из них. Оказалось, что правильная совокупность этих компонентов дает даже этому старому подходу самую высокую производительность среди лучших аналогов на сегодняшний день. Модифицированный алгоритм получил название ReBRAC.

Тестирование на робототехнических симуляторах показало, что алгоритм обучает ИИ в четыре раза быстрее и на 40% качественнее всех существующих в офлайн-бенчмарках. Ранее лидерство принадлежало алгоритмуSAC-RND, также созданному учеными из Tinkoff Research.

© www.tinkoff.ru

Визуализация вариантов тестирования алгоритма: поиск цели в лабиринте (Ant), скорость бега (Halfcheetah, Hopper, Walker2d), задачи для робокистей — правильно держать ручку (Pen), открыть дверь, забить гвоздь, переместить объект

ReBRAC также эффективнее всего решает проблему дообучения искусственного интеллекта, который обычно медленно адаптируется к новым условиям. Например, робот, который был изначально обучен передвигаться по траве, упадет, если переместится на лед. ReBRAC же позволяет ИИ лучше учиться на ходу и адаптироваться.

Признание открытия мировым научным сообществом

В 2023 году рецензенты международной конференции по машинному обучению и нейровычислениям NeurIPS (The Conference and Workshop on Neural Information Processing Systems), на которой было представлено открытие ученых из Tinkoff Research, получили на рассмотрение свыше 13 тысяч статей от ученых со всего мира, из которых 3,5 тысячи были отобраны для представления на конференции. Селективность — всего 26%. Среди них сразу четыре научные статьи Tinkoff Research. Помимо алгоритма ReBRAC ученые представили две открытые библиотеки в области офлайн-обучения с подкреплением (Offline RL, ORL), благодаря которым специалистам по ИИ больше не требуется самостоятельно воспроизводить результаты наиболее весомых научных работ. Статьи уже цитируются ведущими исследовательскими лабораториями со всего мира — в их числе Стэнфордский университет, Калифорнийский университет в Беркли и научно-исследовательская лаборатория Google DeepMind.

Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в телеграмм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈

Источник: www.tinkoff.ru

Поделись позитивом в своих соцсетях

Другие публикации по теме

Вступай в наши группы и добавляй нас в друзья :)

Следи за успехами России в Телеграм @sdelanounas_ru

ПО, Tinkoff Research

3
termometrix
10.02.2414:16:15

Разработка создана совместно с учёными из Физтеха.

#1277256 ↑

Написать комментарий

Отмена

Для комментирования вам необходимо зарегистрироваться и войти на сайт,

Обсуждаемые

В Екатеринбурге открылась «УГМК-Арена»

УГМК-Арена соответствует требованиям международных спортивных федераций, может принимать спортивные соревнования, включая чемпионаты Европы и мира, минимум по 11 видам спорта: помимо хоккея... 6
В Сибири строится центр тяжелого машиностроения полного цикла

К следующему десятилетию в Емельяновском районе Красноярского края начнет работу Центр тяжелого машиностроения. Проект создания завода начался еще в 2014 году. 5
Ростех продолжает развивать Тырныаузский горный кластер

Группа компаний «Эльбрусметалл», созданная при участии Госкорпорации Ростех, продолжает развивать Тырныаузский горный кластер, который включает разработку вольфрамово-молибденового и ... 5
Станок лазерной резки металла INVADER и станок плазменной резки ULTRATHERM на выставке МашЭкспо 2025

Завод-производитель станков с ЧПУ «СПИКОМ» в начале марта 2025 года представил на выставке МашЭкспо Сибирь 2025 станок лазерной резки металла INVADER PRO-1530 и станок... 4
Инвестиции в основной капитал в России в 2024 году выросли на 7,4%

/ТАСС/. Инвестиции в основной капитал в России по итогам 2024 года по сравнению с 2023 годом увеличились на 7,4%, следует из данных Росстата. 3

Лучшее из блогов

kb_panorama опубликовал запись

«Панорама Фото» для отечественных ОС обеспечивает создание ортофотопланов по снимкам с БПЛА

Изображение создано с помощью нейросетиВ КБ «Панорама» разработана программа обработки материалов воздушного фотографирования «Панорама Фото» версии 1.6 с испол... читать
sanya.mitnickii опубликовал запись

Вышневолоцкий кирпичный завод: От царской России до современности РФ

Вышневолоцкий кирпичный завод (ВВКЗ) — это не просто предприятие, производящее строительный материал. Это часть истории, живое свидетельство развития строительной отрасли России. Как ... читать
termometrix опубликовал запись

Инвестиции в основной капитал в России в 2024 году выросли на 7,4%

/ТАСС/. Инвестиции в основной капитал в России по итогам 2024 года по сравнению с 2023 годом увеличились на 7,4%, следует из данных Росстата. читать
Bionysheva_Elena опубликовал запись

Новый ФАП открылся в Самарской области

Новый фельдшерско-акушерский пункт (ФАП) начал работу 5 марта в селе Малячкино, расположенном в Шигонском муниципальном районе Самарской области. Его открытие стало частью реализации национ... читать
Svetlana_F опубликовал запись

Лазерный перемонтаж микросхем BGA — безупречное качество в промышленных масштабах

лазерный реболлингЛазерный перемонтаж — это инновационная для российского рынка технология, которая даёт возможность в минимальные сроки выполнять высококачественную замену шариковых ... читать

все ссылки