Google Pathways Архитектура нейронных сетей

Продукт

Название базовой системы (платформы):	Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики:	Google

Основная статья: Нейросети (нейронные сети)

2021: Анонс разработки проекта Pathways

2 ноября 2021 года стало известно о том, что в компании Google ведутся разработки проекта Pathways, архитектуры нейронных сетей, которые смогут выполнять сразу множество разных задач.

Google разрабатывает новую архитектуру нейросетей, способных выполнять сразу множество задач. Фото: dit.urfu.ru.

Как сообщалось, на октябрь 2021 года нейросети тренируют, как правило, на выполнение какой-то одной задачи. Например, если нейросеть используется для исправления ошибок в написании слов, то, если ее перетренировать на поиск грамматических ошибок, она забудет, как исправлять орфографические.

Примерно так тренируются большая часть моделей машинного обучения. Вместо того, чтобы расширять существующие модели для обучения различным задачам, мы тренируем модели с нуля — для выполнения одной-единственной задачи. Как следствие, мы вырабатываем тысячи моделей для тысяч индивидуальных задач. В результате обучение задаче не только занимает больше времени, но и требует больше данных.

написал в блоге компании ее вице-президент Джефф Дин (Jeff Dean)

В Google указывают, что архитектура Pathways призвана изменить это: нейросети вполне можно натаскивать на выполнение множества разных задач, считают в компании. Идея состоит в том, чтобы обучать будущие системы ИИ сразу множеству навыков, которые та могла бы использовать и комбинировать для того, чтобы самостоятельно обучаться выполнению различных задач.

Мы хотели бы иметь возможность тренировать модель так, чтобы она могла не только выполнять сразу несколько различных задач, но также использовать и комбинировать уже выработанные навыки для обучения задачам — быстрее и эффективнее. В частности, то, что модель узнает, обучаясь одной задаче, например, то, как по авиационным фотоснимкам выявлять возвышенности ландшафта, может помочь выполнению другой задачи — прогнозированию того, как по данной местности будут протекать потоки воды. Мы хотим, чтобы модель имела различные возможности, которые можно было бы использовать по мере надобности, и которые можно было бы комбинировать для выполнения других, более сложных задач. Это небольшой шаг к тому, как мозг млекопитающих обобщает разные задачи.

написал Дин

В Google также указывают, что Pathways позволит реализовать мультимодальные модели, которые будут способны обрабатывать и понимать входящие визуальные, акустические и языковые данные — все одновременно. Так, чтобы когда машина имела дело со словом «леопард» или слышала, как кто-то произносит это слово, или анализировала видеозапись с изображением бегущего леопарда, реакция была бы одинаковой во всех трех случаях: машина распознавала бы идею леопарда.Елена Истомина, Directum: Как no-code меняет стоимость проекта 6.4 т

Еще одной проблемой, с которой Pathway должен будет помочь справиться, заключается в том, что на ноябрь 2021 года модели машинного обучения предполагают задействование всех нейроузлов сети, вне зависимости от того, насколько простой или сложной является задача. В Google полагают, что можно добиться «разреженной» активации, то есть, направлять задачи лишь на отдельные массивы нейроузлов. Такой подход еще и куда менее энергозатратен.

Концепция разреженной нейросети уже применена в проектах Google Switch Transformer, модели для понимания естественного языка, и Gshard. Они потребляют всего лишь одну десятую энергии, которую пришлось бы расходовать на более традиционную нейросеть, где активируются все нейроузлы разом.

В будущем Google ожидает, что Pathways приведет к созданию нейросетей, способных выполнять миллионы различных задач, проводить обобщения между ними, комбинировать их по мере надобности, понимать различные типы данных и работать с ними более эффективно. Целью проекта является переход «от эры однозадачных моделей, которые просто распознают паттерны, к многозадачным интеллектуальным системам, которые отражают более глубинное понимание нашего мира и могут адаптироваться к потребностям^[1]».