Нейросети

Нейросеть Proximal Policy Optimization (PPO)

Proximal Policy Optimization (PPO)

Proximal Policy Optimization (PPO) — это алгоритм обучения с подкреплением, разработанный компанией OpenAI. Он...

Нейросеть Trust Region Policy Optimization (TRPO)

Trust Region Policy Optimization (TRPO)

Trust Region Policy Optimization (TRPO) — это алгоритм оптимизации политик в обучении с подкреплением, который...

Нейросеть Asynchronous Advantage Actor-Critic (A3C)

Asynchronous Advantage Actor-Critic (A3C)

A3C (Asynchronous Advantage Actor-Critic) — это алгоритм глубокого обучения с подкреплением, который был предл...

Нейросеть DeepMind Control Suite

DeepMind Control Suite

DeepMind Control Suite — это набор сред для обучения и тестирования алгоритмов управления на основе глубокого ...

Нейросеть MuZero

MuZero

MuZero — это нейросеть, разработанная DeepMind, которая сочетает в себе элементы обучения с подкреплением и пл...

Нейросеть AlphaFold

AlphaFold

AlphaFold — это инновационная нейросеть, разработанная компанией DeepMind, которая специализируется на предска...

Нейросеть Ludwig

Ludwig

Ludwig — это мощная платформа для создания и обучения моделей глубокого обучения без необходимости написания к...

Нейросеть CLIP

CLIP

CLIP (Contrastive Language–Image Pre-training) — это модель, разработанная OpenAI, которая обучена связывать и...