Язык
Нужен VPN
487 нейросетей
Нейросеть Proximal Policy Optimization (PPO)

Proximal Policy Optimization (PPO)

Proximal Policy Optimization (PPO) — это алгоритм обучения с подкреплением, разработанный компанией OpenAI. Он...

Нейросеть Trust Region Policy Optimization (TRPO)

Trust Region Policy Optimization (TRPO)

Trust Region Policy Optimization (TRPO) — это алгоритм оптимизации политик в обучении с подкреплением, который...

Нейросеть Asynchronous Advantage Actor-Critic (A3C)

Asynchronous Advantage Actor-Critic (A3C)

A3C (Asynchronous Advantage Actor-Critic) — это алгоритм глубокого обучения с подкреплением, который был предл...

Нейросеть DeepMind Control Suite

DeepMind Control Suite

DeepMind Control Suite — это набор сред для обучения и тестирования алгоритмов управления на основе глубокого ...

Нейросеть MuZero

MuZero

MuZero — это нейросеть, разработанная DeepMind, которая сочетает в себе элементы обучения с подкреплением и пл...

Нейросеть AlphaFold

AlphaFold

AlphaFold — это инновационная нейросеть, разработанная компанией DeepMind, которая специализируется на предска...