Dolphin Blog

Dolphin X1 405B: Single Node Llama 405B Training

We explore finetuning AllenAI's Tulu-3 405B on a single B200 node to be uncensored and de-aligned resulting in Dolphin X1 405B, and tips to help save VRAM when training such a large model.

Xgen RL: When Reinforcement Learning Goes Wrong

Dolphin X1 405B: Single Node Llama 405B Training