DeepSeek v3 é um modelo de linguagem AI de última geração construído sobre uma arquitetura de Mistura de Especialistas (MoE), com 671 bilhões de parâmetros, com 37 bilhões ativados por token. Treinado em 14,8 trilhões de tokens de alta qualidade, ele se destaca em diversas áreas, incluindo raciocínio complexo, geração de código e tarefas multilíngues. As principais características incluem uma janela de contexto longa de 128K tokens, previsão de múltiplos tokens e inferência eficiente, tornando-o adequado para uma ampla gama de aplicações, de soluções empresariais à criação de conteúdo.