19:00
youtube.com ha 5 dias SRT Sandbox

MiniMax 2.5 LOCAL vs Opus, Codex e GLM (você vai se SURPREENDER com o re...

Por AI ProgBr

Coding SelfHosted Tecnologia LLM

Conteudo

TLDR;

O MiniMax 2.5, com 229 bilhões de parâmetros quantizado em 6 bits, roda localmente no Mac Studio M3 Ultra com 256 GB de memória unificada via LM Studio, alcançando cerca de 359 tokens por segundo sem limites de cota. No teste do Paint, o modelo gerou um web app funcional em HTML, CSS e JS com pincel, borracha, balde, formas, texto, camadas, desfazer, gradientes, filtros e exportação, surpreendendo pela qualidade equivalente ao GLM apesar de algumas peculiaridades na UX. Os próximos testes incluem clones de Mario Kart com Three.js e Zelda, comparando com os bons desempenhos anteriores de Opus, GLM e Codex nesses projetos.

Resumo

O vídeo apresenta um teste empolgante do modelo de IA MiniMax 2.5, com 229 bilhões de parâmetros, rodando localmente em um Mac Studio M3 Ultra com 256 GB de memória unificada, quantizado em 6 bits via LM Studio. Chamado de "Davi versus Golias", o desafio compara sua performance a gigantes como Opus 4.6, GPT-5.3 Codex e GLM C1, visando replicar projetos anteriores. No primeiro teste, usando a ferramenta Open Code em modo build, o modelo gera rapidamente um web app clone do Paint, com HTML, CSS e JavaScript puro, sem frameworks. Inclui pincel, borracha, balde, linhas, retângulos, texto, gradientes, múltiplas camadas, desfazer/refazer, filtros, spray e exportação de imagem. O código resulta em arquivos robustos (200 linhas HTML, 424 CSS, 728 JS), e os testes mostram funcionamento geral bom, com pincel redondo/quadrado, spray dinâmico e camadas, apesar de delays na UX e pequenos bugs, como linhas automáticas. A velocidade impressiona: cerca de 359 tokens/segundo. O apresentador elogia a qualidade equivalente ao GLM (triplo do tamanho), sem limites de cota ou custos extras. Preparam o próximo desafio: clone do Mario Kart com Three.js, em modo plan, prometendo mais complexidade. Surpreendente para um modelo local acessível via API ou hardware potente. (198 palavras)