AMD Lança Pequeno Modelo De Linguagem Focado Em Otimizar Tarefas Via IA

Foto: AMD

Com informação: tecmundo

Durante muito tempo focada no mercado de hardware, a AMD está mudando de direção e anunciou seu primeiro modelo de linguagem pequeno (SLM). Chamado de AMD-135M, a tecnologia foi desenvolvida para o mercado empresarial com o objetivo de otimizar tarefas específicas. Para realizar essa otimização, o AMD-135M utiliza uma técnica chamada de decodificação especulativa, que faz previsões sobre solicitações de tokens futuros enquanto gera os tokens atuais na linha de processamento, tornando o processo mais lógico.

De acordo com a empresa, o 135M foi treinado do zero com 670 bilhões de tokens de dados, um processo que levou cerca de seis dias utilizando quatro aceleradores de IA Instinct MI250, e a AMD ainda refinou o modelo com 20 bilhões de tokens focados em codificação. Apesar do foco em IA, a produção de processadores na AMD continua forte.

É importante destacar que a primeira SLM da AMD possui variantes: a AMD-Llama-135M e a AMD-Llama-135M-Code. Como o nome sugere, esses modelos de linguagem são baseados na família Llama e foram criados para atender às necessidades dos clientes da empresa que precisavam de novos modelos pré-treinados. O lançamento do modelo também reflete a mudança completa de postura da AMD. Recentemente, a empresa liderada por Lisa Su confirmou que concentrará seus esforços no desenvolvimento de soluções para inteligência artificial e dará menos ênfase às placas de vídeo para gamers. Isso não significa que a AMD deixará de fabricar GPUs, mas a tendência é que a empresa rivalize ainda mais com a Nvidia em termos de softwares e outras tecnologias.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *