Curso de Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos é um curso prático sobre como servir modelos do Tencent Hunyuan de forma confiável em escala.

Esta formação presencial ou online, ministrada por instrutores, é destinada a engenheiros e arquitetos de nível intermediário que desejam utilizar o Tencent Hunyuan para implantar modelos grandes e MoE com menor latência, melhor utilização de GPU e custos operacionais controlados.

Ao final desta formação, os participantes serão capazes de:

explicar os principais desafios de produção ao servir modelos do Tencent Hunyuan.
aplicar técnicas práticas de otimização de inferência, como TensorRT, ajuste de KV-cache, quantização e agrupamento de solicitações (batching).
projetar uma abordagem de implantação escalável com autoescalonamento, monitoramento e planejamento de capacidade.
melhorar as compensações entre latência e custo para cargas de trabalho reais em produção.

Formato do Curso

Aula interativa e discussão.
Numerosos exercícios e prática.
Implementação prática em um ambiente de laboratório ao vivo.

Opções de Personalização do Curso

Para solicitar uma formação personalizada para este curso, entre em contato conosco para agendar.

Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.

Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.

Próximas Formações Provisórias

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

2026-06-16 09:30

14 horas

Fortaleza - Meireles

$ 4330 (On-line)

$ 5330 (Sala de aula)

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

2026-06-30 09:30

14 horas

Fortaleza - Edifício Etevaldo Nogueira

$ 4330 (On-line)

$ 5330 (Sala de aula)

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

2026-07-14 09:30

14 horas

Curitiba - Corporate Evolution

$ 4330 (On-line)

$ 5330 (Sala de aula)

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

2026-07-28 09:30

14 horas

Belo Horizonte - Amadeus Business Tower

$ 4330 (On-line)

$ 5330 (Sala de aula)

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

2026-08-11 09:30

14 horas

Porto Alegre - Platinum Building

$ 4330 (On-line)

$ 5330 (Sala de aula)

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

2026-08-25 09:30

14 horas

Porto Alegre - Centro Empresarial Guaíba

$ 4330 (On-line)

$ 5330 (Sala de aula)

Curso de Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Programa do Curso

Requisitos

Próximas Formações Provisórias

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Categorias Relacionadas

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Curso de Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Programa do Curso

Requisitos

Próximas Formações Provisórias

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Implantando o Tencent Hunyuan em Produção: Inferência de Baixa Latência e Otimização de Custos

Cursos Relacionados

Avançado LangGraph: Otimização, Depuração e Monitoramento de Grafos Complexos

Construindo Agentes de Codificação com Devstral: Do Design do Agente ao Tooling

Open-Source Model Ops: Auto-Hospedagem, Ajuste Fino e Governança com Modelos Devstral & Mistral

Aplicações de LangGraph na Finanças

Fundamentos do LangGraph: Prompting e Encadeamento Baseado em Grafos

LangGraph em Saúde: Orquestração de Fluxos de Trabalho para Ambientes Regulados

LangGraph para Aplicações Legais

Construindo Fluxos de Trabalho Dinâmicos com LangGraph e Agentes LLM

LangGraph para Automação de Marketing

Le Chat Enterprise: ChatOps Privado, Integrações e Controles de Administração

Arquiteturas de LLM Custos-Eficientes: Mistral em Escala (Desempenho / Engenharia de Custo)

Productizando Assistentes Conversacionais com Conectores e Integrações Mistral

Implantações de Grau Empresarial com Mistral Medium 3

Mistral para IA Responsável: Privacidade, Residência de Dados e Controles Empresariais

Aplicações Multimodais com Modelos Mistral (Visão, OCR e Compreensão de Documentos)

Categorias Relacionadas

Large Language Models (LLMs)

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites