Engenheiro de Pesquisa em IA (Otimização de Kernel e Inferência) – 100% Remoto em Todo o Mundo

Indeed

Tempo Integral

Presencial

Sem Limite de Experiência

Sem Limite de Formação

PV49+C7 Lisboa, Portugal

Favoritos

Alguns conteúdos foram traduzidos automaticamente pelo sistemaVer original

Descrição

Resumo: Junte-se à equipe de modelos de IA da Tether para impulsionar a inovação em arquiteturas de serviço e inferência de modelos para sistemas avançados de IA, otimizando a implantação para desempenho escalável. Pontos de destaque: 1. Pioneirando uma revolução financeira global com soluções de ponta 2. Inovar com sistemas avançados de IA e arquiteturas diversas de modelos 3. Colaborar com as mentes mais brilhantes do setor de fintech em todo o mundo ***Junte-se à Tether e modele o futuro das finanças digitais*** Na Tether, não estamos apenas desenvolvendo produtos; estamos pioneirando uma revolução financeira global. Nossas soluções de ponta capacitam empresas — desde exchanges e carteiras até processadores de pagamentos e caixas eletrônicos — a integrar de forma transparente tokens lastreados em reservas em várias blockchains. Ao aproveitar o poder da tecnologia blockchain, a Tether permite que você armazene, envie e receba tokens digitais instantaneamente, com segurança e em escala global, tudo isso a uma fração do custo. A transparência é a pedra angular de tudo o que fazemos, garantindo confiança em cada transação. ***Inove com a Tether*** **Finanças Tether:** Nossa inovadora suíte de produtos inclui a moeda estável mais confiável do mundo, **USDT**, utilizada por centenas de milhões de pessoas em todo o mundo, além de serviços pioneiros de tokenização de ativos digitais. Mas isso é apenas o começo: **Tether Power:** Impulsionando o crescimento sustentável, nossas soluções energéticas otimizam o excesso de energia para mineração de Bitcoin, utilizando práticas ecologicamente corretas em instalações de última geração e geograficamente diversificadas. **Tether Data:** Impulsionando avanços em IA e tecnologia ponto a ponto, reduzimos os custos de infraestrutura e aprimoramos as comunicações globais com soluções de ponta como o **KEET**, nosso aplicativo principal que redefine o compartilhamento seguro e privado de dados. **Tether Education:** Democratizando o acesso ao aprendizado digital de alto nível, capacitamos indivíduos a prosperar nas economias digital e de trabalho sob demanda, impulsionando o crescimento e as oportunidades globais. **Tether Evolution:** Na interseção entre tecnologia e potencial humano, estamos expandindo os limites do que é possível, criando um futuro no qual inovação e capacidades humanas se fundem de maneira poderosa e sem precedentes. ***Por que se juntar a nós?*** Nossa equipe é uma força global de talentos, trabalhando remotamente de todos os cantos do planeta. Se você é apaixonado por deixar sua marca no setor de fintech, esta é sua oportunidade de colaborar com algumas das mentes mais brilhantes, expandindo fronteiras e estabelecendo novos padrões. Crescemos rapidamente, mantivemo-nos enxutos e consolidamos nossa posição como líder na indústria. Se você possui excelentes habilidades de comunicação em inglês e está pronto para contribuir com a plataforma mais inovadora do planeta, a Tether é o lugar certo para você. **Você está pronto para fazer parte do futuro?** **Sobre a vaga** Como membro de nossa equipe de modelos de IA, você impulsionará a inovação em arquiteturas de serviço e inferência de modelos para sistemas avançados de IA. Seu trabalho concentrar-se-á na otimização das estratégias de implantação e inferência de modelos para entregar desempenho altamente responsivo, eficiente e escalável em aplicações reais. Você trabalhará em um amplo espectro de sistemas, variando de modelos eficientes em termos de recursos, projetados para ambientes de hardware limitado, até arquiteturas complexas e multimodais que integram dados como texto, imagens e áudio. Esperamos que você tenha profunda especialização no projeto e na otimização de pipelines de serviço de modelos e frameworks de inferência, bem como sólida experiência em arquiteturas avançadas de modelos. Você adotará uma abordagem prática e orientada por pesquisa para desenvolver, testar e implementar novas estratégias de serviço e algoritmos de inferência. Suas responsabilidades incluem engenharia de pipelines robustos de inferência, definição de métricas abrangentes de desempenho e identificação e resolução de gargalos em ambientes de produção. O objetivo final é permitir um desempenho de IA com alta taxa de transferência, baixa latência, pequena ocupação de memória e escalabilidade, entregando valor tangível em cenários dinâmicos do mundo real. **Responsabilidades** * Projetar e implantar arquiteturas de ponta para serviço de modelos que ofereçam alta taxa de transferência e baixa latência, ao mesmo tempo que otimizam o uso de memória. Garantir que esses pipelines funcionem com eficiência em diversos ambientes, incluindo dispositivos com recursos limitados e plataformas de borda. Estabelecer metas claras de desempenho, tais como redução de latência, melhoria na resposta de tokens e minimização da ocupação de memória. * Construir, executar e monitorar testes controlados de inferência tanto em ambientes simulados quanto em produção real. Acompanhar indicadores-chave de desempenho, como latência de resposta, taxa de transferência, consumo de memória e taxas de erro, com atenção especial às métricas específicas para dispositivos com recursos limitados. Documentar resultados iterativos e comparar os resultados com benchmarks estabelecidos para validar o desempenho em diferentes plataformas. * Identificar e preparar conjuntos de dados de teste de alta qualidade e cenários de simulação adaptados aos desafios reais de implantação, especificamente aqueles encontrados em dispositivos com poucos recursos. Definir critérios mensuráveis para garantir que esses recursos avaliem eficazmente o desempenho do modelo, a latência e a utilização de memória sob diversas condições operacionais. * Analisar a eficiência computacional e diagnosticar gargalos no pipeline de serviço, monitorando tanto métricas de processamento quanto de memória. Resolver problemas como processamento de lote subótimo, atrasos de rede e alto consumo de memória para otimizar a infraestrutura de serviço quanto à escalabilidade e confiabilidade em sistemas com recursos limitados. * Trabalhar em estreita colaboração com equipes multifuncionais para integrar frameworks de serviço e inferência otimizados em pipelines de produção projetados para aplicações de borda e embarcadas. Definir métricas claras de sucesso, tais como melhoria no desempenho do mundo real, baixas taxas de erro, escalabilidade robusta, uso ideal de memória e garantir monitoramento contínuo e refinamentos iterativos para melhorias sustentadas. * Graduação em Ciência da Computação ou área relacionada. Preferencialmente doutorado em PLN, Aprendizado de Máquina ou área afim, complementado por um histórico sólido em P&D em IA (com boas publicações em conferências A*). * Deve ter conhecimento da Linguagem de Sombreamento Metal (MSL). Você deve estar confortável escrevendo shaders de computação personalizados do zero. * Experiência comprovada em otimizações de kernel em nível baixo e otimização de inferência em dispositivos móveis é essencial. Suas contribuições devem ter gerado melhorias mensuráveis na latência, taxa de transferência e ocupação de memória para aplicações específicas de domínio, particularmente em dispositivos com recursos limitados e plataformas de borda. * É necessário um profundo entendimento das modernas arquiteturas de serviço de modelos e técnicas de otimização de inferência. Isso inclui métodos de ponta para alcançar desempenho de baixa latência e alta taxa de transferência, bem como gerenciamento eficiente de memória em diversos cenários de implantação com recursos limitados. * Deve possuir forte expertise em escrita de kernels para GPU em dispositivos móveis (ou seja, smartphones), bem como profundo entendimento de frameworks e motores de serviço de modelos. É exigida experiência prática no desenvolvimento e implantação de pipelines de inferência de ponta a ponta, desde a otimização de modelos para serviço eficiente até a integração dessas soluções em dispositivos com recursos limitados. * Capacidade comprovada de aplicar pesquisas empíricas para superar desafios no serviço de modelos, tais como otimização de latência, gargalos computacionais e restrições de memória. Você deve ser proficiente no projeto de frameworks robustos de avaliação e na iteração de estratégias de otimização para continuar expandindo os limites do desempenho de inferência e da eficiência do sistema. * Sistemas Distribuídos de Inferência: Projetar e otimizar motores de inferência de alto desempenho usando técnicas como Paralelismo de Tensores, Paralelismo de Pipeline e Paralelismo de Especialistas para lidar com modelos massivos em clusters de GPU. * Profundo entendimento da matemática e estrutura por trás dos Modelos de Difusão e Transformadores Visuais * Compreensão de poda (pruning), quantização, atenção Flash, cache KV, decodificação especulativa (Eagle), etc. **Informações importantes para candidatos** Fraudes de recrutamento tornaram-se cada vez mais comuns. Para proteger-se, observe atentamente o seguinte ao se candidatar a vagas: * **Candidate-se apenas por nossos canais oficiais.** Não utilizamos plataformas ou agências terceirizadas para recrutamento, salvo quando expressamente declarado. Todas as vagas abertas estão listadas em nossa página oficial de carreiras: https://tether.recruitee.com/ * **Verifique a identidade do recrutador.** Todos os nossos recrutadores possuem perfis verificados no LinkedIn. Caso tenha dúvidas, você pode confirmar sua identidade verificando seu perfil ou entrando em contato conosco pelo nosso site. * **Tenha cautela com métodos incomuns de comunicação.** Não realizamos entrevistas via WhatsApp, Telegram ou SMS. Toda comunicação ocorre por meio de e-mails oficiais da empresa e plataformas autorizadas. * **Verifique cuidadosamente os endereços de e-mail.** Toda comunicação enviada por nós virá de e-mails terminados em **@**tether.to **ou @**tether.io * **Nunca solicitaremos pagamento ou dados financeiros pessoais.** Se alguém solicitar informações financeiras pessoais ou pagamento em qualquer etapa do processo seletivo, trata-se de uma fraude. Por favor, denuncie imediatamente. **Em caso de dúvida, sinta-se à vontade para entrar em contato através do nosso site oficial.**

Fonte da Informação: indeed Ver publicação original

João Santos

Indeed · HR

Empresa

Indeed

João Santos

Indeed · HR

Vagas semelhantes

Engenheiro de Pesquisa em IA (Otimização de Kernel e Inferência) – 100% Remoto em Todo o Mundo

Descrição

Empresa

Vagas semelhantes

Desenvolvimento de Software | Desenvolvedor Android

Operador(a) de Montagem

Construção de edifício

Setor de Telecomunicações | Engenheiro DevOps Sênior

ÚLTIMAS 2 VAGAS!! Gestor(a) Comercial – GPTW/Flexibilidade de horário

Setor Energético | Engenheiro Backend de IA