Engenheiro de Pesquisa em IA (Otimização de Kernel e Inferência) – 100% Remoto em Todo o Mundo

Indeed

Tempo Integral

Presencial

Sem Limite de Experiência

Sem Limite de Formação

PV49+C7 Lisboa, 1000-001, Portugal

Favoritos

Alguns conteúdos foram traduzidos automaticamente pelo sistemaVer original

Descrição

Resumo: Junte-se à equipe de modelos de IA da Tether para impulsionar a inovação em arquiteturas de serviço e inferência de modelos para sistemas avançados de IA, otimizando implantação e desempenho para aplicações do mundo real. Pontos de destaque: 1. Modele o futuro das finanças digitais com a inovadora equipe de modelos de IA da Tether 2. Colabore com mentes brilhantes em uma potência global de fintech remota 3. Pioneire serviços avançados de modelos de IA e inferência para desempenho escalável ***Junte-se à Tether e Modele o Futuro das Finanças Digitais*** Na Tether, não estamos apenas desenvolvendo produtos; estamos pioneirando uma revolução financeira global. Nossas soluções de ponta capacitam empresas — desde exchanges e carteiras até processadores de pagamentos e caixas eletrônicos — a integrar de forma transparente tokens lastreados em reservas em diversas blockchains. Ao aproveitar o poder da tecnologia blockchain, a Tether permite que você armazene, envie e receba tokens digitais instantaneamente, com segurança e em escala global, tudo isso a uma fração do custo. A transparência é a pedra angular de tudo o que fazemos, garantindo confiança em cada transação. ***Inove com a Tether*** **Tether Finance:** Nossa inovadora suíte de produtos inclui a moeda estável mais confiável do mundo, **USDT**, utilizada por centenas de milhões de pessoas em todo o mundo, além de serviços pioneiros de tokenização de ativos digitais. Mas isso é apenas o começo: **Tether Power:** Impulsionando o crescimento sustentável, nossas soluções energéticas otimizam o excesso de energia para mineração de Bitcoin, utilizando práticas ecologicamente corretas em instalações de última geração e geograficamente diversificadas. **Tether Data:** Impulsionando avanços em IA e tecnologia ponto a ponto, reduzimos os custos de infraestrutura e aprimoramos as comunicações globais com soluções de ponta, como o **KEET**, nosso aplicativo principal que redefine o compartilhamento seguro e privado de dados. **Tether Education:** Democratizando o acesso ao aprendizado digital de nível superior, capacitamos indivíduos a prosperar nas economias digital e de prestação de serviços, impulsionando o crescimento e as oportunidades globais. **Tether Evolution:** Na interseção entre tecnologia e potencial humano, estamos expandindo os limites do possível, criando um futuro em que inovação e capacidades humanas se fundem de maneira poderosa e sem precedentes. ***Por que se juntar a nós?*** Nossa equipe é uma potência global de talentos, trabalhando remotamente de todos os cantos do mundo. Se você é apaixonado por deixar sua marca no espaço de fintech, esta é sua oportunidade de colaborar com algumas das mentes mais brilhantes, ultrapassando fronteiras e estabelecendo novos padrões. Crescemos rapidamente, mantivemo-nos enxutos e consolidamos nossa posição como líder da indústria. Se você possui excelentes habilidades de comunicação em inglês e está pronto para contribuir com a plataforma mais inovadora do planeta, a Tether é o lugar certo para você. **Você está pronto para fazer parte do futuro?** **Sobre a vaga** Como membro de nossa equipe de modelos de IA, você impulsionará a inovação em arquiteturas de serviço e inferência de modelos para sistemas avançados de IA. Seu trabalho concentrar-se-á na otimização de estratégias de implantação e inferência de modelos para entregar desempenho altamente responsivo, eficiente e escalável em aplicações do mundo real. Você trabalhará em um amplo espectro de sistemas, variando desde modelos eficientes em recursos projetados para ambientes de hardware limitado até arquiteturas complexas multimodais que integram dados como texto, imagens e áudio. Esperamos que você tenha expertise profunda no projeto e otimização de pipelines de serviço de modelos e frameworks de inferência, bem como uma sólida formação em arquiteturas avançadas de modelos. Você adotará uma abordagem prática e orientada por pesquisa para desenvolver, testar e implementar novas estratégias de serviço e algoritmos de inferência. Suas responsabilidades incluem engenharia de pipelines robustos de inferência, definição de métricas abrangentes de desempenho e identificação e resolução de gargalos em ambientes de produção. O objetivo final é permitir um desempenho de IA com alta taxa de transferência, baixa latência, pequena pegada de memória e escalabilidade, entregando valor tangível em cenários dinâmicos do mundo real. **Responsabilidades** * Projetar e implantar arquiteturas de serviço de modelos de última geração que ofereçam alta taxa de transferência e baixa latência, ao mesmo tempo que otimizam o uso de memória. Garantir que esses pipelines funcionem eficientemente em diversos ambientes, incluindo dispositivos com recursos limitados e plataformas de borda. Estabelecer metas claras de desempenho, tais como redução da latência, melhoria na resposta de tokens e minimização da pegada de memória. * Construir, executar e monitorar testes controlados de inferência tanto em ambientes simulados quanto em produção real. Acompanhar indicadores-chave de desempenho, como latência de resposta, taxa de transferência, consumo de memória e taxas de erro, com atenção especial às métricas específicas para dispositivos com recursos limitados. Documentar resultados iterativos e comparar os resultados com benchmarks estabelecidos para validar o desempenho em diferentes plataformas. * Identificar e preparar conjuntos de dados de teste de alta qualidade e cenários de simulação adaptados aos desafios reais de implantação, especificamente aqueles encontrados em dispositivos com poucos recursos. Definir critérios mensuráveis para garantir que esses recursos avaliem eficazmente o desempenho do modelo, a latência e a utilização de memória sob diversas condições operacionais. * Analisar a eficiência computacional e diagnosticar gargalos no pipeline de serviço monitorando tanto métricas de processamento quanto de memória. Resolver problemas como processamento de lote subótimo, atrasos de rede e alto consumo de memória para otimizar a infraestrutura de serviço quanto à escalabilidade e confiabilidade em sistemas com recursos limitados. * Trabalhar em estreita colaboração com equipes multifuncionais para integrar frameworks de serviço e inferência otimizados em pipelines de produção projetados para aplicações de borda e em dispositivo. Definir métricas claras de sucesso, como melhoria no desempenho do mundo real, baixas taxas de erro, escalabilidade robusta, uso ótimo de memória e garantir monitoramento contínuo e refinamentos iterativos para melhorias sustentadas. * Graduação em Ciência da Computação ou área correlata. Desejável doutorado em PLN, Aprendizado de Máquina ou área relacionada, complementado por um histórico sólido em P&D em IA (com boas publicações em conferências A\*). * É obrigatório ter conhecimento da Linguagem de Sombreamento Metal (MSL). Você deve estar confortável escrevendo shaders de computação personalizados do zero. * É essencial possuir experiência comprovada em otimizações de kernel de baixo nível e otimização de inferência em dispositivos móveis. Suas contribuições devem ter gerado melhorias mensuráveis na latência, taxa de transferência e pegada de memória da inferência para aplicações específicas de domínio, particularmente em dispositivos com recursos limitados e plataformas de borda. * É necessário ter uma compreensão profunda das modernas arquiteturas de serviço de modelos e técnicas de otimização de inferência. Isso inclui métodos de ponta para alcançar desempenho de baixa latência e alta taxa de transferência, além de gerenciamento eficiente de memória em diversos cenários de implantação com recursos limitados. * É obrigatório ter forte expertise em escrita de kernels para GPU em dispositivos móveis (ou seja, smartphones), bem como uma compreensão profunda de frameworks e motores de serviço de modelos. É exigida experiência prática no desenvolvimento e implantação de pipelines de inferência ponta a ponta, desde a otimização de modelos para serviço eficiente até a integração dessas soluções em dispositivos com recursos limitados. * Capacidade comprovada de aplicar pesquisa empírica para superar desafios no serviço de modelos, como otimização de latência, gargalos computacionais e restrições de memória. Você deve ser proficiente no projeto de frameworks robustos de avaliação e na iteração de estratégias de otimização para continuar expandindo os limites do desempenho de inferência e da eficiência do sistema. * Sistemas Distribuídos de Inferência: Projetar e otimizar motores de inferência de alto desempenho usando técnicas como paralelismo de tensor, paralelismo de pipeline e paralelismo de especialistas para lidar com modelos massivos em clusters de GPU. * Profundo entendimento da matemática e estrutura por trás dos Modelos de Difusão e Transformadores Visuais * Compreensão de poda, quantização, atenção Flash, cache KV, decodificação especulativa (Eagle), etc. **Informações importantes para candidatos** Fraudes de recrutamento tornaram-se cada vez mais comuns. Para proteger-se, considere atentamente o seguinte ao se candidatar a vagas: * **Candidate-se apenas por nossos canais oficiais.** Não utilizamos plataformas ou agências de terceiros para recrutamento, salvo quando claramente declarado. Todas as vagas abertas estão listadas em nossa página oficial de carreiras: https://tether.recruitee.com/ * **Verifique a identidade do recrutador.** Todos os nossos recrutadores possuem perfis verificados no LinkedIn. Caso tenha dúvidas, você pode confirmar sua identidade verificando seu perfil ou entrando em contato conosco pelo nosso site. * **Tenha cautela com métodos incomuns de comunicação.** Não realizamos entrevistas via WhatsApp, Telegram ou SMS. Toda comunicação ocorre por e-mails oficiais da empresa e plataformas autorizadas. * **Verifique cuidadosamente os endereços de e-mail.** Toda comunicação enviada por nós virá de e-mails terminados em **@**tether.to **ou @**tether.io * **Nunca solicitaremos pagamento ou dados financeiros pessoais.** Se alguém solicitar informações financeiras pessoais ou pagamento em qualquer etapa do processo seletivo, trata-se de uma fraude. Por favor, denuncie imediatamente. **Em caso de dúvida, sinta-se à vontade para entrar em contato através do nosso site oficial.**

Fonte da Informação: indeed Ver publicação original

João Santos

Indeed · HR

Empresa

Indeed

João Santos

Indeed · HR

Vagas semelhantes

Engenheiro de Pesquisa em IA (Otimização de Kernel e Inferência) – 100% Remoto em Todo o Mundo

Descrição

Empresa

Vagas semelhantes

ML Architect

Consultores Imobiliários

Engenheiro Frontend Sênior (Angular)

Estagiário(a) de Desenvolvimento Web / WordPress

Backend Java

Instalador de CAPOTO, com experiencia Lisboa/Lourinhã