Navegar
···
Entrar / Registrar
Engenheiro de IA – Inteligência em Documentos e IA Generativa Aplicada
Indeed
Tempo Integral
Presencial
Sem Limite de Experiência
Sem Limite de Formação
PV49+C7 Lisbon, Portugal
Favoritos
Compartilhar
Alguns conteúdos foram traduzidos automaticamente pelo sistemaVer original
Descrição

Resumo: A PandaDoc está buscando um Engenheiro de Aprendizado de Máquina especializado em Inteligência em Documentos e IA Generativa para projetar, treinar, avaliar e otimizar modelos destinados à transformação de documentos não estruturados em dados estruturados. Pontos de destaque: 1. Projetar e otimizar sistemas de aprendizado de máquina, influenciando decisões sobre o cronograma de recursos de IA. 2. Resolver desafios reais de aprendizado de máquina: robustez do modelo, latência e qualidade da recuperação-aumentada por geração (RAG). 3. Experimentar modelos de ponta e integrar sistemas de visão e linguagem. O cenário da IA está evoluindo rapidamente, e a PandaDoc está investindo pesadamente em aprendizado de máquina para impulsionar a próxima geração de fluxos de trabalho inteligentes com documentos. Nosso objetivo é construir sistemas de IA escaláveis e prontos para produção que automatizem a compreensão de documentos, extraiam dados estruturados em larga escala e permitam novas experiências de produto baseadas em IA para dezenas de milhares de empresas. Como Engenheiro de Aprendizado de Máquina focado em Inteligência em Documentos e IA Generativa, você projetará, treinará, avaliará e otimizará modelos que transformem documentos não estruturados em dados estruturados de alta qualidade. Você trabalhará em toda a pilha de desenvolvimento de modelos — conjuntos de dados, treinamento, inferência e pipelines de implantação — e ajudará a levar pesquisas de ponta para sistemas reais de produção em larga escala. O que torna esta função única? * **Inteligência em Documentos em Escala:** Seu trabalho impulsionará diretamente as principais capacidades de IA da PandaDoc — desde detecção de layout e OCR até extração estruturada, recuperação e raciocínio baseado em documentos. * **Alta Propriedade, Alto Impacto:** Você projetará sistemas de aprendizado de máquina de ponta a ponta, influenciará decisões sobre o cronograma e trabalhará em estreita colaboração com equipes de produto, engenharia e design para definir requisitos e lançar recursos de IA em produção. * **Desafios Reais de Aprendizado de Máquina:** Você enfrentará questões como robustez do modelo, avaliação, latência, observabilidade, qualidade da RAG, roteamento de modelos e as complexidades envolvidas na implantação de sistemas de IA que devem operar com confiabilidade em milhões de documentos. * **Integração Profunda de IA Generativa:** Você experimentará modelos de ponta e de código aberto, integrará sistemas de visão e linguagem e construirá pipelines eficientes para inferência, mecanismos de segurança (guardrails), ajuste fino e raciocínio consciente de documentos. **Nesta função, você irá:** --------------------------- * **Desenvolvimento \& Avaliação de Modelos** + Construir e manter estruturas de avaliação para modelos de documentos, LLMs, OCR e extração estruturada. + Definir métricas, benchmarks e estratégias de validação para cargas de trabalho reais com documentos. * **Criação de Conjuntos de Dados \& Pipelines** + Projetar e curar conjuntos de dados de alta qualidade para treinamento supervisionado, ajuste fino e validação. + Criar pipelines escaláveis de pré-processamento para PDFs, digitalizações, imagens, formulários e documentos semi-estruturados. * **Treinamento \& Ajuste Fino de Modelos** + Treinar e ajustar modelos baseados em transformadores para OCR, modelos de visão e linguagem (VLMs), modelos de layout e LLMs de código aberto voltados para tarefas de compreensão de documentos. + Otimizar modelos quanto à confiabilidade, precisão e eficiência de custos em ambientes de produção. * **Inferência \& Implantação** + Implantar modelos de aprendizado de máquina com runtimes modernos de inferência (vLLM, TGI, TensorRT, ONNX Runtime). + Construir mecanismos de segurança (guardrails), monitoramento e fallback para garantir comportamento seguro e previsível dos modelos. * **RAG \& Raciocínio Baseado em Documentos** + Desenvolver estratégias de recuperação e segmentação adaptadas às estruturas de documentos (tabelas, formulários, PDFs com múltiplas páginas). + Otimizar pipelines completos de RAG para pesquisa semântica, perguntas e respostas (Q\&A) e automação de fluxos de trabalho. * **Colaboração Interfuncional** + Trabalhar em parceria com gerentes de produto, engenheiros backend e designers de produto para identificar oportunidades de IA e traduzir requisitos em soluções técnicas. **Sobre você:** -------------- Estamos expandindo nossa função de IA/Aprendizado de Máquina com um Engenheiro de Aprendizado de Máquina especializado em **inteligência em documentos**, **modelos de visão e linguagem** e **extração e raciocínio baseados em LLMs**. Você deve estar confortável tanto com abordagens tradicionais de IA para documentos quanto com fluxos de trabalho de IA Generativa de ponta. Você se destaca em ambientes dinâmicos, é autodirigido(a) e gosta de resolver problemas práticos de aprendizado de máquina que impactam diretamente os clientes. Procuramos alguém com experiência em: * Transformadores de visão, modelos de layout e sistemas de OCR * Extração estruturada de documentos complexos * RAG para cargas de trabalho intensivas em documentos * Otimização de pipelines de LLMs quanto a custo, precisão e throughput * Implantação e benchmarking de modelos em sistemas reais de produção ### **Experiência Obrigatória** * 5 ou mais anos de experiência com Python * Experiência em treinar, ajustar e implantar modelos tradicionais de visão computacional para tarefas de inteligência em documentos (detecção de layout, extração de tabelas, OCR, extração de informações) * Experiência prática com frameworks e modelos de compreensão de documentos: + Modelos tradicionais de IA para documentos (LayoutLM, Donut, DocFormer) + Modelos modernos de visão e linguagem com capacidades de OCR (DeepSeek\-OCR, LightOnOCR\-1B, etc.) + Experiência em implantar e otimizar modelos usando frameworks de inferência, como vLLM (preferencial), TGI, TensorRT ou ONNX Runtime + Experiência em aplicar LLMs a fluxos de trabalho de inteligência em documentos, incluindo tanto modelos de ponta quanto alternativas de código aberto + Forte compreensão de sistemas de coordenadas e raciocínio espacial para posicionamento absoluto e detecção de campos em formulários/documentos **Seria excelente se você tivesse:** ----------------------------------- * Familiaridade com bibliotecas de análise de PDF e pipelines de pré-processamento de documentos * Experiência em ajustar modelos de código aberto para tarefas documentais específicas de domínio * Conhecimento de métricas de avaliação para tarefas de compreensão de documentos (F1, correspondência exata, etc.) **Visão Geral da Empresa:** --------------------- A PandaDoc capacita mais de 67.000 organizações em crescimento a prosperar, eliminando o esforço manual nos fluxos de trabalho com documentos. A PandaDoc fornece uma plataforma de automação de fluxos de trabalho com documentos tudo-em-um que ajuda equipes em rápido crescimento a acelerar a criação, gestão e assinatura de documentos digitais, incluindo propostas, orçamentos, contratos e muito mais. Para mais informações, visite https://www.pandadoc.com. **Cultura da Empresa:** -------------------- Somos conhecidos por nosso equilíbrio entre vida profissional e pessoal, colegas gentis e eventos criativos virtuais de integração da equipe. Embora nossos Pandas estejam localizados em todo o mundo, mantemos a conexão com o auxílio da tecnologia e garantimos que todos os membros da equipe se sintam, de fato, parte de uma equipe. Os Pandas rendem melhor quando estão felizes. Retemos nossos talentos ao manter nossos valores de integridade e transparência e ao oferecer um produto que transforma a vida de nossos clientes. Confira nosso LinkedIn para saber mais. **Benefícios:** ------------- * Uma cultura honesta e aberta que enfatiza o feedback e promove o desenvolvimento profissional e pessoal * Uma oportunidade de trabalhar de qualquer lugar — nossa equipe é distribuída mundialmente, de Lisboa a Manila, da Flórida à Califórnia * 6 dias de autocuidado * Um salário competitivo * E muito mais! **A PandaDoc é uma Empregadora que Pratica Igualdade de Oportunidades.** Comprometemo-nos a tratar todos os funcionários de forma igual, independentemente de raça, origem nacional, religião, gênero, idade, orientação sexual, status de veterano, deficiência física ou mental ou qualquer outra base protegida por lei. **RECRTADORES EXTERNOS** **Requisito de Aprovação** A utilização de recrutadores externos/agências de recrutamento exige aprovação prévia da nossa equipe de RH. A equipe de RH da PandaDoc solicita que recrutadores externos/agências de recrutamento não entrem em contato diretamente com os funcionários da PandaDoc na tentativa de apresentar candidatos. O cumprimento dessa solicitação será um fator determinante na avaliação de futuras relações profissionais com a PandaDoc.

Fonte da Informação:  indeed Ver publicação original
João Santos
Indeed · HR

Empresa

Indeed
João Santos
Indeed · HR
Vagas semelhantes

Cookie
Configurações de cookie
Nosso aplicativo
Download
Baixado no
APP Store
Download
Ir para baixar
Google Play
© 2025 Servanan International Pte. Ltd., Todos os direitos reservados. support@ok.com