Inscrivez-vous pour accéder à toutes les fonctionnalités de notre service.
  • Recherche d'offres d'emploi
  • Favoris
  • Créer un CV
    Nouveau
  • Salaires
  • Souscriptions

Ingénieur Logiciel - Runtime d'Inférence IA & Plateforme de Serving

35k € a 47k €/anEstimé

Mercato de l'emploi

À propos de nous VSORA est une société française de semi-conducteurs fabless spécialisée dans la conception de processeurs d'inférence IA haute performance pour le cloud et les centres de données. Son processeur phare, le Jotunn8, a été conçu pour répondre aux défis énergétiques et de performance des charges de travail IA modernes : débit élevé, latence ultra-faible et efficacité énergétique optimale. Il fait partie des processeurs les plus puissants du marché, utilisé notamment pour le traitement des grands modèles de langage (LLM). Portée par une équipe dirigeante avec plus de 25 ans d'expérience en conception de puces, VSORA s'inscrit dans la prochaine vague du calcul IA durable et scalable. L'entreprise mise sur une culture collaborative, agile et bienveillante, où hiérarchies rigides et silos n'ont pas leur place. Rejoindre VSORA, c'est intégrer une équipe multiculturelle et talentueuse, contribuer à une mission ambitieuse et avoir un impact réel sur la construction d'une société de référence dans son secteur. 👉 Mission Nous recherchons un Ingénieur Logiciel pour permettre le serving d'inférence IA à grande échelle sur la plateforme accélératrice Vsora Jotunn8. Le rôle porte sur l'évaluation, le portage, l'optimisation et le déploiement de runtimes d'inférence et frameworks de serving de pointe tels que vLLM et SGLang, afin de délivrer des solutions de serving IA performantes et scalables. Responsabilités principales

  • Piloter la conception, le développement et l'intégration de la stack logicielle chargée d'orchestrer et de gérer les charges de travail d'inférence IA hautes performances sur l'accélérateur Vsora Jotunn8.
  • Évaluer et conduire une analyse technique approfondie des runtimes d'inférence IA modernes et des frameworks de serving, notamment vLLM, SGLang et d'autres solutions émergentes pour LLMs et charges de travail IA.
  • Piloter le portage et l'optimisation des runtimes d'inférence et frameworks de serving sélectionnés vers la plateforme matérielle Vsora, en exploitant pleinement les capacités de l'accélérateur.
  • Concevoir et implémenter des architectures de déploiement scalables pour le serving IA, couvrant les environnements mono-nœud et distribués, la planification des modèles, la gestion des ressources et les opérations en production.
  • Définir l'architecture logicielle et la roadmap pour le serving IA sur les plateformes Vsora, en équilibrant performance, couverture fonctionnelle, maintenabilité et compatibilité écosystème.
  • Collaborer avec les communautés open-source et les partenaires de l'écosystème IA pour assurer la compatibilité avec les principaux frameworks, environnements de déploiement et écosystèmes de modèles.
  • Accompagner les clients et équipes internes via des implémentations de référence, des guides de déploiement, des caractérisations de performance et des bonnes pratiques pour l'inférence IA sur les plateformes Vsora.
Profil
  • Solides compétences en programmation Python et/ou C++.
  • Solide expérience avec les frameworks ML : PyTorch, TensorFlow, JAX, ONNX ou écosystèmes équivalents.
  • Expérience dans le déploiement, l'optimisation ou le portage de modèles IA sur des plateformes matérielles spécialisées (GPU, NPU, accélérateurs IA).
  • Compréhension des architectures de réseaux de neurones : transformers, modèles de diffusion, CNN, modèles multimodaux et grands modèles de langage.
  • Familiarité avec les compilateurs ML, frameworks d'optimisation de graphes et toolchains de déploiement (ONNX Runtime).
  • La connaissance de la quantification, précision mixte, compression de modèles et techniques d'optimisation d'inférence est un plus.

L'offre d'emploi a été publiée il y a 20 jours
Des emplois similaires qui pourraient vous intéresserBasé sur l'offre Ingénieur Logiciel - Runtime d'Inférence IA & Plateforme de Serving à Meudon, Hauts-de-Seine
  • 1 900 € a 2 300 €Estimé
     ...demain. Dans le cadre de notre croissance et pour répondre aux besoins spécifiques de l’un de nos clients, nous recherchons un Ingénieur Plateforme IA / GenAI (H/F) pour une mission stratégique.  Si vous souhaitez évoluer dans un environnement dynamique et relever des... 
    Suggéré

    Metaline

    Nanterre, 92000
    Il y a un mois
  • 2 500 € a 3 100 €Estimé
     ...de processeurs d'inférence IA haute performance...  ...Nous recherchons un Ingénieur Applications pour...  ...technique, intégration de plateformes et résolution de...  ...de validation logicielle, runtime, compilateur, logiciel IA et matériel...  ...infrastructure IA, serving d'inférence, déploiement... 
    Suggéré

    Mercato de l'emploi

    Meudon, Hauts-de-Seine
    il y a 20 jours
  • 65k €/an

     ...pour évoluer progressivement vers le HPC cloud et l'hybride et l'IA. Aujourd'hui, nous concentrons notre activité tech sur l'...  ...cloud (AWS, GCP). Concevoir et industrialiser les composants plateforme d'ArmoniK : charts Helm complexes, templating avancé, infrastructure... 
    Suggéré
    CDI
    Travail hybride
    Télétravail
    Boulogne-Billancourt
    il y a 5 jours
  • 2 000 € a 2 400 €Estimé
     ...conseil technologique, réalisation logicielle et expertise en cybersécurité...  ..., de la data science de l'IA et des méthodologies d'...  ...flux de données, les choix de plateformes ou d’outils ; Analyser des...  ...université, école de commerce, d’ingénieur, ou équivalent, type bac +5... 
    Suggéré

    Niji

    Issy-les-Moulineaux, Hauts-de-Seine
    Il y a 2 mois
  • 2 000 € a 2 400 €Estimé
     ...domaines clés de l'innovation tels que l'IA, la cybersécurité, le quantique, les...  ...l'intégration de systèmes complexes sur plateformes terrestres, en garantissant la cohérence...  ...opérationnelle ? Vous disposez d'un diplôme d'ingénieur ou équivalent (Bac+5) et avez de l'... 
    Suggéré
    CDI

    THALES

    Vélizy-Villacoublay, Yvelines
    Il y a 2 mois
  • 2 100 € a 2 500 €Estimé
     ...domaines clés de l'innovation tels que l'IA, la cybersécurité, le quantique, les...  ...l'intégration de systèmes complexes sur plateformes terrestres, en garantissant la cohérence...  ...opérationnelle ? Vous disposez d'un diplôme d'ingénieur ou équivalent (Bac+5) et avez de l'... 
    Vélizy-Villacoublay, Yvelines
    il y a 8 jours
  • 2 100 € a 2 500 €Estimé
     ...jumeau virtuel du monde réel, grâce à la plateforme 3DEXPERIENCE et à ses applications,...  ...suggestions de corrections automatisées par IA Améliorer la fiabilité et la cohérence...  ...en cursus universitaire ou en Ecole d'ingénieurs vous préparez un diplôme de niveau Bac+5... 
    Contrat d'apprentissage

    Forums Talents Handicap

    Vélizy-Villacoublay, Yvelines
    il y a 9 heures
  • 2 000 € a 2 400 €Estimé
     ...entreprise Alten, la maison des ingénieurs : qui sommes-nous ? Fort de...  ...nos activités d'ingénierie logicielle et d'intégration de l'...  ...communautés tech internes, formations IA...). Une culture d’...  ...Vous interviendrez sur des plateformes e-commerce à fort trafic, des... 
    Télétravail
    Boulogne-Billancourt
    Il y a un mois
  • 2 200 € a 2 700 €Estimé
     ...Gojob est le pionnier du recrutement par l’IA. Notre mission : Développer de l’...  ...même niveau de qualité que les briques logicielles plus classiques. Au cœur de cette mission...  ...pour le code source et la CI/CD. La plateforme est hébergée sur Google Cloud Platform (... 
    2 jours/semaine
    Temps partiel
    Télétravail

    gojob

    Paris
    il y a 5 jours
  • 2 100 € a 2 500 €Estimé
     ...L'ENTREPRISE : PLATEFORME DEEP-TECH A IMPACT ENVIRONNEMENTAL Cette entreprise française développe une solution combinant IA, vision industrielle et software pour automatiser le contrôle...  ...5 ans d’expérience en développement logiciel ~Expérience concrète en backend... 
    CDI

    Data Recrutement

    Paris
    il y a 27 jours
  • 2 800 € a 3 400 €Estimé
     ...conducteurs fabless spécialisée dans la conception de processeurs d'inférence IA haute performance pour le cloud et les centres de données....  ...Open Source à moyen terme (2-4 ans). Profil • BAC+5 ingénieur logiciel • Expertise en C/C++ orienté performance et programmation... 

    Mercato de l'emploi

    Meudon, Hauts-de-Seine
    Il y a un mois
  • 2 000 € a 2 400 €Estimé
     ...Contrat Pro : Ingénieur IA Java F/H Votre environnement de travail Rejoignez la Direction Software Engineering qui développe l'ensemble des produits logiciels nécessaires au fonctionnement de nos systèmes d'armes. Au sein du Service Logiciel IHM (Interface... 
    Alternance
    Le Plessis-Robinson, Hauts-de-Seine
    il y a 5 jours
  • 1 800 € a 2 200 €Estimé
     ...exploitation, réseaux et télécoms Type de poste Technique et spécialisé Statut du poste Vacant Intitulé du poste Ingénieur plateforme « cloud » et « DevOps » PN Description du poste Groupe RIFSEEP : 2 Vos activités principales : Ingénieur... 
    Temps plein
    Télétravail
    Issy-les-Moulineaux, Hauts-de-Seine
    il y a 24 jours
  • 2 300 € a 2 700 €Estimé
     ...abord qui Expérience de 3 à 7 ans d'expérience sur la partie IA Maîtrise du langage Python Anglais et Français courant (oral...  ...et des locaux feel good Des formations, conférences et une plateforme d'e-learning avec LinkedIn pour monter en compétences #greatplacetolearn... 
    CDI
    Contrat d'apprentissage
    Télétravail
    Sèvres, Hauts-de-Seine
    il y a 25 jours
  • 1 900 € a 2 400 €Estimé
     ...Description du poste Intitulé du poste Architecte Logiciel IA F/H Description de la mission Rejoindre KNDS France, c'est bien...  ...Vision par Ordinateur ou domaine connexe (Master ou diplôme d'ingénieur; doctorat de préférence). Expérience : ~ Fort... 
    CDI
    Contrat d'apprentissage
    Versailles, Yvelines
    Il y a 2 mois
  • 2 000 € a 2 300 €Estimé
    Description de l'entreprise Rejoignez ALTEN, la “Maison des ingénieurs”... Leader de l’Ingénierie et des Entreprise IT Services,...  ...intégrez une équipe d’experts dédiée à la conception d’architectures IA robustes et scalables , au service de grands comptes... 
    Temps plein

    ALTEN

    Boulogne-Billancourt
    il y a 26 jours
  • 2 900 € a 3 500 €Estimé
     ...fabless spécialisée dans la conception de processeurs d'inférence IA haute performance pour le cloud et les centres de données...  .... 👉 Mission Vous intégrerez une équipe composée d'ingénieurs IA, ASIC et logiciel (embarqué et serveurs) et participerez au projet innovant... 

    Mercato de l'emploi

    Meudon, Hauts-de-Seine
    Il y a un mois
  • 1 900 € a 2 300 €Estimé
     ...clés de l’innovation tels que l’IA, la cybersécurité, le...  ...compétences recherchées en ingénierie logicielle et data. Vous...  ...Votre profil STAGE – Ingénieur Développement et intégration...  ...personnel) en développement logiciel ou en data est appréciée.... 
    Contrat d'apprentissage
    Stage

    Thales - CortAIx Factory (AI by Thales)

    Palaiseau, Essonne
    il y a 25 jours
  • 2 300 € a 2 800 €Estimé
     ...: CONTEXTE Challenge Data est une plateforme de challenges en science des données et...  ...poste vise à renforcer le développement logiciel, la maintenance et l'évolution de la plateforme...  ...Domaine(s) d'études requis : Ecole d'ingénieur, master informatique, ou équivalent... 
    CDD
    Télétravail
    Paris
    Il y a un mois
  • 60k € a 70k €/an

     ...recherchons pour un acteur majeur des media un ingénieur DevOps pour industrialiser son SI et...  ...besoin * Garantir l'alignement de la plateforme avec les standards du SI : sécurité (IAM,...  ...composants d'exécution associés. * Intégrer l'IA à la plateforme : serveurs MCP, accès aux... 
    CDI

    UMANTIC TECHNOLOGIES

    Paris 15e
    il y a 13 jours
  • 1 900 € a 2 300 €Estimé
     ...350 collaborateurs passionnés autour d’un logiciel et une offre de services conçus pour...  ...’aventure ! Tes missions dans la squad IA Nos 3 équipes Produit comptent une soixantaine...  ...et travailleras avec la squad IA Plateforme pour : Participer à l’analyse technique... 
    Télétravail

    padoa

    Paris
    Il y a 2 mois
  • 2 100 € a 2 500 €Estimé
     ...Développeuse / Développeur Type de poste Technique et spécialisé Statut du poste Vacant Intitulé du poste INGENIEUR DEVOPS (Lead data plateform enginner) PN Description du poste Groupe RIFSEEP : 2 Contexte : Dans le cadre du développement et de la... 
    Temps plein
    Télétravail
    Issy-les-Moulineaux, Hauts-de-Seine
    Il y a un mois
  • 70k €/an

     ...au développement, à l'innovation et à l'IA, notre client — groupe bancaire de premier...  ...le développement et le déploiement d'une plateforme agentique (agents autonomes ou non), augmentée...  ...recherché : Diplômé d'une école d'ingénieur (Bac+5) ou équivalent, vous disposez d'... 
    CDI
    Temps plein
    Freelance
    Télétravail

    LinkSyde

    Paris
    il y a 5 jours
  • 1 800 € a 2 000 €Estimé
     ...frameworks dédiés; Contribuer à l’intégration de solutions d’IA dans les projets de l’agence, notamment via l’utilisation d’API...  ...activement au développement de fonctionnalités pour des plateformes et expériences digitales innovantes conçues pour les clients de... 
    2 jours/semaine
    Stage
    Stage de 6 mois
    Télétravail

    Brainsonic

    Paris
    Il y a un mois
  • 1 800 € a 2 000 €Estimé
     ...clients, dans le secteur des assurances, un(e) : Alternance Ingénieur Devops en IA/LLM (F/H) Rattaché(e) au département de cyberdéfense, vos...  ...une spécialitiation en cybersécurité, ou développement logiciel. Vous possédez une excellente maîtrise linguistique en anglais... 
    Alternance

    Défi RH

    Paris
    il y a 18 heures
  • 1 900 € a 2 300 €Estimé
     ...expertises digitales - conseil, design, IA, data, tech, intégration et cybersécurité...  ...technologies. Missions En tant qu'ingénieur DevOps/SRE, vos principales missions seront...  ...montée en compétences rapide, via notre plateforme de formation : Niji University (plus de 33... 
    Contrat d'apprentissage
    Télétravail
    Horaires flexibles

    Niji

    Issy-les-Moulineaux, Hauts-de-Seine
    il y a 11 heures
  • 2 300 € a 2 800 €Estimé
     ...une équipe d'ingénierie logicielle qui a pour mission de...  ...et de développer une plateforme de traitements automatiques...  ...(serveurs d'inférence). Vous participerez...  ...DEA, DESS, diplôme d'ingénieur Postulez Description...  ...librairies et modèles d'IA. Votre profil Diplôme... 
    CDD
    Paris
    Il y a un mois
  • 1 800 € a 2 200 €Estimé
     ...technologique, réalisation logicielle et expertise en...  ...la data science de l'IA et des méthodologies d...  ...diplôme Bac+5 (école d’ingénieur, université, master spécialisé...  ..., optimisation d’inférence). ~ Excellente...  ...innovant. NijiU: notre plateforme de formation digital... 

    Niji

    Issy-les-Moulineaux, Hauts-de-Seine
    Il y a 2 mois
  • 2 200 € a 2 700 €Estimé
     ...domaines clés de l'innovation tels que l'IA, la cybersécurité, le quantique, les...  ...de Données Tactiques (LDT) en tant qu'ingénieur logiciel sur la solution de liaisons de données...  ...données multi-liaisons pour tout type de plateformes (terrestres, navales et aériennes).... 
    Gennevilliers, Hauts-de-Seine
    il y a 3 jours
  • 2 500 € a 2 900 €Estimé
     ...domaines clés de l'innovation tels que l'IA, la cybersécurité, le quantique, les technologies...  ...Vous rejoignez le Service Développement Logiciel du Centre de Compétence "Radars...  ...logiciel ? Vous disposez d'un diplôme d'ingénieur ou équivalent Bac+5 dans le domaine de l'... 
    CDI

    THALES

    Vélizy-Villacoublay, Yvelines
    il y a 14 jours

Voulez-vous recevoir plus d'offres d'emploi ?

S'abonner et recevoir des offres d'emploi similaires à Ingénieur Logiciel - Runtime d'Inférence IA & Plateforme de Serving. Soyez parmi les premiers à postuler !