GPT-Rosalind : OpenAI lance un modèle biologique spécialisé OpenAI lance gpt-rosalind, un modèle biologique dédié à la biologie et à la recherche, avec des partenariats biotech et des questions sur les données utilisées. Avec gpt-rosalind, OpenAI déploie un modèle dédié à la biologie, destiné à aider chercheurs et industries pharmaceutiques et biomédicales.
Avec gpt-rosalind, OpenAI déploie un modèle dédié à la biologie, destiné à aider chercheurs et industries pharmaceutiques et biomédicales. Le choix du prénom Rosalind Franklin rappelle l’histoire de la découverte de l’ADN et les enjeux de crédit dans la science moderne.
gpt-rosalind, un modèle spécialisé pour la biologie
OpenAI a mis à jour Codex et affirme que ce modèle peut améliorer le workflow des biologistes, biochimistes et bioinformaticiens, en explorant davantage de possibilités et en formulant plus rapidement des hypothèses. gpt-rosalind est présenté comme un outil pour analyser des données et fouiller la littérature scientifique existante, tout en s’appuyant sur des techniques comme le RAG (retrieval-augmented generation). Toutefois, les données d’entraînement et les sources exactes utilisées restent non divulguées.
L'instrumentalisation du prénom et les réactions
OpenAI indique que le nom choisi est lié aux recherches fondamentales sur l’ADN, mais des chercheurs rappellent que Rosalind Franklin n’a pas reçu le prix Nobel pour cette découverte et que ses contributions ont été créditées ultérieurement. L’article met aussi en lumière l’ironie d’un acteur privé qui s’appuie sur les travaux d’autrui pour former ses modèles et qui rend hommage à une chercheuse longtemps invisibilisée.
Contrairement à certaines pratiques industrielles, OpenAI aurait choisi d’utiliser uniquement le prénom et non le nom complet, ce qui ajoute encore à la dimension symbolique de l’hommage.
Collaboration et performances : ce que l’on sait
Selon OpenAI, gpt-rosalind doit permettre d’analyser des jeux de données en biologie et de parcourir la littérature pour proposer de nouvelles expériences. L’entreprise ne précise pas les données exactes utilisées pour l’entraînement.
- Collaborations : des partenariats avec des acteurs du secteur biotechnologique comme Novo Nordisk, Thermo Fisher et Moderna sont évoqués pour intégrer le modèle dans les processus de recherche.
- Benchmarks : OpenAI publie des benchmarks montrant le modèle en tête dans son domaine, mais les résultats varient selon les tests et ne démontrent pas une supériorité claire sur tous les fronts.
Limites et ce qu’il reste à démontrer
La réalité des données d’entraînement et les sources exactes restent floues, et l’utilisation du RAG ou d’autres techniques sera sans doute nécessaire pour obtenir un outil réellement à jour. Pour l’évaluation externe, les chiffres publiés par BixBench ne placent pas nécessairement gpt-rosalind au-dessus d’un GPT-5.4 non spécialisé.
Pour terminer
La montée en puissance des modèles spécialisés pour les sciences de la vie illustre l’intérêt croissant des acteurs de l’IA pour ce secteur. Mais les questions sur les données d’entraînement et sur la vérification des résultats restent ouvertes.