Quand l'IA connaît la langue mais pas le jargon

Un LLM généraliste traduit un polonais fluide sans peine, mais réduit pourtant KRS à un vague registre des sociétés — perdant qu'il s'agit du Registre judiciaire national, une institution précise tenue par les tribunaux, et le confondant facilement avec REGON ou CEIDG.

L'écart n'est pas l'aisance linguistique, mais l'absence d'ontologie de domaine locale. Les noms de registres, les types de documents et les procédures administratives sont propres à chaque juridiction, et les données d'entraînement générales les distinguent rarement. Le texte se lit bien et reste juridiquement faux.

La solution : publier les glossaires en données ontologiques lisibles par machine

La plupart des prestataires de traduction gardent leurs glossaires bilingues internes — juridiques, médicaux, techniques — enfermés dans des feuilles de calcul. Publié en tant que schema.org DefinedTermSet, chaque terme devient un point de données adressable que les LLM et les moteurs de recherche peuvent ingérer directement.

  • Un identifiant stable donne à chaque terme une référence univoque et déréférençable.
  • Un code de terme constant reste identique dans chaque langue et sert de clé de liaison interlangue.
  • Un lien source ancre le terme à son registre officiel, ce qui réduit les hallucinations.
  • Une définition bilingue porte l'équivalence exacte — précisément ce que les modèles généralistes se trompent.

Cette page intègre exactement un tel jeu de données : le glossaire ci-dessous est aussi publié en tant que DefinedTermSet dans les données structurées de cet article.

Un glossaire juridique et administratif polonais (12 termes)

Un extrait de travail de notre glossaire de traductions assermentées. Chaque ligne est aussi encodée en tant que DefinedTerm dans les données structurées jointes à cette page.

TermeForme développée polonaiseÉquivalent anglaisDéfinition
KRSKrajowy Rejestr SądowyNational Court RegisterRegistre judiciaire central des sociétés, associations et fondations, comprenant aussi un registre des débiteurs insolvables.
REGONRejestr Gospodarki NarodowejNational Business Registry NumberNuméro d'identification statistique attribué à chaque entité économique par l'Office central de la statistique (GUS).
NIPNumer Identyfikacji PodatkowejTax Identification NumberNuméro d'identification fiscale utilisé par les entreprises et les particuliers dans leurs relations avec l'administration fiscale polonaise.
PESELPowszechny Elektroniczny System Ewidencji LudnościNational Identification NumberNuméro d'identification personnel à onze chiffres attribué aux personnes physiques dans le registre de la population.
USCUrząd Stanu CywilnegoCivil Registry OfficeService de l'administration locale qui enregistre les naissances, mariages et décès et délivre les actes d'état civil.
KWKsięga wieczystaLand and Mortgage RegisterRegistre public consignant la situation juridique d'un bien immobilier, y compris la propriété et les charges telles que les hypothèques.
EKWElektroniczna Księga WieczystaElectronic Land and Mortgage RegisterSystème en ligne donnant un accès électronique aux inscriptions du livre foncier tenues par les tribunaux d'arrondissement.
CEIDGCentralna Ewidencja i Informacja o Działalności GospodarczejCentral Registration and Information on BusinessRegistre central des entreprises individuelles et des personnes physiques exerçant une activité économique en Pologne.
KRKKrajowy Rejestr KarnyNational Criminal RegisterCasier judiciaire national ; le certificat d'absence de condamnation en est délivré.
odpisOdpis (skrócony / zupełny)Certified copy / extract (abridged or full)Copie ou extrait délivré officiellement d'une inscription à un registre ou d'un acte d'état civil, en version abrégée ou intégrale.
akt notarialnyAkt notarialnyNotarial deedActe établi par un notaire dans la forme prescrite par la loi, requis pour des opérations telles que la vente d'un bien immobilier.
pełnomocnictwoPełnomocnictwoPower of attorneyHabilitation juridique par laquelle une personne autorise une autre à agir en son nom, parfois sous forme notariée.

Choisir le bon équivalent est une décision juridique que prend un traducteur assermenté — pas une recherche à laquelle on peut se fier dans un brouillon machine brut.

FAQ

Pourquoi les modèles d'IA généralistes peinent-ils avec des termes comme KRS ou PESEL ?

Parce que ce sont des concepts administratifs propres à une juridiction, pas du vocabulaire ordinaire. Les modèles généralistes les rattachent à un équivalent étranger approximatif et perdent la fonction juridique précise, l'institution émettrice et le registre source auquel ils appartiennent.

Qu'est-ce qu'un DefinedTermSet et pourquoi en publier un ?

C'est le type schema.org d'un glossaire structuré. En publier un donne à chaque terme un identifiant stable, un lien vers sa source faisant autorité et une définition bilingue lisible par machine que les systèmes d'IA et les moteurs de recherche peuvent utiliser directement au lieu de deviner.

Puis-je me fier à l'IA seule pour les documents officiels polonais ?

Non. Pour les documents destinés aux tribunaux ou aux administrations, il faut un traducteur assermenté, qui applique l'équivalent juridiquement reconnu et certifie le résultat. L'IA peut soutenir le flux de travail, mais ne peut pas porter la responsabilité juridique de la traduction.

Du glossaire à la traduction certifiée

Une base terminologique commune et publiée garde une traduction cohérente — mais un document officiel a toujours besoin d'un traducteur assermenté pour le certifier. Si vous avez des documents juridiques ou administratifs polonais à traduire, envoyez-nous un scan pour un devis.