Formatul AI‑native care face documentele ușor de înțeles pentru modele și automatizări.
DocLang este un standard deschis creat special pentru era inteligenței artificiale — un format de document conceput nu pentru tipărire sau randare, ci pentru înțelegere automată. În timp ce PDF, DOCX, HTML sau Markdown au fost dezvoltate pentru oameni și browsere, DocLang pune în centru modul în care modelele AI citesc și interpretează informația.
De ce este nevoie de un nou format pentru documente
Documentele din lumea reală — contracte, facturi, rapoarte financiare, lucrări științifice — sunt dificil de procesat corect de către modele. Formatele tradiționale au fost create pentru afișare, nu pentru analiză semantică. Consecințele sunt bine cunoscute:
- ordinea de citire este ghicită
- tabelele sunt aplatizate în text
- figurile sunt omise
- metadatele se pierd complet
Aceste limitări afectează direct acuratețea modelelor și cresc timpul petrecut în pre-procesare, în loc să fie investit în dezvoltarea produsului.
Ce aduce diferit DocLang
DocLang definește un format structurat și lizibil de mașini, construit pentru ca modelele să poată interpreta documentele fără ambiguități.
Elemente cheie ale formatului
- fiecare componentă are tag semantic, bounding box și ordine de citire
- tabelele păstrează structura completă prin OTSL, mult mai eficient decât HTML
- metadatele de guvernanță (PII, permisiuni, reguli de training) sunt integrate direct în document
- nu există conversii sau straturi intermediare — formatul este nativ pentru tokenizatoarele LLM
DocLang nu este un parser și nu este un API. Este un standard, la fel cum JSON este pentru date sau HTML pentru web.
Suport extins pentru multimedia
Formatul nu se limitează la text. Audio, imagini și video sunt tratate ca elemente de primă clasă, cu:
- vorbitori
- timestamp-uri
- scene
- aceeași logică structurală folosită pentru titluri și tabele
Acest lucru permite modelelor să înțeleagă conținut multimodal într-un mod coerent și predictibil.
Cele șase proprietăți fundamentale ale DocLang
1. AI‑native
Fiecare element este mapat direct pe tokeni LLM, fără straturi de traducere.
2. Lossless
Tabelele își păstrează grila completă, figurile își păstrează poziția, iar ordinea de citire nu este inferată, ci explicită.
3. Expressive
Roluri semantice, ierarhie, bounding box-uri — totul este codificat complet pentru a elimina ambiguitățile.
4. Beyond documents
Transcrieri audio, imagini și segmente video folosesc aceleași primitive.
5. Unambiguous
Un singur mod canonic de a reprezenta fiecare tip de conținut, indiferent de instrumentul folosit.
6. Open
Standard deschis, fără lock‑in, parte din ecosistemul Linux Foundation.
Beneficii pentru enterprise AI
DocLang transformă documentele în context de business structurat, nu doar în text procesat.
Avantaje directe:
- păstrează sensul, relațiile și contextul de afaceri
- reduce erorile în fluxurile automate
- accelerează luarea deciziilor
- include metadate de conformitate direct în document
- asigură portabilitate totală între furnizori și sisteme
Pentru organizațiile care lucrează cu agenți AI, RAG sau automatizări complexe, DocLang devine stratul de încredere dintre documente și modele.
Un format construit pentru viitor
DocLang este un XML restrâns, optimizat pentru tokenizatoarele LLM, cu un raport excelent între expresivitate și eficiență. Tabelele folosesc doar câțiva tokeni structurali, iar fiecare element are o reprezentare clară și predictibilă.
Standardul este public, implementarea de referință este disponibilă, iar grupul de lucru este deschis contribuțiilor.
Concluzie
DocLang reprezintă fundația necesară pentru a lucra cu documente reale în ecosistemul AI. Este un format modern, precis, fără pierderi, construit pentru modul în care modelele înțeleg informația — nu pentru modul în care o afișăm.
Pentru oricine dezvoltă produse bazate pe LLM-uri sau VLM-uri, DocLang este substratul care lipsea.


