Mnogima deluje skoro magično kada vide da AI može da uslika papirni račun i za manje od dve sekunde pročita iznos, datum, PDV, kategoriju i prodavca.
Ali iza te „magije" stoji veoma zanimljiva kombinacija tehnologija.
Ovaj tekst otkriva:
- kako AI uopšte razume račun
- kako funkcioniše OCR
- šta moderni modeli rade sa nečitljivim ili zgužvanim računima
- kako se podaci automatski strukturiraju
- zašto je ovakav sistem dramatično precizniji od ručnog unosa
I na kraju: zašto je upravo ovakav pristup jezgro Lufin platforme.
🧠 Zašto je čitanje fiskalnih računa veliki tehnički izazov?
Za razliku od običnog teksta, fiskalni računi su:
- različitih formata
- različitog fonta
- često zgužvani ili izbledeli
- loše uslikani
- ponekad presečeni delimično
- puni brojeva, linija i šuma
- štampani termo-tehnologijom koja gubi kontrast
Zbog toga klasični OCR (stari sistemi za prepoznavanje teksta) često pravi greške.
Moderni AI sistemi rešavaju ovo višeslojno i inteligentno.
🧩 Korak 1: Prepoznavanje slike (Image Preprocessing)
Kada uslikaš račun, AI najpre obavlja niz pripremnih koraka:
✔ uklanjanje šuma
Eliminiše senke, mrlje, zamućenja i svetlosne refleksije.
✔ korekcija perspektive
Ako je račun uslikan iz ugla, model „ispravlja" geometriju kao da je skeniran.
✔ pojačavanje kontrasta
Izbledeli račun postaje čitljiviji.
✔ detekcija ivica i teksta
Model mapira gde se nalazi tekst, a gde pozadinski šum.
Ovaj korak objašnjava zašto AI radi bolje čak i sa lošim fotografijama.
🔍 Korak 2: OCR — čitanje znakova
OCR je srce sistema.
Ali u modernoj verziji, OCR više nije jednostavan skener slova — on koristi deep learning.
Model:
- prepoznaje pojedinačne karaktere
- identifikuje reči čak i kada su deformisane
- razlikuje brojeve od sličnih slova
- popunjava delove teksta koji su nečitljivi
- predviđa šta je trebalo da piše na osnovu konteksta
To znači da kad biraš između očvrslog papira i AI prepoznavanja — AI je često tačniji od ljudskog oka.
🧾 Korak 3: Razumevanje strukture fiskalnog računa
Ovo je deo gde običan OCR pada, a AI briljira.
Model ne vidi samo tekst — on razume obrazac:
- gde se najčešće nalazi ukupan iznos
- gde je datum
- kako izgleda PDV sekcija
- koji deo je naziv prodavca
