• Zoltán Kristó

Mi lesz veled OCR?

A NAV egyre robusztusabb e-Áfa és online számla újításai vajon elmossák-e az utóbbi évek OCR-es számlafelismerési mini-forradalmát, vagy pont, hogy bebetonozzák az ezzel foglalkozó tech-cégek pozícióját?


Egyre nagyobb teret hódít a könyvelők, és immár a vállalkozók mindennapjaiban a NAV online számla rendszere, pontosabban annak számlaadat-lekérdezési funkciója.


Némi kezdeti tétovázás és elégedetlenség után, az pár hónap alatt világossá vált, hogy az "OSA" alapjaiban rázta meg a gazdasági eseményekkel kapcsolatos adatrögzítés közel 40 éves aggastyán védőbástyáit, még akkor is ha átmeneti vákumot (vö:fejtörést) okozott abban, hogy mi vajon a korábbi szatyros módszert leváltó optimális könyvelési folyamat a megújult digitális térben.


De vajon hogyan érinti a változás azokat, akik az elmúlt pár évben az optikai karakterfelismerésben (OCR) hittek és fejlesztési kapacitásuk jelentős részét abba az irányba összpontosították, hogy számlaképekből mazsolázzanak ki számlaadatokat?


Gyors bukás, vagy neoreneszánsz következik? A posztban erre a kérdésre próbálok választ adni, mindezt teszem a QUiCK szubjektív szemüvegén keresztül, hiszen mi is (még) a mazsolázás mellett döntöttünk.


I. rész: Mazsolázógépek vagy a szinkronszínészek, azaz mi történik a piacon?


Komolyabb piaci elemzések nélkül, gyorsan végigvettem, mi történik a magyar piacon az OCR és és számlaszinkron kapcsán.


Billcity


Bár OCR-es számlafeldolgozási volumen tekintetében túl sok összesítő adat a magyar piacról nem érhető el, mégis talán méltán nevezi magát piacvezetőnek a Billcity, aki mostmár több éve stabilan nyújtja könyvelői partnereinek saját fejlesztésű "mazsolázógépét".


Az OCR mellett, - tavaly óta - NAV adatok is dúsítják okoskontír megoldásukat, sőt a számlák banki adatokkal való összepontozása is elérhető a szolgáltatások között.


Weboldalukon közölt szállítói számla feldolgozottsági adatok alapján, közel 200.000 számlaképet dolgoz fel havonta a Billcity. A weboldalon közölt adatok vizsgálata alapján, a számlakép feldolgozás volumene enyhe csökkenő trendet mutat 2020. októbere óta. (Figyelem: a chart utolsó bejegyzése 2021. augusztusi, tehát fél havi adat, így az nem releváns)


Ha elfogadjuk, hogy a Billcity a piacvezető OCR-es számlafeldolgozás tekintetében, akkor az adatok alapján, akár azt is állíthatnánk, hogy elindult "lefelé" ez a technológia.

Csökkenő trend a Billcitynél az OSA bevezetése utáni első negyedéves áfa bevalláskor

SDSYS

Szintén elsősorban könyvelők, illetve könyvelési rendszerek számára lehet ismerős az SDSYS neve.


Az ő mazsolázógépük központi motorja a #matching-nek nevezett megoldás, mellyel NAV adatok és számlaképek találnak egymásra a felhőben.


Bár volumenadatokat ők nem közölnek oldalukon, de weboldaluk partnerszekciója és "folyosói pletykák" alapján, úgy tűnik mostanában magasabb ligába pozícionáltak magukat, azaz a nagyvállalati szegmensre fókuszálnak, kkv könyvelők helyett. Emellett könyvelőprogramokba és számlázókba épül be szolgáltatásuk, egyfajta "nagykereskedelmi" modellben. Ezek közül egyik ígéretes új szereplő, a kifejezetten a számlaérkeztetés folyamatának problémájára, könyvelői szemszögből reagáló Cadren.


Az SDSYS árbevétele egy korábbi számviteli piacot összehasonlító tanulmány alapján dinamikusan nő. Tehát ha a tranzakciós adatok birtokában kiderülne, mégis ők a piacvezetők OCR-es számlamennyiség feldolgozás tekintetében, vagy közel annyi adatot dolgoznak fel, mint a "piacvezető" Billcity, akkor úgy tűnik mégis van remény a mazsolázógépek piacán.


Többiek és mi

Pár éve csak úgy durrogtak az OCR-es mesterséges intelligencia marketing üzenetek. Az üzenetekért elsősorban felelős https://www.szamlai.hu/ vagy a Doqsys, cégekről egyre kevesebbet lehet hallani. Ők jelenleg tranzakciós adatokat sem közölnek, így nagyon kevés információval rendelkezünk, azaz nem lettem okosabb.


Természetesen vannak egyéb giga nemzetközi OCR szereplők némi magyar jelenléttel, de az ő adataikat vizsgálatába bele sem kezdtem, mert annyira bonyolult lett volna.


Saját volumenadatainkat vizsgálva (melyek egyébként nem publikusak, csak most a cikk kedvéért azok), ugyan jelentős növekedést éltünk meg a szállítói számlák feldolgozásában az elmúlt évben, de piaci exponáltságunk igen apró ahhoz, hogy ebből messzemenő következtetéseket vonjak le, és így voksot rakjak az OCR mellé.

QUiCK autoscan által feldolgozott szállítói számlaadatok 2020 márciusa óta.

Szinkronszínészek


Ahogy láttuk, az OCR piacon nem túl sok szereplő focizik, nem úgy mint a szinkronszíneszek piacán.


Ma már szinte nincs olyan könyvelőprogram Magyarországon, aki okosabb vagy butább OSA integrációt ne épített volna be programjába. Ugyan a hagyományos könyvelőprogramok eddig elenyésző része reagált a:

"számlakép, vagy legalább egy vállalkozói jóváhagyás azért kellene a könyveléshez"

problémára, de ezen most libbenjünk át. Lassan egy éve tehát áramlanak az adatok a könyvelőprogramokba, a vidám könyvelői társadalom legnagyobb örömére, akiket szemmel láthatóan egyre jobban ki lehet hozni a sodrukból, ha az édes nedüt tartalmazó "NAV-számlacsap" leáll egy rosszul időzített pillanatban.


Mivel nagyon nehéz lenne ennek a piacnak a tranzakciós adatait felmérni, megelégedtem két apró gondolattal:

  • Az egyik, hogy úgy tűnik, a háttérben komoly forradalom zaljlik, mely egyre inkább feszegeti, a jelenlegi jogszabályi kereteket. Ez egyértelműen gyengítheti, sőt beszánthatja az OCR-es cégek piacát.

  • a másik, hogy a magukra valamit adó könyvelőprogramok, vagy a fenti mazsolázógépekkel karöltve, vagy teljesen egyedül, de azért valamilyen NAV-adat és számlakép összepárosító logikát alkalmaznak programjukban azért, hogy a jelenlegi jogszabályi elvárásoknak megfeleljenek. Ez a momentum pedig az OCR mellé rak egy nagyon halovány strigulát.

A könyvelőprogramok órási piacát hátrahagyva, azért tegyünk még említést két másik szegmensről, a számlázókról és a feltörekvő friss nemzedékről, azaz azokról, akik egy éven belül jelentek meg a piacon, vagy új megoldással rukkoltak elő.


Az online számlázók: Számlázz.hu és Billingo


A két legnagyobb számlázó felismerve a digitális sztráda jelentőségét és bízva abban, hogy valóban exponenciálisan terjed majd a digitális gondolkozás kishazánkban, nem volt rest és ők is replikálták ezt a hatalmas nemzeti számla adatbázist.


Mind a Billingoban, mind a Számlázz.hu-ban elérhetőek tehát a NAV belföldi szállítói adatok, és ha jól belegondolunk ennél sokkal több is. (és jobb ha belegondolunk)


Legutóbbi piackutatások alapján a két számlázó, (ezek közül persze a Számlázz.hu jóval nagyobb súllyal), a "számlapiac" több mint 50%-át dominálják.


Ha tehát mégis a számlakép felé billen a nemzeti mérleg nyelve, valószínűleg drága mazsolázó technikák nélkül is képesek számlaadatokat és számlaképeket adni, a kiváncsi, és persze megfelelő jogosultsággal bíró bámészkodóknak, hiszen a számlaképek nagyrésze eleve náluk van. (Sőt a legutóbbi fejlesztéseiket elnézve egyre inkább abba az irányba megy mindkét szolgáltató, hogy olyan számlaképeket is elhappoljanak, ami egyáltalán nem náluk keletkezik)


Okosabb tehát most sem lettem, de hátha választ adnak eredeti kérdésemre a legújabb szereplők, akik épp csak, hogy belekóstoltak ebbe a gyönyörű és izgalmas világba.


Cashbook


A korábbi chartok jelmagyarázatából talán már rájöhettél, hogy számunkra a Billcity és a Cashbook az, akit hanem is ádázul, de megkülönbözetett figyelemmel tisztelünk versenytársként. Jöjjön hát a Cashbook, akit múltja ellenére, mindenképpen a legújabb szereplők közé osztályoztam.


A Cashbook könyvelőket és vállalkozókat köt össze pénzügyi megoldásával és a termékstratégiájukat tekintve, valószínűleg a könyvelők vezényletével képzelik el a "nagy digitális számviteli reformot".

Szolgáltatásuk középpontjában az integrációk és a szinkronizált adatok állnak. Mindez jelenleg OCR technológia nélkül, de szintén a számlaképek fontosságának fenntartása mellett.


Tranzakciós adataikat elnézve, - amit szintén publikus weboldalunkról nyertünk - az OSA tavalyi bekapcsolása után (2020-július) örült iramban megugrottak szállítói számla feldolgozásuk, majd azóta is töretlenül, bár kisebb ütemben nőnek.


Bár az ő megoldásukban is lehet NAV adatot és számlaképet egymáshoz passzintani, mégis a chartokat elnézve lehet valami fogalmunk arról, milyen ereje van a szállítói számla feldolgozásban az OSA technológiájának.


A többiek, azaz a "szingularitás egyház"


És akkor a piaci körképet zárva, nézzük milyen további megoldások vannak.

Igazi szinkron-primadonnákat mutatnék be, akik szinte teljesen kizárják a számlakép létét. Mind vállalkozóknak, mind könyvelőknek a mesterséges intelligenciára és adatszinkronokra épülő megoldást ígérnek.

A győri iBookr, vagy a nagy múltú Axel Software ház holaszamla nevű rendszere, vagy a pl. a pécsi-tallini Acounto megoldásainban már nyoma sincs felesleges mazsolázgatásnak.


Kizárólag színtiszta adatalapú, automatikus könyvelés és pénzügyek az ígéretek között, ahol szinte maguktól, alacsony humán beavatkozás mellett "lekönyvelődnek" a gazdasági események.


Majdnem mindegyik rendszerbe regisztráltam és körülnéztem, (amelyikbe lehetett), és számomra, - a kezdeti "gyerekbetegségeik" ellenére - markánsan érezhető az irány, ami szempillantás alatt szétrobbanthatja a hagyományos könyvelési technológiát, még akkor is, ha reméljük könyvelési szingularitást, vagy fekete lyukakat nem ütnek a NAV drága rendszereibe, vagy a könyvelőirodák falába.

metafizika és a könyvelés az iBookr-nél.

II. rész - De mit akar a vállalkozó?

A piac áttekintése után okosabb nem lettem. De mit mondanak a vállalkozások, ők vajon hogy élik meg a kialakult helyezetet?


Még két éve csináltunk egy kutatást, melyben a számlakép jövőjét vizsgáltuk, de nagyon hasonló eredményekre jutottunk, mint a fenti piaci elemzés után.

Igazából az eredmény az lett, hogy fene sem tudja mi lesz a számlaképekkel, vagy az OCR-el.

Néhány fontos vállalkozói üzenetet a múltkori kutatásból és azóta szerzett tapasztalatokból azonban kiemeltem:


"Legyen OCR (valójában számlakép)" - melletti legnagyobb előfordulású érvek:

  • bár a külföldi számlák aránya egy átlagos cég életében alacsony, de ha van, akkor azok kezelése nem térhet el a belföldi számlák kezelésétől;

  • szükségünk van a számlaképekre pályázataink miatt, ezért elképzelhetetlen a számlakép nélküli működés, tehát számlaképpel együtti folyamatra keresünk megoldást;

  • A számla az számla. Meg kell nézem, mert attól hiteles. Másképp hogyan utalnám el?

  • "Mi az, hogy xml?"

  • A törvény előírja, hogy rendelkezzek a számlaképpel.


"Ne legyen OCR (valójában számlakép)" melletti legnagyobb előfordulású érvek:

  • Semmi szükségem nincs a papírra, csak hátráltatja a folyamataimat. Ha megjeleníti nekem valami a számlaképet, engem nem érdekel, hogyan nézett ki az eredeti.

  • Ha minden részlet meg van adatszinten és átfut a NAV rendszerein, akkor mit jelent egyáltalán számlakép?

  • Ha algoritmusokkal minden ellenőrizhető, akkor nekem nem szükséges a számlakép.

  • A QUiCK-ben jelenleg a vállalkozói felhasználók már közel 17%-a számlakép nélkül fogad el generált számlaképeket, és még egy utalás előtt sem tölti fel a valódi számlát. Ez az arány az OSA megjelenése óta folyamatosan nő.


III. rész Autoscan - a mi mazsolázógépünk


Fentiek alapján oktondi lenne, ha azt mondanám én, vagy mi a QUiCK-nél tudjuk, hogy merre megy a piac és azért foglalkozunk még mindig az autoscannel, azaz a QUiCK-ben működő OCR alapú felismerési motorral.


Az elmúlt 9 hónapban bár fejlesztéseink legfontosabb fókusza egyáltalán nem az OCR volt, de legbonyolultabb megoldásaink mégis ezzel, és az OSA-val kapcsolatosak.


Ezek közül a legfontosabbak, a teljesség igénye nélkül a következők:

  • Mivel a QUiCK-ben elsősorban számlakép alapú a számlaiktatás, ezért megoldottuk, hogy szinte minden helyzetben, (ha hamarabb érkezik a számlakép, ha később), a kép és és a NAV-adat a lehető legtöbb esetben magától "párosodjon".

  • Ha ez mégsem sikerülne, pillekönnyűvé tettük a humán beavatkozást. További információk a mi NAV karanténunkról itt.

  • Somi Andris munkája nyomán pár hete bemutattuk az autoscan új verzióját. Ez a verzió sokkal robusztusabbá tette azt a teljes folyamatot, ami a számlaképekből számlaadatokat "csinál".

  • Az új autoscan verzió a számlánkénti felismerési idő mediánját a korábbi verzióban megfigyelhető 23 másodpercről 4 másodpercre csökkentette. Azaz számlákat közel hatszor gyorsabban ismerjük fel, mint korábban.

  • Az új autoscant külföldi számlák felismerésére is optimalizáltuk. Itt tehát nagyot nőtt a számlaadatok felismerésének pontossága.

  • Pár hete a VIES rendszerhez is kapcsolódunk, hogy külföldi számlaadatok kitöltésekor a magyar Cégjelzős megoldáshoz hasonló partnerkitöltés is működjön.

A számlaadatok pontossága a különböző verziókban és a kapcsolódó "confusion matrix"
A számlaadatok pontossága a különböző verziókban és a kapcsolódó "confusion matrix" (narancs az új verzió)

Zárszó


Az tehát, hogy a fenti fejlesztésekre, mondjuk 6-12 hónap, vagy akár 3-5 év távlatában szükség lesz-e még egyáltalán erős bizonytalanság övezi.


Az viszont szerintem majdnem biztos, hogy akár szinkronszínészek vagyunk, akár mazsolázógépet gyártunk, csüggednünk nem kell. Olyan környezetben dolgozhatunk, ahol ugyan gyorsan válnak értéktelenné, korábban nagyon értékesnek tűnő dolgok, de az ebbe fektetett energia nem tűnik el, és valahol a nagy tanulási görbe, egy kis szeletkéjében ott hagyhatjuk névjegyünk, vagy legalább monogramunkat.

633 megtekintés