Wprowadzanie faktur do systemów handlowych i księgowych to zazwyczaj czasochłonny, mozolny i nie pozbawiony ryzyka popełnienia błędu proces. Każda cyfra, litera czy przecinek odgrywają w tej kwestii kluczowe znaczenie. Jednym z dostępnych rozwiązań tego problemu jest skanowanie faktur oraz wykorzystanie narzędzia OCR, służącego do rozczytywania tekstu z dokumentów.  A czy wiesz, że jego historia to fascynujące ponad 100 lat prób i doświadczeń…

OCR to skrót od angielskiego terminu Optical Character Recognition, co w tłumaczeniu oznacza optyczne rozpoznawanie znaków. Oprogramowania tego typu wykorzystywane są do konwersji i odczytu zeskanowanych dokumentów. Ściślej mówiąc, proces OCR polega na wyodrębnieniu tekstu z obrazu strony.

Pliki dostarczane drogą elektroniczną, faksem czy pochodzące ze skanera, nie posiadające możliwości edytowania znaków tekstowych, dla komputera są jedynie zestawem dużej ilości pikseli, które razem składają się na obraz tekstu. Zadaniem procesu OCR jest analiza tego obrazu, a na jej podstawie wyodrębnianie tekstu możliwego do edycji. W efekcie istnieje opcja zaznaczania, kopiowania oraz przenoszenia rozpoznanych treści do różnych aplikacji. To z kolei eliminuje konieczność ręcznego przepisywania danych np. z zeskanowanych faktur.

– Jest to bardzo duże ułatwienie przede wszystkim dla pracowników w biurach rachunkowych. Aby przyśpieszyć i ułatwić im pracę stworzyliśmy platformę Ebi 24. Wykorzystujemy OCR, dzięki czemu w ciągu godziny księgowa może zaksięgować aż 120 faktur a nie 60, jak to się średnio przyjmuje – mówi Jacek Bartnik, dyrektor zarządzający Ebi 24.

Niewątpliwie jest to duże ułatwienie. I coraz powszechniejsze. Po co tracić czas i męczyć oczy, jeśli żmudną pracę może wykonać za Ciebie dedykowany program…? Jednak czy wiesz, że początki OCR sięgają pierwszych lat XX wieku i nie były dedykowane pracownikom biurowym. Komu?

Początki dla niewidomych

W 1913 roku dr Edmund Fournier d’Albe z Birmingham University stworzył maszynę zwaną Optofonem. Miała ona pomagać osobom niewidomym i niedowidzącym. wiążą się z chęcią pomocy osobom niewidomym i niedowidzącym. Było to urządzenie w formie ręcznego skanera, które przesuwało się nad tekstem a algorytm miał za zadanie skonwertować litery na dźwięki. Dzięki temu, niewidoma osoba „słyszała” tekst.

W późnych latach 20. pojawiła się „maszyna statystyczna” wymyślona przez Emanuela Goldberga. Pozwalała ona archiwizować i przeszukiwać mikrofilmy. Patent został kupiony przez IBM.

Natomiast pierwsze urządzenie OCR pojawiło się w już w 1955 roku. Niestety było mocno niedoskonałe – maszyna potrafiła skanować jedynie ograniczoną ilość znaków. Nie dało się zatem przekonwertować całości tekstu.

Kolejne prace to znów powrót do pomocy osobom niewidomym. Ray Kurzweil w 1974 roku zaczął budować maszynę, która potrafiła odczytać wszystkie czcionki i wykorzystując syntezator mowy „przeczytać” tekst na głos. W 1978 zaczęła się produkcja komercyjnej wersji maszyny, umożliwiającej konwersję tekstu drukowanego na jego wersję cyfrową. Od tej pory, dzięki firmom takim jak Xerox czy Scansoft, OCR zaczęło się dynamicznie rozwijać.

Jako usługa dostępna w chmurze, OCR pojawiło się po raz pierwszy w 2000 roku. Teraz to udogodnienie jest niezastąpione w codziennej pracy księgowych. – Ręczne księgowanie faktur to był – i czasami jeszcze jest – proces skomplikowany i czasochłonny. Opisywanie dokumentów, wkładanie ich do koszulek i konkretnych segregatorów, potem ich wyszukiwanie… To wszystko trwa. A dzięki OCR skracamy cały ten proces o połowę. Wszystkie faktury księgowa ma w bezpiecznej chmurze i znacznie szybciej wprowadza je do systemu – dodaje Jacek Bartnik.

Czy wiesz, że…

Istnieje czcionka, która jest niemożliwa do rozpoznania przez OCR – to ZXX, którą stworzył były agent NSA – Sang Mun. Czcionka oparta jest o kilka „dodatków”:

  • poszczególne znaki mogą być np. zakamuflowane (czyli dodane są do nich różne nieregularne kształty, ale tak, że człowiek bez problemu może je odczytać, ale maszyna już nie),
  • fałszywe (w większy znak wpisany jest mniejszy – dla maszyny, taki mniejszy znak jest fałszywy, a to ten właśnie powinien być odczytany),
  • do czcionek dodane są szumy (czarne kwadraty które zaciemniają maszynie obraz czcionki),
  • na czcionkę nałożone są duże „iksy” – człowiek je odróżni, ale maszyna nie.

Po co taka czcionka? Po to, by umożliwić ochronę naszej prywatności i korespondencji.