Jak technika OCR wspiera inteligentne zarządzanie dokumentacją?

[:pl]naklejki-2[:]
Blog

Jak technika OCR wspiera inteligentne zarządzanie dokumentacją?

Niegasnące zainteresowanie sztuczną inteligencją sprawia, że jej potencjał jest coraz mocniej eksploatowany, a usprawnianie funkcjonowania przedsiębiorstw przez programy i systemy symulujące modele zachowań inteligentnych stało się powszechne. Dążąc do optymalizacji zarówno procesów, jak i wykorzystania zasobów, firmy prześcigają się w innowacyjnych pomysłach na wykorzystanie dorobku z dziedziny sztucznej inteligencji otwierając tym samym drzwi kolejnym przełomom technologicznym.

Automatyczna interpretacja danych 

Jedną z szeroko wykorzystywanych technik jest optyczne rozpoznawanie znaków (ang. Optical Character Recognition – OCR), czyli proces polegający na wyodrębnieniu tekstu, tabel oraz innych elementów obrazu strony z jego elektronicznej ilustracji. Obraz strony powstaje zazwyczaj w wyniku zeskanowania papierowego dokumentu lub otwarcia elektronicznego obrazu i jest nieedytowalnym dokumentem tworzącym obraz tekstu za pomocą dużej liczby pikseli. Technika OCR pozwala na analizę tego obrazu oraz utworzenie na jego podstawie edytowalnego dokumentu tekstowego, co jest możliwe dzięki wykorzystaniu metod z dziedziny rozpoznawania wzorców, czyli podejmowania czynności na podstawie pobranych danych surowych oraz kategorii, do której te dane należą, np. progowania. Ta część operacji OCR nazywana jest także cyfryzacją czyli zamianą analogowej postaci obrazu na postać cyfrową, nadającą się do dalszego działania z dokumentem.

Drugim etapem jest interpretacja odczytanego teksu zmierzająca do ustalenia czy jest on stroną książki fabularnej, fakturą zakupową czy umową o współpracy. Uczenie maszynowe pozwala na zidentyfikowaniu szeregu cech odczytanego tekstu, które to cechy pozwalają na ustalenie z wysokim prawdopodobieństwem z jakim typem dokumentu mamy do czynienia. Etap ten nazywany jest kwalifikacją dokumentu.

Ostatni, najtrudniejszy etap to ustalenie najważniejszych atrybutów odczytanego dokumentu np. autora książki, nadawcę korespondencji, numeru faktury itd. Ilość i rodzaj atrybutów zależy od rodzaju rozpoznanego dokumentu. Każdy atrybut posiada szereg cech pozwalających na jego wyodrębnienie z dokumentu takich jak położenie na dokumencie, dziedzina wartości, format (np. data) i wiele innych cech, których algorytmy inteligentne poszukują w celu zbudowania informacji o zawartości dokumentu.

Tak odczytany, zakwalifikowany i opisany dokument może być kierowany do organizacji w elektronicznym obiegu, który jest automatycznie wyzwalany dla każdego nowego dokumentu.

 

Inteligentny system obiegu dokumentów

Popularyzacja techniki OCR pozwala na jej coraz szersze zastosowanie w systemach usprawniających funkcjonowanie przedsiębiorstw, między innymi w obszarze zarządzania dokumentacją. Jej wykorzystanie w modułach oferowanego przez DahliaMatic systemu Elektronicznego Obiegu Dokumentów pozwala na:

  • automatyzację wprowadzania dokumentów, w tym także w ilościach setek i tysięcy dziennie
  • redukcję liczby błędów ludzkich związanych z wprowadzaniem dokumentów
  • automatyzację procesów skanowania, znakowania, ewidencji dokumentów
  • ułatwienie przeszukiwania archiwum dokumentów
  • przyśpieszenie obiegu dokumentów
  • zwiększenie wydajności pracowników odpowiedzialnych za obsługę dokumentacji

System EOD umożliwia wykorzystanie modułu OCR podczas wprowadzania dokumentów w dwojaki sposób. Możliwe jest zarówno skanowanie i próba rozpoznania całego dokumentu, jak i skanowanie oraz rozpoznanie jego określonych części i ich automatyczne wprowadzenie we właściwe pola opisujące ten dokument.

Korzyści z kompleksowego rozwiązania

Wykorzystanie modułu OCR to fundament funkcjonowania systemu EOD jako w pełni zautomatyzowanego rozwiązania informatycznego odpowiadającego na rosnące potrzeby Klientów. Rejestracja danych przy pomocy techniki optycznego rozpoznawania znaków jest pierwszym krokiem w procesowaniu dokumentów (kancelarie, biura podawcze, księgowość, biura prawne itd.).

Dzięki pozostałym możliwościom systemu EOD związanymi z elektroniczną dystrybucją, opisywaniem dokumentów, procesami akceptacyjnymi może być w pełni zintegrowanym i zautomatyzowanym procesem przynoszącym szereg korzyści dla funkcjonowania organizacji.

 

Więcej informacji o systemie EOD znajdziesz tutaj.