Digitalizační linka s vytěžováním dat

  • Zadavatel: Komerční pojišťovna a.s.

Digitalizační linka se nachází na pracovišti v KPKB Jihlava. Zde probíhá kompletní proces digitalizace, tj. třídění dokumentů podle typu zpracování, naskenování, OCR, případná následná korekce hodnot a export naskenovaných imagů. Papírové originály dokumentů jsou následně uchovávány v archivačních boxech. Použitý software je Teleform verze 11.2 (od 9.6.2017). Celý proces digitalizace je zajišťován v Teleformu.

Produkční linka má vlastní virtuální server, kde zároveň běží i databáze (MSSQL Express). Na vytěžování pro modul Reader je vyhrazena vlastní fyzická stanice.

Pro testování je vyhrazena jedna stanice s vlastním skenerem a desktopovou instalací Teleformu. Na stanici je zajištěn vzdálený přístup přes RDP.

Zpracování je rozděleno do několika typů úloh podle obsahu zpracovávaného formuláře. Skenuje se po menších dávkách, obsahující zpravidla formuláře vztahující se pouze k jedné smlouvě nebo pojištěnci, často se tak dokumenty skenují pouze po jednom. Některé údaje o skenovaných dokumentech, jako číslo smlouvy, datum přijetí dokumentu, typ, workflow nebo číslo archivační krabice se zadávají již před skenováním. Úlohy, které mají definovanou více, než jednu šablonu mají nastavené QC pro případnou ruční identifikaci.

Po OCR procesu probíhá na formulářích korekce vytěžených dat. Formuláře, u kterých se vytěžuje pouze číslo smlouvy, se v případě kdy je vytěžené číslo shodné s tím zadaným při skenování, nevytěžují.

Export dat je ve formátu xml, popřípadě xls pro data formulářů a tif pro naskenované obrazy. Barevná hloubka výstupních obrazů je závislá na nastavení skenovacího profilu.