Տեքստի ճանաչման ծրագրակազմ

Որպես կանոն, երբ խոսքը վերաբերում է սկանավորվող տեքստի ճանաչման ծրագրերին (OCR, օպտիկական նկարագրության ճանաչում), շատ օգտվողները հիշում են միակ արտադրանքը `ABBYY FineReader- ը, որը, անկասկած, առաջատարն է այս ծրագրաշարի մեջ եւ աշխարհում առաջատարներից մեկը:

Այնուամենայնիվ, FineReader- ը այս տեսակի միակ լուծումը չէ, կա տեքստի ճանաչման անվճար ծրագրեր, նույն նպատակներով առցանց ծառայությունները, եւ ավելին, այդպիսի գործառույթները ներկա են նաեւ որոշակի ծանոթ ծրագրերում, որոնք արդեն տեղադրված են ձեր համակարգչի վրա . Ես կփորձեմ գրել այս ամենի մասին այս հոդվածում: Բոլոր դիտարկվող ծրագրերը աշխատում են Windows 7, 8 եւ XP- ում:

Տեքստի ճանաչման լիդեր `ABBYY Finereader

FineReader- ի մասին (ինչպես հայտնի է որպես Fine Reader) լսեց, հավանաբար, ձեզանից շատերը: Այս ծրագիրը լավագույնն է կամ ռուսերեն լեզվով որակյալ տեքստի ճանաչման լավագույններից մեկը: Ծրագիրը վճարվում է եւ տնային օգտագործման համար լիցենզիայի գինը մի փոքր պակաս է, քան 2000 ռուբլի: Հնարավոր է նաեւ ներբեռնել FineReader- ի դատավարական տարբերակը կամ օգտագործել ABBYY Fine Reader Online- ի առցանց տեքստի ճանաչումը (դուք կարող եք անվճար մի քանի էջեր ճանաչել, ապա վճարել): Այս ամենը հասանելի է պաշտոնական կայքէջում //www.abbyy.ru:

FineReader- ի դատավարական տարբերակը տեղադրելու որեւէ խնդիր չի առաջացրել: Ծրագիրը կարող է ինտեգրվել Microsoft Office- ի եւ Windows Explorer- ի հետ, որպեսզի ավելի հեշտ դարձնի ճանաչումը: Ազատ դատավարության տարբերակների սահմանափակումներից `15 օրվա օգտագործման եւ ավելի քան 50 էջի ճանաչման հնարավորություն:

Փորձարկման ճանաչման ծրագրերի փորձարկում

Քանի որ ես չունեմ սկաների, ես նկարահանում եմ վատ որակի խցիկի հեռախոսից, որտեղ ես մի փոքր խմբագրում էի հակադրությունը, ստուգելու համար: Որակը լավ չէ, եկեք տեսնենք, թե ով կարող է դա անել:

Մենյու FineReader

FineReader- ը կարող է տեքստի գրաֆիկական պատկերը ստանալ անմիջապես սկաների կողմից, գրաֆիկական ֆայլերից կամ տեսախցիկից: Իմ դեպքում, բավական էր բացել պատկերի ֆայլը: Ես գոհ եմ արդյունքից `ընդամենը մի քանի սխալներից: Անմիջապես կասեմ, որ սա բոլոր փորձարկված ծրագրերի լավագույն արդյունքն է, երբ այս նմուշի հետ աշխատելը, նման ճանաչման որակը միայն Free Online OCR- ի վրա է (բայց այս վերանայում մենք խոսում ենք միայն ծրագրային ապահովման մասին, այլ ոչ թե առցանց ճանաչում):

FineReader- ում տեքստի ճանաչման արդյունքը

Անկեղծ ասած, FineReader- ը, հավանաբար, չունի կիրիլյան տեքստերի համար մրցակիցներ: Ծրագրի առավելություններն այն են, որ ոչ միայն տեքստի ճանաչման որակը, այլեւ լայն ֆունկցիոնալությունը, ֆորմատավորումն աջակցելը, բազմաթիվ ձեւաչափերով իրավասու արտահանումը, ներառյալ Word docx, pdf եւ այլ հատկանիշներ: Այսպիսով, եթե OCR- ի խնդիրն այն է, որ դուք անընդհատ բախվում եք, ապա զղջացեք համեմատաբար փոքր գումար, եւ այն կվճարի, դուք կստանաք հսկայական ժամանակ, արագ կերպով ստանալով որակյալ արդյունք FineReader- ում: Ի դեպ, ես ոչինչ չեմ գովազդում, իսկապես, կարծում եմ, որ նրանք, ովքեր պետք է ճանաչեն ավելի քան մեկ տասնյակից ավելի էջեր, պետք է մտածեն նման ծրագրաշարի գնումի մասին:

CuneiForm- ը անվճար տեքստի ճանաչման ծրագիր է:

Իմ գնահատմամբ, Ռուսաստանում ամենատարածված OCR ծրագիրը երկրորդն է անվճար CuneiForm- ը, որը կարելի է ներբեռնել //cognitiveforms.ru/products/cuneiform/ պաշտոնական կայքում:

Ծրագրի տեղադրումը նույնպես շատ պարզ է, այն չի փորձում տեղադրել որեւէ երրորդ կողմի ծրագրակազմ (նման շատ ազատ ծրագրային ապահովում): Ինտերֆեյսը հակիրճ եւ հստակ է: Որոշ դեպքերում, ամենից հեշտ է օգտագործել մոգը, որը մենյունում պատկերողներից առաջինն է:

Նմուշով, որ ես օգտագործել եմ FineReader- ում, ծրագիրը չի հաղթահարել, կամ, ավելի ճիշտ, ինչ-որ բան վատ է ընթերցել եւ բառերի բեկորներ: Երկրորդ փորձը կատարվել է հենց այս ծրագրի տեղում գտնվող տեքստի բուն էկրանին, որը, այնուամենայնիվ, պետք է ավելացվի (այն պետք է սքրինինգներ ունենալ 200dpi եւ ավելի բարձր բանաձեւով, այն չի կարդում screenshots 1-2 տառաչափի տողերի լայնությամբ): Այստեղ նա լավ գործեց (որոշ տեքստը չի ճանաչվել, քանի որ միայն ռուսերենն էր ընտրված):

CuneiForm տեքստի ճանաչում

Այսպիսով, մենք կարող ենք ենթադրել, որ CuneiForm- ը մի բան է, որը դուք պետք է փորձեք, հատկապես, եթե դուք ունեք բարձրորակ սկանավոր էջեր եւ ցանկանում եք դրանք ճանաչել անվճար:

Microsoft OneNote- ծրագիր, որը դուք արդեն կարող եք ունենալ

Microsoft Office- ում, սկսած 2007-ի տարբերակով եւ ավարտելով ընթացիկ, 2013-ը, կա մի ծրագիր `OneNote- ի համար գրելու համար: Այն նաեւ ունի տեքստի ճանաչման առանձնահատկություններ: Այն օգտագործելիս պարզապես գրեք սկանավորված կամ որեւէ այլ տեքստային պատկեր, նշում, սեղմեք աջը եւ օգտագործեք համատեքստային ցանկը: Ես նշում եմ, որ ճանաչման համար նախատեսված կանխադրվածը սահմանվում է անգլերեն:

Ճանաչումը Microsoft OneNote- ում

Չեմ կարող ասել, որ տեքստը լավ ճանաչված է, բայց որքան կարող եմ ասել, դա մի փոքր ավելի լավ է, քան CuneiForm- ում: Plus ծրագիրը, ինչպես արդեն նշվեց, այն է, որ զգալի հավանականությամբ այն արդեն տեղադրվել է ձեր համակարգչում: Թեեւ, իհարկե, դրա օգտագործումը, անհրաժեշտության դեպքում, մեծ թվով սկանավորված փաստաթղթերի հետ աշխատելու անհրաժեշտության դեպքում դժվար է հարմար լինել, այլապես հարմար է այցեքարտերի արագ ճանաչման համար:

OmniPage Ultimate, OmniPage 18-ը պետք է լինի շատ թույն

Ես չգիտեմ, թե որքան լավ է OmniPage- ի տեքստի ճանաչման ծրագիրը: Չկա դատավարական տարբերակ, ես չեմ ուզում բեռնել որեւէ տեղ: Սակայն, եթե դրա գինը արդարացված է, եւ դրա արժեքը կկազմի մոտ 5000 ռուբլի `անհատական ​​օգտագործման համար եւ ոչ թե« Ultimate », ապա դա պետք է լինի տպավորիչ: Ծրագրի էջը. //Www.nuance.com/for-individuals/by-product/omnipage/index.htm

OmniPage- ի ծրագրային գինը

Եթե ​​դուք կարդում եք բնութագրերը եւ վերանայումները, այդ թվում ռուսալեզու գրականության մեջ, նշում են, որ OmniPage- ն իսկապես ապահովում է բարձրորակ եւ ճշգրիտ ճանաչում, այդ թվում `ռուսերեն, համեմատաբար հեշտ է ոչնչացնել ոչ թե ամենաբարձր որակը, այնպես էլ մի շարք լրացուցիչ գործիքներ: Դժվարությունների մեջ դա առավել հարմար չէ, հատկապես նորարարական օգտագործողի, ինտերֆեյսի համար: Այնուամենայնիվ, արեւմտյան շուկայում OmniPage- ը FineReader- ի անմիջական մրցակիցն է եւ անգլերեն լեզվով վարկանիշները, որոնք նրանք պայքարում են հենց իրենց մեջ, եւ, հետեւաբար, կարծում եմ, ծրագիրը պետք է արժանի լինի:

Սա ոչ բոլոր ծրագրերն են այս տեսակի մեջ, կան նաեւ տարբեր ծրագրեր փոքրիկ անվճար ծրագրերի համար, բայց նրանց հետ փորձարկելիս ես հայտնաբերեցի երկու հիմնական թերություններ `դրանցում տեղ գտած կուրիլական աջակցության պակասը կամ տարբեր, ոչ շատ օգտակար ծրագրեր տեղադրելու համար, եւ, հետեւաբար, որոշեցինք այստեղ