Տեքստը ճանաչելը: Ազատ ծրագիր - անալոգային FineReader

Շուտով կամ ուշ, բոլոր նրանք, ովքեր հաճախ աշխատում են գրասենյակային ծրագրերով, տիպիկ խնդիր ունեն `փնտրել տեքստը գրքից, ամսագրից, թերթից, պարզապես թռուցիկներից եւ այնուհետեւ թարգմանել այդ նկարները տեքստային ձեւաչափով, օրինակ` Word- ի փաստաթղթում:

Դա անելու համար հարկավոր է սկաների եւ տեքստի ճանաչման հատուկ ծրագիր: Այս հոդվածում կքննարկվի FineReader- ի անվճար անալոգը `Սյունյացություն (FineReader- ում ճանաչման մասին - տես այս հոդվածը):

Սկսենք ...

Բովանդակությունը

  • 1. CuneiForm ծրագրի առանձնահատկությունները, առանձնահատկությունները
  • 2. Տեքստի ճանաչման օրինակ
  • 3. Փաթեթի տեքստի ճանաչում
  • 4. եզրակացություններ

1. CuneiForm ծրագրի առանձնահատկությունները, առանձնահատկությունները

Սյունյացություն

Դուք կարող եք ներբեռնել մշակողի կայքում, //cognitiveforms.com/:

Բաց կոդով տեքստի ճանաչման ծրագրակազմ: Բացի այդ, այն աշխատում է Windows- ի բոլոր տարբերակներում `XP, Vista, 7, 8, ինչը հաճելի է: Plus, լրացրեք ծրագրի ռուսերեն թարգմանությունը:

Մեջբերում:

- տեքստի ճանաչում աշխարհի ամենատարածված 20 լեզուներով (այդ թիվը ներառված է անգլերեն եւ ռուսերեն);

- հսկայական աջակցություն տարբեր տպագիր տառատեսակների համար;

- ստուգեք բառարանի ճանաչված տեքստը;

- աշխատանքի արդյունքը փրկելու կարողությունը մի քանի ձեւով.

- փաստաթղթի կառուցվածքի պահպանումը.

- Գերազանց աջակցություն եւ ճանաչման սեղաններ:

Դեմ `

- չի աջակցում չափազանց մեծ փաստաթղթեր եւ ֆայլեր (ավելի քան 400 dpi);

- չի աջակցում ուղղակիորեն որոշ տեսակի սկաներներ (լավ, դա սարսափելի չէ, հատուկ սկաների ընդգրկված է սկաների վարորդների հետ);

- դիզայնը չի փայլում (բայց ով է այն պահանջում, եթե ծրագիրը լիովին լուծի խնդիրը):

2. Տեքստի ճանաչման օրինակ

Մենք ենթադրում ենք, որ Դուք արդեն ստացել եք անհրաժեշտ նկարներ ճանաչելու համար (սկանավորվում է այնտեղ, կամ գիրքը ներբեռնված է ինտերնետում pdf / djvu ձեւաչափով եւ ստացվում է անհրաժեշտ նկարներ նրանցից: Ինչպես անել դա, տես այս հոդվածը):

1) Բացեք անհրաժեշտ պատկերը CuineForm ծրագրի մեջ (ֆայլ / բաց կամ «Cntrl + O»):

2) Սկսել ճանաչումը. Նախ պետք է ընտրեք տարբեր տարածքներ `տեքստ, նկար, սեղան եւ այլն: Քլայնե ծրագրում դա կարելի է անել ոչ միայն ձեռքով, այլ նաեւ ավտոմատ կերպով!! Դա անելու համար կտտացրեք պատուհանի վերին մասում գտնվող «ձեւավորման» կոճակը:

3) 10-15 վայրկյանից հետո: ծրագիրը ավտոմատ կերպով ընդգծում է տարբեր գույներով բոլոր տարածքները: Օրինակ, տեքստի տարածք ընդգծված է կապույտ: Ի դեպ, նա կարեւորեց բոլոր ոլորտները ճիշտ եւ բավական արագ: Ազնիվ, ես այդպիսի արագ եւ ճիշտ պատասխան չեմ ակնկալում ...

4) նրանց համար, ովքեր չեն վստահում ավտոմատ չափագրմանը, կարող եք օգտվել ձեռնարկից: Դրա համար կա գործիքի տուփ (տես ստորեւ նկարը), որի շնորհիվ կարող եք ընտրել տեքստը, սեղանը, նկարը: Տեղափոխել, մեծացնել / նվազեցնել նախնական պատկերը, կտրել եզրերը: Ընդհանուր առմամբ, լավ է:

5) Բոլոր տարածքները նշվելուց հետո կարող եք անցնել ճանաչումը. Դա անելու համար պարզապես սեղմեք նույն անվան կոճակին, ինչպես ստորեւ նկարում:

6) բառացիորեն 10-20 վայրկյան: Microsoft Word- ում դուք կտեսնեք փաստաթուղթ `ճանաչված տեքստով: Ինչ հետաքրքիր է, այս օրինակի տեքստում, իհարկե, սխալներ կան, բայց նրանցից շատերը քիչ են: Հատկապես, հաշվի առնելով, թե որքան պարզ է բնօրինակը նյութը, նկարը:

Արագություն եւ որակ բավականին համեմատելի է FineReader- ի հետ:

3. Փաթեթի տեքստի ճանաչում

Ծրագրի այս գործառույթը կարող է օգտակար լինել, երբ դուք պետք է ճանաչեք ոչ թե մեկ պատկեր, այլ միանգամից մի քանիսը: Փաթեթի ճանաչման գործարկման դյուրանցումը սովորաբար թաքնվում է մեկնարկային ցանկում:

1) Ծրագիրը բացելուց հետո դուք պետք է ստեղծեք նոր փաթեթ, կամ բացեք նախապես պահպանված մեկը: Մեր օրինակում `ստեղծել նորը:

2) հաջորդ քայլում մենք անուն ենք տալիս, նախընտրելի է, որ վեց ամիս անց մենք հիշենք, թե ինչ է պահվում դրա մեջ:

3) Հաջորդը, ընտրեք փաստաթղթի լեզուն (ռուսերեն-անգլերեն), նշեք, թե արդյոք ձեր սկանավոր նյութում կան նկարներ եւ աղյուսակներ:

4) Այժմ դուք պետք է նշեք թղթապանակը, որտեղ ճանաչման ֆայլերը գտնվում են: Ի դեպ, հետաքրքիրն այն է, որ ծրագիրը ինքնին կգտնի բոլոր նկարները եւ այլ գրաֆիկական ֆայլերը, որոնք կարող են ճանաչել եւ ավելացնել դրանք: Դուք նաեւ պետք է հեռացնեք լրացուցիչը:

5) Հաջորդ քայլը կարեւոր չէ, ընտրեք ինչ սկզբունքային ֆայլերի հետ, ճանաչելուց հետո: Ես խորհուրդ եմ տալիս ընտրել «ոչինչ անել» վանդակը:

6) մնում է միայն ընտրել այն ձեւաչափը, որտեղ ճանաչված փաստաթուղթը կփրկվի: Կան մի քանի տարբերակներ.

- rtf - բառի փաստաթղթից ֆայլը բացվում է բոլոր հայտնի գրասենյակների կողմից (ներառյալ անվճար, ծրագրերի հղումը);

- txt - տեքստի ձեւաչափը, դուք կարող եք միայն տեքստեր, նկարներ եւ սեղաններ պահպանել:

- htm - Հիպերտեքստի էջ, հարմար, եթե դուք փնտրեք եւ ճանաչեք ֆայլերը կայքի համար: Նրա եւ ընտրենք մեր օրինակում:

7) «Վերջ» կոճակը սեղմելուց հետո սկսեք ձեր նախագծի մշակումը:

8) ծրագիրը շատ արագ աշխատում է: Ճանաչելուց հետո դուք կտեսնեք htm ֆայլերով ներդիր: Եթե ​​դուք սեղմում եք նման ֆայլը, զննարկիչը սկսում է այնտեղ, որտեղ կարող եք տեսնել արդյունքները: Ի դեպ, փաթեթը կարող է փրկվել հետագա աշխատանքի համար:

9) Ինչպես տեսնում եք արդյունքները աշխատանքը շատ տպավորիչ է: Ծրագիրը հեշտությամբ ճանաչեց նկարը եւ հեշտությամբ ճանաչեց տեքստը: Մինչ ծրագիրը անվճար է, այն ընդհանուր առմամբ գերազանց է:

4. եզրակացություններ

Եթե ​​հաճախ չեք ստուգում եւ ճանաչում փաստաթղթերը, ապա FineReader- ի գնումը հավանաբար իմաստ չունի: CuneiForm- ը հեշտացնում է բազմաթիվ խնդիրներ:

Մյուս կողմից, նա նաեւ ունի թերություններ:

Նախ, շատ քիչ գործիքներ կան, որոնք խմբագրում են եւ արդյունքների ստուգում: Երկրորդ, երբ դուք պետք է ճանաչեք շատ նկարներ, ապա FineReader- ում ավելի հարմար է անմիջապես տեսնել ամեն ինչ, նախագծին ավելացված աջին սյունակում `արագ անջատել ավելորդ, վերամշակել եւ այլն: Եվ երրորդ, CuneiForm- ը կորցնում է ճանաչումը. դուք պետք է փաստաթուղթը վերցնեք `ճիշտ սխալները, կետադրական նշաններ, մեջբերումներ եւ այլն:

Դա բոլորն են: Գիտեք որեւէ այլ պատշաճ անվճար տեքստի ճանաչման ծրագրակազմ: