Շուտով կամ ուշ, բոլոր նրանք, ովքեր հաճախ աշխատում են գրասենյակային ծրագրերով, տիպիկ խնդիր ունեն `փնտրել տեքստը գրքից, ամսագրից, թերթից, պարզապես թռուցիկներից եւ այնուհետեւ թարգմանել այդ նկարները տեքստային ձեւաչափով, օրինակ` Word- ի փաստաթղթում:
Դա անելու համար հարկավոր է սկաների եւ տեքստի ճանաչման հատուկ ծրագիր: Այս հոդվածում կքննարկվի FineReader- ի անվճար անալոգը `Սյունյացություն (FineReader- ում ճանաչման մասին - տես այս հոդվածը):
Սկսենք ...
Բովանդակությունը
- 1. CuneiForm ծրագրի առանձնահատկությունները, առանձնահատկությունները
- 2. Տեքստի ճանաչման օրինակ
- 3. Փաթեթի տեքստի ճանաչում
- 4. եզրակացություններ
1. CuneiForm ծրագրի առանձնահատկությունները, առանձնահատկությունները
Սյունյացություն
Դուք կարող եք ներբեռնել մշակողի կայքում, //cognitiveforms.com/:
Բաց կոդով տեքստի ճանաչման ծրագրակազմ: Բացի այդ, այն աշխատում է Windows- ի բոլոր տարբերակներում `XP, Vista, 7, 8, ինչը հաճելի է: Plus, լրացրեք ծրագրի ռուսերեն թարգմանությունը:
Մեջբերում:
- տեքստի ճանաչում աշխարհի ամենատարածված 20 լեզուներով (այդ թիվը ներառված է անգլերեն եւ ռուսերեն);
- հսկայական աջակցություն տարբեր տպագիր տառատեսակների համար;
- ստուգեք բառարանի ճանաչված տեքստը;
- աշխատանքի արդյունքը փրկելու կարողությունը մի քանի ձեւով.
- փաստաթղթի կառուցվածքի պահպանումը.
- Գերազանց աջակցություն եւ ճանաչման սեղաններ:
Դեմ `
- չի աջակցում չափազանց մեծ փաստաթղթեր եւ ֆայլեր (ավելի քան 400 dpi);
- չի աջակցում ուղղակիորեն որոշ տեսակի սկաներներ (լավ, դա սարսափելի չէ, հատուկ սկաների ընդգրկված է սկաների վարորդների հետ);
- դիզայնը չի փայլում (բայց ով է այն պահանջում, եթե ծրագիրը լիովին լուծի խնդիրը):
2. Տեքստի ճանաչման օրինակ
Մենք ենթադրում ենք, որ Դուք արդեն ստացել եք անհրաժեշտ նկարներ ճանաչելու համար (սկանավորվում է այնտեղ, կամ գիրքը ներբեռնված է ինտերնետում pdf / djvu ձեւաչափով եւ ստացվում է անհրաժեշտ նկարներ նրանցից: Ինչպես անել դա, տես այս հոդվածը):
1) Բացեք անհրաժեշտ պատկերը CuineForm ծրագրի մեջ (ֆայլ / բաց կամ «Cntrl + O»):
2) Սկսել ճանաչումը. Նախ պետք է ընտրեք տարբեր տարածքներ `տեքստ, նկար, սեղան եւ այլն: Քլայնե ծրագրում դա կարելի է անել ոչ միայն ձեռքով, այլ նաեւ ավտոմատ կերպով!! Դա անելու համար կտտացրեք պատուհանի վերին մասում գտնվող «ձեւավորման» կոճակը:
3) 10-15 վայրկյանից հետո: ծրագիրը ավտոմատ կերպով ընդգծում է տարբեր գույներով բոլոր տարածքները: Օրինակ, տեքստի տարածք ընդգծված է կապույտ: Ի դեպ, նա կարեւորեց բոլոր ոլորտները ճիշտ եւ բավական արագ: Ազնիվ, ես այդպիսի արագ եւ ճիշտ պատասխան չեմ ակնկալում ...
4) նրանց համար, ովքեր չեն վստահում ավտոմատ չափագրմանը, կարող եք օգտվել ձեռնարկից: Դրա համար կա գործիքի տուփ (տես ստորեւ նկարը), որի շնորհիվ կարող եք ընտրել տեքստը, սեղանը, նկարը: Տեղափոխել, մեծացնել / նվազեցնել նախնական պատկերը, կտրել եզրերը: Ընդհանուր առմամբ, լավ է:
5) Բոլոր տարածքները նշվելուց հետո կարող եք անցնել ճանաչումը. Դա անելու համար պարզապես սեղմեք նույն անվան կոճակին, ինչպես ստորեւ նկարում:
6) բառացիորեն 10-20 վայրկյան: Microsoft Word- ում դուք կտեսնեք փաստաթուղթ `ճանաչված տեքստով: Ինչ հետաքրքիր է, այս օրինակի տեքստում, իհարկե, սխալներ կան, բայց նրանցից շատերը քիչ են: Հատկապես, հաշվի առնելով, թե որքան պարզ է բնօրինակը նյութը, նկարը:
Արագություն եւ որակ բավականին համեմատելի է FineReader- ի հետ:
3. Փաթեթի տեքստի ճանաչում
Ծրագրի այս գործառույթը կարող է օգտակար լինել, երբ դուք պետք է ճանաչեք ոչ թե մեկ պատկեր, այլ միանգամից մի քանիսը: Փաթեթի ճանաչման գործարկման դյուրանցումը սովորաբար թաքնվում է մեկնարկային ցանկում:
1) Ծրագիրը բացելուց հետո դուք պետք է ստեղծեք նոր փաթեթ, կամ բացեք նախապես պահպանված մեկը: Մեր օրինակում `ստեղծել նորը:
2) հաջորդ քայլում մենք անուն ենք տալիս, նախընտրելի է, որ վեց ամիս անց մենք հիշենք, թե ինչ է պահվում դրա մեջ:
3) Հաջորդը, ընտրեք փաստաթղթի լեզուն (ռուսերեն-անգլերեն), նշեք, թե արդյոք ձեր սկանավոր նյութում կան նկարներ եւ աղյուսակներ:
4) Այժմ դուք պետք է նշեք թղթապանակը, որտեղ ճանաչման ֆայլերը գտնվում են: Ի դեպ, հետաքրքիրն այն է, որ ծրագիրը ինքնին կգտնի բոլոր նկարները եւ այլ գրաֆիկական ֆայլերը, որոնք կարող են ճանաչել եւ ավելացնել դրանք: Դուք նաեւ պետք է հեռացնեք լրացուցիչը:
5) Հաջորդ քայլը կարեւոր չէ, ընտրեք ինչ սկզբունքային ֆայլերի հետ, ճանաչելուց հետո: Ես խորհուրդ եմ տալիս ընտրել «ոչինչ անել» վանդակը:
6) մնում է միայն ընտրել այն ձեւաչափը, որտեղ ճանաչված փաստաթուղթը կփրկվի: Կան մի քանի տարբերակներ.
- rtf - բառի փաստաթղթից ֆայլը բացվում է բոլոր հայտնի գրասենյակների կողմից (ներառյալ անվճար, ծրագրերի հղումը);
- txt - տեքստի ձեւաչափը, դուք կարող եք միայն տեքստեր, նկարներ եւ սեղաններ պահպանել:
- htm - Հիպերտեքստի էջ, հարմար, եթե դուք փնտրեք եւ ճանաչեք ֆայլերը կայքի համար: Նրա եւ ընտրենք մեր օրինակում:
7) «Վերջ» կոճակը սեղմելուց հետո սկսեք ձեր նախագծի մշակումը:
8) ծրագիրը շատ արագ աշխատում է: Ճանաչելուց հետո դուք կտեսնեք htm ֆայլերով ներդիր: Եթե դուք սեղմում եք նման ֆայլը, զննարկիչը սկսում է այնտեղ, որտեղ կարող եք տեսնել արդյունքները: Ի դեպ, փաթեթը կարող է փրկվել հետագա աշխատանքի համար:
9) Ինչպես տեսնում եք արդյունքները աշխատանքը շատ տպավորիչ է: Ծրագիրը հեշտությամբ ճանաչեց նկարը եւ հեշտությամբ ճանաչեց տեքստը: Մինչ ծրագիրը անվճար է, այն ընդհանուր առմամբ գերազանց է:
4. եզրակացություններ
Եթե հաճախ չեք ստուգում եւ ճանաչում փաստաթղթերը, ապա FineReader- ի գնումը հավանաբար իմաստ չունի: CuneiForm- ը հեշտացնում է բազմաթիվ խնդիրներ:
Մյուս կողմից, նա նաեւ ունի թերություններ:
Նախ, շատ քիչ գործիքներ կան, որոնք խմբագրում են եւ արդյունքների ստուգում: Երկրորդ, երբ դուք պետք է ճանաչեք շատ նկարներ, ապա FineReader- ում ավելի հարմար է անմիջապես տեսնել ամեն ինչ, նախագծին ավելացված աջին սյունակում `արագ անջատել ավելորդ, վերամշակել եւ այլն: Եվ երրորդ, CuneiForm- ը կորցնում է ճանաչումը. դուք պետք է փաստաթուղթը վերցնեք `ճիշտ սխալները, կետադրական նշաններ, մեջբերումներ եւ այլն:
Դա բոլորն են: Գիտեք որեւէ այլ պատշաճ անվճար տեքստի ճանաչման ծրագրակազմ: