recunoașterea
Salutări tuturor cititorilor blogului!

Cred că cei care lucrează des la computer (nu se joacă, adică lucrează) au fost nevoiți să facă față recunoașterii textului. Ei bine, de exemplu, ați scanat un fragment dintr-o carte și acum trebuie să introduceți această parte într-un document. Dar documentul scanat este o imagine și avem nevoie de text - pentru aceasta avem nevoie de programe speciale și servicii online pentru recunoașterea textului din imagini.

Am scris deja despre programele de recunoaștere în postările anterioare:

– scanarea și recunoașterea textului în FineReader (program plătit);

- lucrați în analogul FineReader - CuneiForm (program gratuit).

În același articol, aș dori să mă concentrez pe serviciile online pentru recunoașterea textului. La urma urmei, dacă trebuie să obțineți rapid text din 1-2 imagini - nu are rost să vă deranjați cu instalarea diferitelor programe...

Important!Calitatea recunoașterii (numărul de erori, lizibilitatea etc.) depinde foarte mult de calitatea originală a imaginii. Prin urmare, atunci când scanați (fotografiați, etc.), alegeți cea mai înaltă calitate posibilă. În majoritatea cazurilor, o calitate de 300-400 dpi va fi suficientă (dpi este un parametru care caracterizează calitatea imaginii. În setările aproape tuturor scanerelor, acest parametru este de obicei specificat).

Servicii online

Pentru a arăta cum funcționează serviciile, am făcut o captură de ecran a unuia dintre articolele mele. Această captură de ecran va fi încărcată în toate serviciile, a căror descriere este dată mai jos.

1)http://www.ocrconvert.com/

online

Îmi place foarte mult acest serviciu pentru simplitatea lui. Deși site-ul este în engleză, funcționează bine cu limba rusă. Nu trebuie să vă înregistrați. Pentru a începe recunoașterea, trebuie să faceți 3 acțiuni:

– încărcați-vă imaginea;

- selectați limba textului, care este activatăpoze;

- apăsați butonul de pornire a recunoașterii.

Suport format: PDF, GIF, BMP, JPEG.

Rezultatul este prezentat mai jos în imagine. Trebuie să spun că textul a fost recunoscut destul de bine. În plus, foarte repede - am așteptat literalmente 5-10 secunde.

2)http://www.i2ocr.com/

Acest serviciu funcționează similar cu cel de mai sus. De asemenea, aici trebuie să descărcați fișierul, să selectați limba de recunoaștere și să faceți clic pe butonul de extragere a textului. Serviciul funcționează foarte repede: 5-6 secunde. pe o singură pagină.

Suporta formate: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Rezultatul acestui serviciu online este mult mai convenabil: vedeți imediat două ferestre - prima arată rezultatul recunoașterii, a doua - imaginea originală. Prin urmare, este destul de ușor să faceți corecții în timpul procesului de editare. Apropo, nici nu trebuie să vă înregistrați la serviciu.

3)http://www.newocr.com/

Acest serviciu este unic din mai multe puncte de vedere. În primul rând, acceptă formatul DJVU „la modă nouă” (apropo, o listă completă de formate: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). În al doilea rând, acceptă selecția zonelor de text din imagine. Acest lucru este foarte util atunci când aveți nu numai zone de text în imagine, ci și zone grafice care nu trebuie să fie recunoscute.

Calitatea recunoașterii este peste medie, nu este necesară înregistrarea.

4)http://www.free-ocr.com/

Un serviciu foarte simplu de recunoaștere: încărcați o imagine, specificați limba, introduceți un captcha (apropo, singurul serviciu din acest articol în care trebuie să faceți acest lucru) și apăsați butonul pentru a traduce imaginea în text. De fapt, totul!

Formate acceptate: PDF, JPG, GIF, TIFF, BMP.

Rezultatul recunoașterii este mediu. sunt greselidar nu sunt mulți dintre ei. Cu toate acestea, dacă calitatea capturii originale de ecran ar fi mai mare, ar exista un ordin de mărime mai puține erori.

PS

Asta e tot azi. Dacă cunoașteți și alte servicii interesante pentru recunoașterea textului, împărtășiți-le în comentarii, vă voi fi recunoscător. O condiție: este de dorit să nu fie necesară înregistrarea și serviciul să fie gratuit.

Toate bune!