Optik karakter tanımanın kısaltması olan OCR, basılı, yazılı veya yazılmış karakterleri dijital formata dönüştürmek için kullanılan teknolojiyi ifade eder. İşlem, metnin bir bilgisayar tarafından okunmasına izin vererek karakterlerin düzenlenip aranabilmesini sağlar. Bu teknoloji yalnızca veri girişinde devrim yaratmadı, aynı zamanda kör ve görme engelliler için yararlı bir araçtır.
OCR nasıl çalışır?
Bir belgeyi taramak ve karakterlere ayırmak için optik bir tarayıcı kullandıktan sonra, OCR teknolojisi, karakterleri dijital biçime dönüştürmeye ve özellik algılamaya iki farklı yaklaşıma sahiptir.
Matris eşleştirme ve örüntü eşleştirme olarak da bilinen örüntü tanıma, taradığı bir karakteri programın dosyasında bulunan karakter görüntüleri birikimiyle karşılaştırarak çalışır. Bu yalnızca karakterler, OCR'nin referans olarak kullandığı karakterlerle tam bir piksel eşleştiğinde çalışır. 1960'larda, OCR-A yazı tipi, bankanın OCR programları için yazı tipini standartlaştırmak amacıyla çeklere yazdırılmak üzere oluşturuldu. Sonunda, desen tanıma, Arial ve Times New Roman gibi birden çok yaygın yazı tipini tanımaya genişledi, ancak program hala yalnızca belirli birkaç yazı tipinde bulunan karakterleri dönüştürmekle sınırlıydı.
Özellik çıkarma olarak da adlandırılan özellik algılama, OCR'nin hemen hemen her yazı tipindeki karakterleri okumasına izin verir. Bir karakterin tam kopyasını aramak yerine, özellik algılama, yazı tipi ne olursa olsun bir karakterin sahip olacağı belirli özellikleri ayırt ederek çalışır. Örneğin, program bir nokta oluşturmak için üstte birleşen iki eğimli çizgiye sahip bir karakteri tararsa, harfin büyük A olduğunu söyleyebilir.Özellik algılama, OCR programlarının kullanımlarını ve yeteneklerini genişletir ve en çok bugün kullanılan yaygın OCR türü.
OCR, basılı metni dönüştürmekle sınırlı olsa da, akıllı karakter tanıma (ICR) el yazısını bilgisayar tarafından okunabilen, aranabilen veya düzenlenebilen metne dönüştürebilir. OCR ile aynı ailede olmasına rağmen, ICR çok daha zor bir süreçtir çünkü el yazısı yazı tiplerinden daha geniş çeşitliliktedir.
OCR için kullanır
- Veri girişi
- Kör ve görme engelli kişilere yardım edin
- Kitapları dijitalleştirin
- Posta sıralama
- PDF'leri, kitapları ve fiziksel belgeleri aranabilir hale getirin
- Plaka tanıma
- Pasaport tanıma