Bilgisayarla görme, bilgisayarların dijital görüntüleri insan optik sistemine benzer şekilde okumasına ve anlamasına yardımcı olmaya çalışan çok disiplinli bir çalışma alanıdır. Genel olarak, hesaplamalı zeka ve makine öğrenimini içerir. Yalnızca bir resim veya video hakkındaki yazılı veya kataloglanmış içeriği (bir bilgisayar sisteminde bulunmasına yardımcı olmak için resim veya videoya yerleştirilmiş insan yapımı bir metin açıklaması gibi) görsel bağlamı anlamaya dayanır. Bilgisayar görüşü, 1960'lardan beri bilimsel topluluklarda tartışılıyor, ancak önemli gelişmeler sağlamak için mücadele etti, çünkü esas olarak görüntü analizi ve bağlam çok karmaşık ve insan optik sistemi herhangi bir hesaplama yeteneğini çok geride bırakıyor.
Son zamanlarda, derin öğrenme, bilgisayar sistemlerinin görüntüleri onlara göstererek daha iyi analiz etmesine izin verdi. Zamanla bilgisayar, diğer görüntülerde bu ayrıntıları fark etmesine yardımcı olacak ayrıntıları görüntülerden tanımayı öğrenir (görüntü tanıma). Bilgisayarla görmenin genel amacı, bir bilgisayarın bir görüntünün ayrıntılarını anlayabilmesi ve onu yorumlayabilmesi veya insanlara açıklayabilmesidir. Derin öğrenme, bu hedefin daha gerçekçi olmasına yardımcı olur, ancak bilgisayar görüşü hala araştırmacıların olmasını istediği yerden çok uzaktır.
Bilgisayar görüşü ile ilgili iki ana sorun, uygulamayı zorlaştırır. Görsel dünyanın doğası gereği çok fazla değişiklik ve çeşitlilik vardır. Aynı zamanda çok karmaşık. İnsan beyni, bir görüntü veya başka bir görsel medya parçası hakkındaki en küçük ayrıntıları istemeden hızlı bir şekilde analiz etmek için tasarlanmış olsa da, bilgisayarlar değil. İkincisi, bilgisayar görüşü genellikle insan optik sistemine dayanır ve bilim adamları bile onu yeterince yeniden yaratmaya çalışmak için yeterince anlamıyorlar.