OCR (Optical Character Recognition) ή αλλιώς Αυτόματη Αναγνώριση Χαρακτήρων Κειμένου ονομάζεται η τεχνολογία με την οποία μια ψηφιακή εικόνα που περιλαμβάνει έντυπο κείμενο (γράμματα, σύμβολα, αριθμούς), μετατρέπεται σε κείμενο το οποίο μπορεί να διαβάσει και να επεξεργαστεί ένας ηλεκτρονικός υπολογιστής. Το OCR χρησιμοποιεί τεχνολογία Τεχνητής Νοημοσύνης (AI) και μέσω Μηχανικής Μάθησης (Machine Learning) εκπαιδεύεται ως προς την αποτελεσματικότερη αναγνώριση και εξόρυξη των χαρακτήρων ενός εγγράφου σε μορφή εικόνας (jpeg, png) ή αρχείου (pdf).
Η τεχνολογία OCR παρουσιάζει δύο τρόπους εφαρμογής της Οπτικής Αναγνώρισης, την “Αντιστοίχιση με Πρότυπα” και την “Εξαγωγή Χαρακτηριστικών” οι οποίοι λειτουργούν συνδυαστικά με στόχο τη μέγιστη αποτελεσματικότητα.
Η Οπτική Αναγνώριση Χαρακτήρων λειτουργεί σε κάθε είδος μηχανογραφημένου εγγράφου, ενώ με τη συνεχή έκθεση σε συγκεκριμένο τύπο αρχείου, όπως είναι τα τιμολόγια μιας επιχείρησης που εμφανίζονται με μεγάλη συχνότητα, εκπαιδεύεται και εμφανίζει καλύτερα και πιο αξιόπιστα αποτελέσματα.