NaturallySpeaking

12/ 06/ 1997 | NaturallySpeaking

ΣΑΝ ΣΗΜΕΡΑ 12 Ιουνίου 1997, κυκλοφορεί από την αμερικάνικη εταιρεία Dragon Systems, το πρόγραμμα NaturallySpeaking. Θεωρείται ως η πρώτη επιτυχημένη εμπορική εφαρμογή αναγνώρισης φωνής και αυτόματης μετατροπής ομιλίας σε κείμενο στον υπολογιστή.

To NaturallySpeaking ήρθε είκοσι και πλέον χρόνια μετά τη διατύπωση της μεθόδου αναγνώρισης ομιλίας του Δρ. Τζέιμς Μπέικερ, να την υλοποιήσει αποτελεσματικά στα PC. Ο Μπέικερ, ειδικός σε αυτόν τον τομέα και καθηγητής του Κάρνεγκι Μέλον, εξέδωσε το 1975 τη μεθοδολογία αναγνώρισης φυσικής φωνής στα πλαίσια της μελέτης που έχει ξεκινήσει η υπηρεσία αμυντικών ερευνών DARPA (Defense Advanced Research Projects Agency) στις αρχές της δεκαετίας του ’70. Η πρώτη υλοποίηση της μεθόδου έγινε σε mainframe IBM System/370 και ήταν ικανή να αναγνωρίσει 1.000 λέξεις. Η μέθοδος του Μπέικερ ονομαζόταν DRAGON, και δίνει το όνομά της στην εταιρεία που ιδρύει ο ίδιος το 1982, με στόχο να αξιοποιηθεί εμπορικά στους προσωπικούς υπολογιστές.

H Dragon Systems επικεντρώνει το σχεδιασμό του λογισμικού της στο νέο τότε πρότυπο ΙΒΜ-PC και το DOS, με τη βρετανική Apricot Computers να είναι η πρώτη που φιλοξενεί προϊόν της Dragon στα PC της, το 1984. Όμως, σε όλη τη δεκαετία του ’80 η ισχύς των προσωπικών υπολογιστών είναι ακόμη πολύ περιορισμένη για να καλύψει τις μεγάλες απαιτήσεις μίας τόσο σύνθετης διαδικασίας. Έτσι η πρώτη άξια λόγου υλοποίηση έρχεται το 1990 με την εφαρμογή DragonDictate, η οποία -θεωρητικά- μπορεί να αναγνωρίσει 5.000 λέξεις και να μετατρέψει φυσική ομιλία σε κείμενο. Το DragonDictate κυκλοφορεί για PC (DOS) και Macintosh, αλλά με μικρή επιτυχία, καθώς παρουσιάζει τεχνικούς περιορισμούς και απαιτεί παύσεις μεταξύ των λέξεων. Παράλληλα όμως, η εταιρεία συνεχίζει να υποστηρίζεται από την DARPA με νέα συμβόλαια για να προχωρήσει η έρευνα, ενώ και η ισχύς των προσωπικών υπολογιστών έρχεται σιγά σιγά να καλύψει τις απαιτήσεις των εφαρμογών αναγνώρισης φυσικής ομιλίας.

Έτσι, το 1997, παρουσιάζεται το NaturallySpeaking. Μία εφαρμογή για Windows, ικανή να αναγνωρίσει λεξιλόγιο 30.000 λέξεων και πραγματικά φυσική ομιλία, με κανονικό ρυθμό και χωρίς παύσεις. Το πακέτο κοστίζει σχεδόν 700 δολάρια και απευθύνεται σε επαγγελματίες. Υπήρξε η πρώτη εφαρμογή αυτής της κατηγορίας που κατάφερε να επιτύχει εμπορικά. Συνεχίζει να εξελίσσεται έως και σήμερα, οπότε βρισκόμαστε στη 12η έκδοση του NaturallySpeaking που διατίθεται σε οκτώ γλώσσες: Αγγλικά (ΗΠΑ – Μεγ. Βρετανία), Γαλλικά, Γερμανικά, Ιταλικά, Ισπανικά, Δανέζικα και Ιαπωνικά.