Δεν υπάρχει πρόγραμμα που να κάνει αυτό που ζητάς, ακόμα και για την πιο απλή μελωδία που θα παίξει ένα μονοφωνικό όργανο. Αν και είναι "εύκολο" να αναγνωρίσει ο υπολογιστής ποιοι φθόγγοι παίζονται, αυτό και μόνο δεν αρκεί για να δημιουργηθεί η παρτιτούρα. Χρειάζεται επιπλέον πληροφορία για την ρυθμική αγωγή της μουσικής (time signature, π.χ., 4/4, 6/8, κτλπ) και tempo (ποια είναι η ρύθμιση του μετρονόμου). Αυτές οι πληροφορίες είναι πολύ δύσκολο να τις αναγνωρίσει ο υπολογιστής, όταν μάλιστα ακόμα και έμπειροι μουσικοί μπορεί να διαφωνήσουν (π.χ., σχετικά με την ρυθμική αγωγή ενός κομματιού, ένας μπορεί να "ακούει" 6/8 ενώ άλλος 3/4, για να μην αναφερθώ σε περιπτώσεις όπου το time signature δεν είναι συνηθισμένο ή/και σταθερό).
Ένα επιπλέον σημαντικό στοιχείο που κάνει δύσκολη την αυτόματη μετατροπή μουσικής σε παρτιτούρα είναι η αδυναμία της ίδιας της παρτιτούρας να αναπαραστήσει με "μηχανικό" τρόπο την μουσική. Συγκεκριμένα, αν και η παρτιτούρα καθορίζει τις χρονικές αξίες των φθόγγων, στην πράξη, ο (καλός) εκτελεστής θα αποκλίνει λιγότερο ή περισσότερο προκειμένου να γίνει πιο εκφραστικός. Αλλά ακόμα και να προσπαθήσει να παίξει κάποιος την παρτιτούρα εντελώς μηχανικά, είναι αδύνατο η αναπαραγωγή των χρονικών αξιών να γίνει τέλεια. Αποτέλεσμα είναι, ακόμα και αν ο υπολογιστής γνωρίζει την ρυθμική αγωγή του κομματιού και το μόνο που μένει να κάνει είναι να αντιλαμβάνεται τον φθόγγο και την χρονική αξία του, η "παρτιτούρα" που προκύπτει να έχει παράλογες χρονικές αξίες και να είναι πρακτικά άχρηστη. Για παράδειγμα, αντί ενός φθόγγου αξίας 1/4 ο υπολογιστής μετράει και καταγράφει αξία 1/4 +1/32 επειδή ο εκτελεστής κράτησε το φθόγγο ελάχιστα παραπάνω.
Υπάρχει ένας επιστημονικός κλάδος ("machine learning") που ασχολείται με τέτοια προβλήματα, δηλαδή, την αναγνώριση/ανίχνευση από τον υπολογιστή πραγμάτων που ο άνθρωπος κάνει χωρίς κανένα κόπο. Αν και έχει γίνει πρόοδος σε θέματα όπως, π.χ., αναγνώριση προσώπου, ή αναγνώριση τίτλου ενός μουσικού κομματιού, θεωρώ πως είναι πολύ δύσκολο να γίνει "πραγματική" αναγνώριση μουσικής. Η αντίληψη της μουσικής είναι πολύ "βαθιά" ανθρώπινη διαδικασία, χωρίς ιδιαίτερα μηχανικά/αυτόματα χαρακτηριστικά τα οποία θα μπορούσε να μιμηθεί ο υπολογιστής. Υποθέτω ότι όταν φτάσουμε στο σημείο να καταγράφει ο υπολογιστής μουσική σε παρτιτούρα θα είναι και σε θέση και να συνθέσει (αξιόλογη) μουσική. Κρίνοντας από το πόσο επιτυχημένη είναι η εφαρμογή αυτόματων υποτίτλων του yοutube, έχω την εντύπωση ότι είμαστε μακριά από αυτό το σημείο.