News: |
Ακουστική συμπίεση είναι μια μορφή συμπίεση στοιχείων σχεδιασμένος για να μειώσει το μέγεθος ακουστικά αρχεία. Ακουστική συμπίεση αλγόριθμοι εφαρμόζεται στο λογισμικό υπολογιστών όπως ακουστικά codecs. Γενικός συμπίεση στοιχείων οι αλγόριθμοι αποδίδουν κακώς με τα ακουστικά στοιχεία, μειώνοντας σπάνια τα μεγέθη αρχείων πολύς κάτω από 87% του αρχικού, και δεν σχεδιάζονται για τη χρήση σε πραγματικό - χρόνος. Συνεπώς, συγκεκριμένος ήχος «χωρίς απώλειες«και»με απώλειες«οι αλγόριθμοι έχουν δημιουργηθεί. Οι με απώλειες αλγόριθμοι παρέχουν τις μακρινές μεγαλύτερες αναλογίες συμπίεσης και χρησιμοποιώ στις ακουστικές συσκευές επικρατόντων καταναλωτών.
Όπως με συμπίεση εικόνας, και οι με απώλειες και χωρίς απώλειες αλγόριθμοι συμπίεσης χρησιμοποιούνται στην ακουστική συμπίεση, με απώλειες ύπαρξη οι πιό κοινοί για την καθημερινή χρήση. Και στη με απώλειες και χωρίς απώλειες συμπίεση, ο πλεονασμός πληροφοριών μειώνεται, χρησιμοποιώντας τις μεθόδους όπως η κωδικοποίηση, η αναγνώριση σχεδίων και η γραμμική πρόβλεψη για να μειώσει το ποσό πληροφοριών που χρησιμοποιείται για να περιγράψει τα στοιχεία.
Η ανταλλαγή της ελαφρώς μειωμένης ακουστικής ποιότητας ξεπερνιέται σε βάρος σαφώς για τις περισσότερες πρακτικές ακουστικές εφαρμογές όπου οι χρήστες δεν μπορούν να αντιληφθούν οποιαδήποτε διαφορά και οι διαστημικές απαιτήσεις μειώνονται ουσιαστικά. Παραδείγματος χάριν, σε ένα CD, κάποιο μπορεί να εγκαταστήσει ώρα της υψηλής μουσικής πίστης, λιγότερο από 2 ώρες της μουσικής που συμπιέζονται losslessly, ή 7 ώρες της μουσικής που συμπιέζονται με MP3 το σχήμα.
Περιεχόμενο |
Δεδομένου ότι η αποθήκευση αρχείων και το εύρος ζώνης επικοινωνιών έχουν γίνει λιγότερο ακριβές και πιό διαθέσιμες, η δημοτικότητα των χωρίς απώλειες σχημάτων όπως Ήχος πιθήκου, FLAC και Κοντύντε έχει αυξηθεί αισθητά, όπως οι άνθρωποι επιλέγουν να διατηρήσουν ένα μόνιμο αρχείο των ακουστικών αρχείων τους. Οι αρχικοί χρήστες της χωρίς απώλειες συμπίεσης ήταν ακουστικοί μηχανικοί, audiophiles και εκείνοι οι καταναλωτές που θέλουν να συντηρήσουν ένα ακριβές αντίγραφο των ακουστικών αρχείων τους, σε αντίθεση με τις αμετάκλητες αλλαγές από τις με απώλειες τεχνικές συμπίεσης όπως Vorbis και MP3. Οι αναλογίες συμπίεσης είναι παρόμοιες με εκείνους για τη χωρίς απώλειες συμπίεση στοιχείων (περίπου 50-60% του αρχικού μεγέθους). Χωρίς απώλειες σχήματα όπως Dolby TrueHD εισάγεται επίσης μαζί με τον υψηλό καθορισμό DVD σχήματα.
Είναι δύσκολο να διατηρηθούν όλα τα στοιχεία σε ένα ακουστικό ρεύμα και να επιτευχθεί η ουσιαστική συμπίεση. Κατ' αρχάς, η μεγάλη πλειοψηφία των υγιών καταγραφών είναι ιδιαίτερα σύνθετη, καταγραμμένος από τον πραγματικό κόσμο. Δεδομένου ότι μια από τις βασικές μεθόδους συμπίεσης είναι να βρεθούν τα σχέδια και η επανάληψη, το πιό χαοτικό στοιχείο όπως ο ήχος δεν συμπιέζει καλά. Κατά τρόπο παρόμοιο, φωτογραφίες η συμπίεση λιγότερο αποτελεσματικά με τις χωρίς απώλειες μεθόδους από τις απλούστερες παραγόμενες από υπολογιστή εικόνες. Αλλά κατά τρόπο ενδιαφέροντα, οι ακόμη και παραγμένοι υπολογιστής ήχοι μπορούν να περιέχουν πολύ περίπλοκος κυματοειδή εκείνο το παρόν μια πρόκληση σε πολλούς αλγορίθμους συμπίεσης. Αυτό οφείλεται στη φύση των ακουστικών κυματοειδών, που είναι γενικά δύσκολο να απλοποιηθούν χωρίς μια (απαραιτήτως με απώλειες) μετατροπή στις πληροφορίες συχνότητας, όπως εκτελείται από το ανθρώπινο αυτί.
Ο δεύτερος λόγος είναι ότι τιμές του ήχου δείγματα αλλαγή πολύ γρήγορα, τόσο γενική συμπίεση στοιχείων αλγόριθμοι μην εργαστείτε καλά για τον ήχο, και οι σειρές των διαδοχικών ψηφιολέξεων δεν εμφανίζονται γενικά πολύ συχνά. Εντούτοις, συνέλιξη με το φίλτρο [- 1 1] (δηλαδή παίρνοντας την πρώτη διαφορά) τείνει ελαφρώς λευκάνετε (decorrelate, καταστήστε επίπεδο) το φάσμα, με αυτόν τον τρόπο επιτρέποντας στην παραδοσιακή χωρίς απώλειες συμπίεση στον κωδικοποιητή για να κάνει την εργασία του η ολοκλήρωση στον αποκωδικοποιητή αποκαθιστά το αρχικό σήμα. Codecs όπως FLAC, Κοντύντε και TTA χρήση γραμμική πρόβλεψη εκτίμηση το φάσμα του σήματος. Στον κωδικοποιητή, το αντίστροφο του εκτιμητή χρησιμοποιείται για να λευκάνει το σήμα με την αφαίρεση των φασματικών αιχμών ενώ ο εκτιμητής χρησιμοποιείται για να αναδημιουργήσει το αρχικό σήμα στον αποκωδικοποιητή.
Τα χωρίς απώλειες ακουστικά codecs δεν έχουν κανένα ποιοτικό ζήτημα, έτσι η δυνατότητα χρησιμοποίησης μπορεί να υπολογιστεί κοντά
Η με απώλειες ακουστική συμπίεση χρησιμοποιείται σε ένα εξαιρετικά ευρύ φάσμα των εφαρμογών. Εκτός από τις άμεσες εφαρμογές (mp3 φορείς ή υπολογιστές), τα ψηφιακά συμπιεσμένα ακουστικά ρεύματα χρησιμοποιούνται σε πιό τηλεοπτικό DVDs ψηφιακή τηλεόραση ρέοντας μέσα Διαδίκτυο; ραδιόφωνο δορυφόρων και καλωδίων και όλο και περισσότερο στις επίγειες ραδιο ραδιοφωνικές μεταδόσεις. Η με απώλειες συμπίεση επιτυγχάνει χαρακτηριστικά τη μακρινή μεγαλύτερη συμπίεση από τη χωρίς απώλειες συμπίεση (στοιχεία 5 τοις εκατό σε 20 τοις εκατό του αρχικού ρεύματος, παρά 50 τοις εκατό σε 60 τοις εκατό), με την απόρριψη των λιγότερο-κρίσιμων στοιχείων.
Η καινοτομία της με απώλειες ακουστικής συμπίεσης ήταν να χρησιμοποιήσει psychoacoustics για να αναγνωρίσει ότι δεν μπορούν όλα τα στοιχεία σε ένα ακουστικό ρεύμα να γίνουν αντιληπτοί από το ανθρώπινο ακουστικό σύστημα. Η περισσότερη με απώλειες συμπίεση μειώνει τον αντιληπτικό πλεονασμό από τους πρώτους προσδιορίζοντας ήχους που θεωρούνται perceptually άσχετος, δηλαδή ηχεί αυτός είναι πολύ δύσκολο να ακουστεί. Τα χαρακτηριστικά παραδείγματα περιλαμβάνουν τις υψηλές συχνότητες, ή τους ήχους που εμφανίζονται ταυτόχρονα με τους δυνατότερους ήχους. Εκείνοι οι ήχοι κωδικοποιούνται με τη μειωμένη ακρίβεια ή μην κωδικοποιημένος καθόλου.
Αφαιρώντας ή μειώνοντας αυτούς τους «unhearable» ήχους μπορεί να αποτελέσει ένα μικρό ποσοστό των κομματιών που σώζονται στη με απώλειες συμπίεση, η πραγματική αποταμίευση προέρχεται από ένα συμπληρωματικό φαινόμενο: διαμόρφωση θορύβου. Η μείωση του αριθμού κομματιών που χρησιμοποιούνται για να κωδικοποιήσουν ένα σήμα αυξάνει το ποσό θορύβου σε εκείνο το σήμα. Στην psychoacoustics-βασισμένη με απώλειες συμπίεση, το πραγματικό κλειδί είναι «να κρυφτεί» ο θόρυβος που παράγεται από την αποταμίευση κομματιών στις περιοχές του ακουστικού ρεύματος που δεν μπορεί να γίνει αντιληπτού. Αυτό γίνεται από, για παράδειγμα, χρησιμοποιώντας τους πολύ μικρούς αριθμούς κομματιών για να κωδικοποιήσει τις υψηλές συχνότητες των περισσότερων σημάτων - όχι επειδή το σήμα έχει λίγες πληροφορίες υψηλής συχνότητας (αν και αυτό ισχύει επίσης συχνά επίσης), αλλά μάλλον επειδή το ανθρώπινο αυτί μπορεί μόνο να αντιληφθεί τα πολύ δυνατά σήματα σε αυτήν την περιοχή, έτσι ώστε οι μαλακότεροι ήχοι «που κρύβονται» εκεί απλά δεν ακούγονται.
Εάν μειώνοντας ο αντιληπτικός πλεονασμός δεν επιτυγχάνει την ικανοποιητική συμπίεση για μια ιδιαίτερη εφαρμογή, μπορεί να απαιτήσει την περαιτέρω με απώλειες συμπίεση. Ανάλογα με την ακουστική πηγή, αυτό μπορεί ακόμα να μην παραγάγει τις αντιληπτές διαφορές. Η ομιλία μπορεί παραδείγματος χάριν να συμπιεστεί πολύ περισσότερο από τη μουσική. Τα περισσότερα με απώλειες σχέδια συμπίεσης επιτρέπουν στις παραμέτρους συμπίεσης για να ρυθμιστούν για να επιτύχουν ένα ποσοστό στόχων στοιχείων, που εκφράζεται συνήθως ως α ποσοστό δυαδικών ψηφίων. Πάλι, η μείωση στοιχείων θα καθοδηγηθεί από κάποιο πρότυπο για το πόσο σημαντικός ο ήχος είναι όπως γίνεται αντιληπτός από το ανθρώπινο αυτί, με το στόχο της αποτελεσματικότητας και της βελτιστοποιημένης ποιότητας για το ποσοστό στοιχείων στόχων. (Υπάρχουν πολλά διαφορετικά πρότυπα που χρησιμοποιούνται για αυτήν την αντιληπτική ανάλυση, μερικούς καλύτερα ταιριαγμένους έως διαφορετικούς τύπους ήχων από άλλοι.) ως εκ τούτου, ανάλογα με τις απαιτήσεις εύρους ζώνης και αποθήκευσης, η χρήση της με απώλειες συμπίεσης μπορεί να οδηγήσει σε μια αντιληπτή μείωση της ακουστικής ποιότητας που κυμαίνεται από καμία ως αυστηρό, αλλά γενικά μια προφανώς ευδιάκριτη μείωση της ποιότητας είναι απαράδεκτη στους ακροατές.
Επειδή το στοιχείο αφαιρείται κατά τη διάρκεια της με απώλειες συμπίεσης και δεν μπορεί να ανακτηθεί από την αποσυμπίεση, μερικοί άνθρωποι δεν μπορούν να προτιμήσουν τη με απώλειες συμπίεση για την αρχειακή αποθήκευση. Ως εκ τούτου, όπως σημειώνεται, ακόμη και εκείνοι που χρησιμοποιούν τη με απώλειες συμπίεση (για τις φορητές ακουστικές εφαρμογές, παραδείγματος χάριν) μπορούν να επιθυμήσουν να κρατήσουν ένα losslessly συμπιεσμένο αρχείο για άλλες εφαρμογές. Επιπλέον, η τεχνολογία της συμπίεσης συνεχίζει να προωθεί, και η επίτευξη μιας με απώλειες συμπίεσης κατάστασης προόδου θα απαιτούσε μια για να αρχίσει πάλι με τα χωρίς απώλειες, αρχικές ακουστικές στοιχεία και τη συμπίεση με το νέο με απώλειες κωδικοποιητή-αποκωδικοποιητή. Η φύση της με απώλειες συμπίεσης (και για τον ήχο και για τις εικόνες) οδηγεί στην αυξανόμενη υποβάθμιση της ποιότητας εάν τα στοιχεία αποσυμπιέζονται, κατόπιν η χρησιμοποίηση της με απώλειες συμπίεσης.
Μια μεγάλη ποικιλία των πραγματικών, λειτουργώντας ακουστικών συστημάτων κωδικοποίησης δημοσιεύθηκε σε μια συλλογή στο IEEE περιοδικό στις επιλεγμένες περιοχές στις επικοινωνίες (JSAC), Φεβρουαρίου 1988. Ενώ υπεάρξαν μερικά έγγραφα από πριν από εκείνο τον χρόνο, αυτή η επιτομή των εγγράφων τεκμηρίωσε μια ολόκληρη ποικιλία των τελειωμένων, εργαζόμενων ακουστικών κωδικοποιητών, σχεδόν όλοι τους χρησιμοποίηση αντιληπτική (δηλ. masking) τεχνικές και κάποια ανάλυση συχνότητας και αθόρυβη κωδικοποίηση οπίσθιου μέρους.[1] Αρκετά από αυτά τα έγγραφα που παρατηρούνται στη δυσκολία τον καλό, καθαρό ψηφιακό ήχο για ερευνητικούς λόγους. Οι περισσότεροι, εάν όχι όλοι, των συντακτών στην έκδοση JSAC δραστηριοποιήθηκαν επίσης στη mpeg-1 ακουστική επιτροπή.
Το παγκόσμιας πρώτο εμπορικό ραδιοφωνικής μετάδοσης σύστημα συμπίεσης αυτοματοποίησης ακουστικό αναπτύχθηκε από το Oscar Bonello, ένας καθηγητής εφαρμοσμένης μηχανικής Πανεπιστήμιο του Μπουένος Άιρες.[2] Το 1983, χρησιμοποιώντας τη psychoacoustic αρχή της κάλυψης των κρίσιμων ζωνών που δημοσιεύονται πρώτα το 1967,[3] άρχισε μια πρακτική εφαρμογή βασισμένη πρόσφατα αναπτυγμένο PC ΤΗΣ ΙΒΜ ο υπολογιστής, και το σύστημα αυτοματοποίησης ραδιοφωνικής μετάδοσης προωθήθηκαν το 1987 με το όνομα Audicom. 20 έτη αργότερα, σχεδόν όλοι οι ραδιοσταθμοί στον κόσμο χρησιμοποιούσαν την παρόμοια τεχνολογία, που κατασκευάστηκε από διάφορες επιχειρήσεις.
Προκειμένου να καθοριστεί ποιος πληροφορίες σε ένα ακουστικό σήμα είναι perceptually άσχετες, οι περισσότεροι με απώλειες αλγόριθμοι συμπίεσης χρησιμοποιούν τις μετατροπές όπως τροποποιημένη ιδιαίτερη μετατροπή συνημιτόνου (MDCT) για να μετατρέψει χρονική περιοχή επιλεγε'ντα κυματοειδή σε μια περιοχή μετατροπής. Μόλις μετασχηματίζω, χαρακτηριστικά πεδίο συχνότητας, οι συστατικές συχνότητες μπορούν να είναι διατιθέμενα κομμάτια σύμφωνα με πόσο ευδιάκριτα είναι. Η ακουστικότητα των φασματικών συστατικών καθορίζεται με πρώτα να υπολογίσει α καλύπτοντας κατώτατο όριο, κάτω από το οποίο υπολογίζεται ότι οι ήχοι θα είναι πέρα από τα όρια της ανθρώπινης αντίληψης.
Το καλύπτοντας κατώτατο όριο είναι υπολογισμένη χρησιμοποίηση απόλυτο κατώτατο όριο της ακρόασης και οι αρχές ταυτόχρονη κάλυψη - το φαινόμενο όπου ένα σήμα καλύπτεται από ένα άλλο σήμα που χωρίζεται από τη συχνότητα - και, σε μερικές περιπτώσεις, χρονική κάλυψη - όπου ένα σήμα καλύπτεται από ένα άλλο σήμα που χωρίζεται μέχρι το χρόνο. Περιγράμματα ίσος-ηχηρότητας μπορέστε επίσης να χρησιμοποιηθείτε για να σταθμίσει την αντιληπτική σημασία των διαφορετικών συστατικών. Τα πρότυπα του ανθρώπινου συνδυασμού αυτί-εγκεφάλου που ενσωματώνει τέτοια αποτελέσματα καλούνται συχνά psychoacoustic πρότυπα.
Άλλοι τύποι με απώλειες συμπιεστών, όπως γραμμική προφητική κωδικοποίηση (LPC) χρησιμοποιημένος με την ομιλία, είναι πηγή-βασισμένοι κωδικοποιητές. Αυτοί οι κωδικοποιητές χρησιμοποιούν ένα πρότυπο της υγιούς γεννήτριας (όπως το ανθρώπινο φωνητικό κομμάτι με το LPC) για να λευκάνουν το ακουστικό σήμα (δηλ., ισιώστε το φάσμα του) πριν από την κβαντοποίηση. Το LPC μπορεί επίσης να θεωρηθεί ως βασική αντιληπτική τεχνική κωδικοποίησης η αναδημιουργία ενός ακουστικού σήματος που χρησιμοποιεί έναν γραμμικό προάγγελο διαμορφώνει το θόρυβο κβαντοποίησης του κωδικοποιητή στο φάσμα του σήματος στόχων, καλύπτοντας τον μερικώς.
Λόγω της φύσης των με απώλειες αλγορίθμων, ακουστική ποιότητα υποφέρει όταν ένα αρχείο αποσυμπιέζεται και (απώλειες generational). Αυτό καθιστά τη με απώλειες συμπίεση ακατάλληλη για την αποθήκευση των ενδιάμεσων αποτελεσμάτων στις επαγγελματικές ακουστικές εφαρμογές εφαρμοσμένης μηχανικής, όπως η υγιής έκδοση και η multitrack καταγραφή. Εντούτοις, είναι πολύ δημοφιλείς με το τέλος - χρήστες (ιδιαίτερα MP3), ως μεγαμπάιτ μπορεί να αποθηκεύσει για την αξία ενός λεπτού της μουσικής στην επαρκή ποιότητα.
Η δυνατότητα χρησιμοποίησης των με απώλειες ακουστικών codecs καθορίζεται από:
Τα με απώλειες σχήματα χρησιμοποιούνται συχνά για τη διανομή του ήχου ροής, ή τις διαλογικές εφαρμογές (όπως η κωδικοποίηση της ομιλίας για την ψηφιακή μετάδοση στα τηλεφωνικά δίκτυα κυττάρων). Σε τέτοιες εφαρμογές, τα στοιχεία πρέπει να αποσυμπιεστούν ως ροές στοιχείων, παρά αφότου έχει διαβιβαστεί το ολόκληρο ρεύμα στοιχείων. Όχι όλα τα ακουστικά codecs μπορούν να χρησιμοποιηθούν για τις εφαρμογές ροής, και για τέτοιες εφαρμογές ένας κωδικοποιητής-αποκωδικοποιητής που σχεδιάζεται στα στοιχεία ρευμάτων αποτελεσματικά θα επιλεχτεί συνήθως.
Αποτελέσματα λανθάνουσας κατάστασης από τις μεθόδους που χρησιμοποιούνται για να κωδικοποιήσουν και να αποκωδικοποιήσουν τα στοιχεία. Μερικά codecs θα αναλύσουν ένα πιό μακροχρόνιο τμήμα των στοιχείων για να βελτιστοποιήσουν την αποδοτικότητα, και να την κωδικοποιήσουν έπειτα με έναν τρόπο που απαιτεί ένα μεγαλύτερο τμήμα των στοιχείων προκειμένου να αποκωδικοποιήσει συγχρόνως. (Συχνά codecs δημιουργήστε τα τμήματα αποκαλούμενα «πλαίσιο» για να δημιουργήσετε τα ιδιαίτερα τμήματα στοιχείων για την κωδικοποίηση και την αποκωδικοποίηση.) ο έμφυτος λανθάνουσα κατάσταση από την κωδικοποίηση ο αλγόριθμος μπορεί να είναι κρίσιμος παραδείγματος χάριν, όταν υπάρχει διπλής κατεύθυνσης διαβίβαση στοιχείων, όπως με μια τηλεφωνική συνομιλία, οι σημαντικές καθυστερήσεις μπορούν σοβαρά να υποβιβάσουν την αντιληπτή ποιότητα.
Σε αντίθεση με την ταχύτητα της συμπίεσης, που είναι ανάλογη προς τον αριθμό διαδικασιών που απαιτούνται από τον αλγόριθμο, εδώ η λανθάνουσα κατάσταση αναφέρεται στον αριθμό δειγμάτων που πρέπει να αναλυθεί προτού να υποβληθεί σε επεξεργασία ένας φραγμός του ήχου. Στην ελάχιστη περίπτωση, η λανθάνουσα κατάσταση είναι 0 μηά δείγματα (π.χ., εάν ο κωδικοποιητής/ο αποκωδικοποιητής μειώνει απλά τον αριθμό κομματιών που χρησιμοποιούνται για να κβαντοποιήσουν το σήμα). Οι αλγόριθμοι χρονικών περιοχών όπως το LPC επίσης συχνά έχουν τις χαμηλές λανθάνουσες καταστάσεις, ως εκ τούτου η δημοτικότητά τους στη λεκτική κωδικοποίηση για την τηλεφωνία. Στους αλγορίθμους όπως MP3, εντούτοις, ένας μεγάλος αριθμός δειγμάτων πρέπει να αναλυθεί προκειμένου να εφαρμοστεί ένα psychoacoustic πρότυπο στο πεδίο συχνότητας, και η λανθάνουσα κατάσταση είναι σε παραγγελία της κας 23 (κα 46 για τη διπλής κατεύθυνσης επικοινωνία).
Λεκτική κωδικοποίηση είναι μια σημαντική κατηγορία ακουστικής συμπίεσης στοιχείων. Τα αντιληπτικά πρότυπα που χρησιμοποιούνται για να υπολογίσουν τι ένα ανθρώπινο αυτί μπορεί να ακούσει είναι γενικά κάπως διαφορετικά από εκείνους που χρησιμοποιούνται για τη μουσική. Το φάσμα των συχνοτήτων που απαιτούνται για να μεταβιβάσουν τους ήχους μιας ανθρώπινης φωνής είναι κανονικά πολύ στενότερο από αυτή που απαιτείται για τη μουσική, και ο ήχος είναι κανονικά λιγότερο σύνθετος. Κατά συνέπεια, η ομιλία μπορεί να κωδικοποιηθεί στην υψηλή ποιότητα χρησιμοποιώντας τα σχετικά χαμηλά ποσοστά δυαδικών ψηφίων.
Αυτό ολοκληρώνεται, γενικά, από κάποιο συνδυασμό δύο προσεγγίσεων:
Ίσως οι πιό πρόωροι αλγόριθμοι που χρησιμοποιήθηκαν στη λεκτική κωδικοποίηση (και την ακουστική συμπίεση στοιχείων γενικά) ήταν Αλγόριθμος α-νόμου και αλγόριθμος µ-νόμου.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||
|
Custom Search
|
© Πνευματικά δικαιώματα 2011 WorldLingo. Με την επιφύλαξη κάθε νόμιμου δικαιώματος.