Δελτίο Τύπου

31.05.2013
Διάκριση ερευνητών του ΙΤΕ για την ανάπτυξη συστήματος επεξεργασίας ήχου SSDRC

Ας χαμηλώσουμε τις εντάσεις...

Σύμφωνα με τον Παγκόσμιο Οργανισμό Υγείας , ο περιβαλλοντικός θόρυβος που υπάρχει καθημερινά τριγύρω μας υποβαθμίζει σημαντικά την ποιότητα της ζωής μας. Η ανθρώπινη φωνή συγκαταλέγεται στους θορυβοποιούς παράγοντες, όταν στην προσπάθειά της να «ακουστεί», να γίνει αντιληπτός ο λόγος, αυξάνει δραματικά την έντασή της. Τέτοια παραδείγματα είναι οι εκκωφαντικές ανακοινώσεις σε δημόσιους χώρους (σταθμοί τρένων, αεροδρόμια, κτλ.).

Είναι όμως η αύξηση έντασης η μόνη λύση για την αντιμετώπιση αυτού του προβλήματος; Ερευνητές του Ινστιτούτου Πληροφορικής του Ιδρύματος Τεχνολογίας και Έρευνας (ΙΤΕ), στο Ηράκλειο της Κρήτης, απέδειξαν ότι αρκεί να γίνει κατάλληλη επεξεργασία του σήματος της φωνής, έτσι ώστε οι «ευάλωτες» στον θόρυβο περιοχές της να προστατευθούν ανάλογα .

Πιο συγκεκριμένα, προτείνουν πρωτοποριακές τεχνικές ανακατανομής της ενέργειας της φωνής στο χρόνο και στη συχνότητα: Στον χώρο του χρόνου, τα τμήματα της φωνής με τη χαμηλή ενέργεια ενισχύονται, ενώ τα αντίστοιχα με υψηλή ενέργεια αποδυναμώνονται. Έτσι, στις περισσότερες περιπτώσεις το επίπεδο του σήματος της φωνής είναι πάνω από το επίπεδο του θορύβου. Επιπλέον, μια δεύτερη ανακατανομή της ενέργειας του σήματος στο χώρο των συχνοτήτων εφαρμόζεται, η οποία μιμείται την τακτική που οι άνθρωποι χρησιμοποιούν ώστε να γίνονται καταληπτοί από τους συνομιλητές τους σε θορυβώδη περιβάλλοντα. Οι ιδέες αυτές υλοποιήθηκαν σε ένα σύστημα: το SSRDC (Spectral Shaping Dynamic Range Compression), χρησιμοποιώντας ηχογραφήσεις ομιλητών σε θορυβώδη περιβάλλοντα.

Σε πρόσφατη αξιολόγηση συστημάτων επεξεργασίας σημάτων φωνής σε θορυβώδη περιβάλλοντα, το SSRDC διακρίθηκε και κατέλαβε την πρώτη θέση ανάμεσα σε είκοσι επτά άλλα συστήματα ιδίου σκοπού, και κρίθηκε άριστο για τις περισσότερες περιπτώσεις θορύβου που εξετάστηκε.

Τα αποτελέσματα χρήσης του δείχνουν ότι η κατανόηση λόγου μπορεί να αυξηθεί σημαντικά (πάνω από 35%), χωρίς να χρειαστεί να μεγαλώσει αντίστοιχα η ένταση της φωνής για να καλυφτεί ο περιβαλλοντικός θόρυβος. Τα επίσημα αποτελέσματα των αξιολογήσεων θα ανακοινωθούν στο διεθνές συνέδριο Interspeech 2013, τον Αύγουστο του 2013, στη Λιόν της Γαλλίας. (Δείγματα επεξεργασμένης φωνής από τα παραπάνω συστήματα υπάρχουν στην ιστοσελίδα: http://listening-talker.org/showcase/).

Το σύστημα SSRDC ήδη χρησιμοποιείται ερευνητικά και εξετάζεται η χρησιμότητά του σε ειδικές κατηγορίες πολιτών, όπως είναι οι περιπτώσεις ατόμων με προβλήματα ακοής. Το SSDRC αναμένεται να χρησιμοποιηθεί σε μια σειρά από τεχνολογίες (συστήματα πλοήγησης αυτοκινήτου –GPS–, τηλέφωνο, τηλεόραση, βιντεοπαιχνίδια), καθώς και σε δημόσιους χώρους (αεροδρόμια, σιδηροδρομικούς σταθμούς κλπ.).

Η υλοποίηση του SSDRC έγινε κατά την εκτέλεση του ερευνητικού προγράμματος: «The Listening Talker», το οποίο χρηματοδοτήθηκε από την Ευρωπαϊκή Ένωση, κατά την τριετία 2010-2013, και στο οποίο συμμετείχαν ερευνητικοί οργανισμοί από την Ισπανία, την Αγγλία, τη Σουηδία και την Ελλάδα.

Η ερευνητική ομάδα του ΙΤΕ-ΙΠ που εργάστηκε στο έργο αυτό υπό την εποπτεία του Καθηγητή Γιάννη Στυλιανού απαρτίζεται από τις: Βαρβάρα Κάνδια (MSc), Δρ. Elizabeth Godoy και την υποψήφια Διδάκτορα Μαρία Κουτσογιαννάκη.



© Copyright 2007 FOUNDATION FOR RESEARCH & TECHNOLOGY - HELLAS, All rights reserved.