Analiza akustyczna i testy funkcjonalne stanowią nieodzowny element współczesnej diagnostyki zaburzeń głosu, dostarczając obiektywnych danych uzupełniających badania obrazowe. Różne parametry głosu i mowy są oceniane przez analizę akustyczną, którą wykonuje logopeda lub inni przeszkoleni specjaliści zespołu opieki głosowej1. Te zaawansowane metody umożliwiają precyzyjną kwantyfikację funkcji głosowej i monitorowanie postępów terapeutycznych.
Podstawy analizy akustycznej głosu
Analiza akustyczna głosu opiera się na obiektywnych pomiarach różnych parametrów dźwiękowych produkowanych przez aparat fonacyjny. Dane obiektywne są dostępne z analiz akustycznych (fonetografia [profil zakresu głosu], mowa widzialna [spektrografia], kwantyfikacja Fo, procent udźwięcznienia, parametry perturbacji, stosunek harmonicznych do szumu, itp.) oraz z pomiarów aerodynamicznych2.
Nowoczesne systemy analizy akustycznej wykorzystują zaawansowane algorytmy do przetwarzania sygnałów głosowych. Analiza akustyczna wykorzystuje technologię do pomiaru różnych aspektów głosu3. Komputerowa analiza akustyczna stanowi jeden ze specjalnych procedur oceny, które mogą być używane jako część diagnozy4.
Główne komponenty techniczne oceny głosu obejmują analizy percepcyjne, analizy akustyczne, analizy aerodynamiczne oraz wizualizację krtani5. Te różnorodne podejścia zapewniają kompleksową ocenę funkcji głosowej z różnych perspektyw.
Pomiary aerodynamiczne i maksymalny czas fonacji
Testy aerodynamiczne stanowią fundamentalną część oceny funkcjonalnej aparatu głosowego. Najważniejszym parametrem aerodynamicznym fonacji jest pomiar maksymalnego czasu fonacji (MPT) oraz stosunek s/z6. Te pomiary dostarczają informacji o wydolności oddechowej i koordynacji oddechowo-fonacyjnej pacjenta.
Maksymalny czas fonacji (MPT) oraz pletyzmografia całego ciała należą do pomiarów aerodynamicznych2. Pomiary aerodynamiczne obejmują średni przepływ powietrza, szacowane ciśnienie podgłośniowe oraz maksymalny czas fonacji7.
Ocena aerodynamiczna obejmuje pomiar przepływu powietrza i ciśnienia powietrza podczas mówienia8. Te parametry są szczególnie ważne w ocenie efektywności zamykania strun głosowych oraz ogólnej koordynacji oddechowo-fonacyjnej.
Analiza częstotliwości podstawowej i perturbacji
Analiza częstotliwości podstawowej (F0) i jej zmienności stanowi kluczowy element oceny akustycznej głosu. Jeśli drgania są okresowe, częstotliwość podstawowa może być dokładnie obliczona9. Parametry te dostarczają informacji o stabilności i kontroli wysokości głosu.
Pomiary akustyczne obejmują średnią częstotliwość podstawową i, jeśli to możliwe, zakres częstotliwości, szczytową prominencję cepstralną oraz średnią intensywność podstawową7. Te parametry pozwalają na obiektywną ocenę różnych aspektów jakości głosu.
Analiza perturbacji obejmuje ocenę nieregularności w częstotliwości (jitter) i amplitudzie (shimmer) drgań strun głosowych. Powierzchnia pod krzywą (AUC) uzyskała 0,94 i 0,84 dla jitter wyekstraktowanego z samogłosek odpowiednio dla MEEI i PdA10. Te wskaźniki są szczególnie czułe na nieprawidłowości w drganiach strun głosowych.
Stosunek harmonicznych do szumu i inne wskaźniki
Ocena stosunku harmonicznych do szumu (HNR) oraz innych wskaźników jakości głosu dostarcza informacji o obecności szumów aspiration i innych nieprawidłowości. Inne szeroko akceptowane wskaźniki zaburzeń oceniające istnienie szumu aspiracyjnego obejmują stosunek harmonicznych do szumu (HNR), znormalizowaną entropię szumu (NNE), wskaźnik turbulencji głosu oraz stosunek wzbudzenia głośni do szumu (GNE)10.
Te parametry są szczególnie przydatne w wykrywaniu niepełnego domknięcia strun głosowych, które może manifestować się jako słyszalne przedostawanie się powietrza przez niewystarczające zamknięcie głośni6. Analiza tych wskaźników pomaga w różnicowaniu różnych typów zaburzeń głosu.
Proponowany system jest oceniany przy użyciu nagrań sustynowanej samogłoski /a/ pozyskanych z zestawu danych MEEI10. Proponowana technika, która ma umożliwić porównania z inną odpowiednią literaturą, osiąga skuteczność sztucznej sieci neuronowej (ANN) na poziomie 90%10.
Skale percepcyjne i ocena subiektywna
Standardyzowane skale percepcyjne stanowią ważny element diagnostyki, łącząc obiektywne pomiary z subiektywną oceną jakości głosu. W celu standaryzacji terminologii używanej do definiowania dysfoni opracowano różne skale percepcyjne opisujące jakość głosu6.
Skala GRBAS opisuje zaburzenia głosu za pomocą pięciu dobrze zdefiniowanych parametrów: G – stopień ochrypłości; R – chropowatość, słuchowe wrażenie nieregularności drgań strun głosowych; B – oddechowość, słuchowe wrażenie przeciekania powietrza przez niewystarczające zamknięcie głośni; A – głos asteniczny; oraz S – głos napięty6.
Standaryzowana ocena percepcyjna przez przeszkolonego logopedy, na przykład Consensus Auditory Perceptual Assessment of Voice (CAPE-V), stanowi element kompleksowej oceny7. Te narzędzia zapewniają spójność w ocenie między różnymi klinicystami.
Obrazowanie stroboskopowe w analizie funkcjonalnej
Obrazowanie stroboskopowe w połączeniu z analizą akustyczną zapewnia kompleksową ocenę funkcji strun głosowych. Obrazowanie stroboskopowe za pomocą elastycznych endoskopów nosowych lub transoral jest elementem kompleksowej oceny7.
Kombinacja stroboskopii wideo, analizy akustycznej i Wskaźnika Niepełnosprawności Głosu (VHI) pomaga w szczegółowej ocenie nieprawidłowości strun głosowych11. Analiza akustyczna wraz ze stroboskopią wideo służy jako lepsze narzędzie diagnostyczne do kwantyfikacji i kategoryzacji patologii strun głosowych11.
VHI-10 pomaga w ocenie ograniczeń/wpływu na jakość życia (QOL) spowodowanych przez różne patologie strun głosowych11. To połączenie obiektywnych i subiektywnych miar zapewnia holistyczną ocenę stanu pacjenta.
Zaawansowane metody analizy spektralnej
Nowoczesne systemy analizy akustycznej wykorzystują zaawansowane techniki spektralne do szczegółowej oceny charakterystyk głosu. Analiza spektralna umożliwia wizualizację składowych częstotliwościowych sygnału głosowego i identyfikację nieprawidłowości, które mogą nie być słyszalne podczas zwykłej oceny percepcyjnej.
Najnowocześniejsze metody analizują również język mówiony oprócz samogłosek9. To rozszerzenie analizy poza tradycyjne sustynowane samogłoski zapewnia bardziej kompleksową ocenę funkcji głosowej w naturalnych warunkach komunikacyjnych.
Proponowany system osiągnął średni wskaźnik rozpoznawania 99,99% i 99,60% odpowiednio dla wykrywania i klasyfikacji10. Te wysokie wskaźniki dokładności wskazują na potencjał zaawansowanych metod analizy akustycznej w automatyzacji procesu diagnostycznego.
Testy obciążeniowe i ocena wydolności głosowej
Testy obciążeniowe głosu stanowią ważny element oceny funkcjonalnej, szczególnie u osób zawodowo używających głosu. Testy obciążeniowe głosu mogą być używane do tworzenia profili zmian głosowych podczas i po obciążeniu ze stałymi parametrami głośności (poziom ciśnienia akustycznego w dB) i podstawowej wysokości tonu (częstotliwość podstawowa)9.
Te testy pozwalają na ocenę wytrzymałości głosowej i identyfikację subtelnych nieprawidłowości, które mogą nie być widoczne podczas standardowej oceny. Propozycje testów obciążeniowych głosu, ze względu na złożoność zagadnienia, wymagają dalszego udoskonalenia i standaryzacji12.
Nieodzowną częścią tego procesu jest wieloletnie osobiste doświadczenie personelu9. Interpretacja wyników testów funkcjonalnych wymaga znacznej ekspertyzy klinicznej i znajomości normalnych wariantów funkcji głosowej.
Integracja wyników i podejście wielomodalne
Współczesna diagnostyka zaburzeń głosu wymaga integracji wyników z różnych metod analitycznych dla uzyskania kompleksowego obrazu funkcji głosowej. Połączenie analizy akustycznej, pomiarów aerodynamicznych, oceny percepcyjnej i obrazowania stroboskopowego zapewnia najdokładniejszą diagnozę.
Obecność patologii strun głosowych powoduje znaczne zmiany w ich normalnych wzorcach wibracyjnych, co wpływa na powstały głos11. Dokładna i wczesna diagnoza jest potrzebna do właściwego i terminowego zarządzania podstawową patologią strun głosowych11.
Cel tego badania to stworzenie systemu oceny stanu głosu, który jest niezależny od patologii głosowych, a także języka, akcentu, wieku, pochodzenia kulturowego i płci mówcy poprzez wykorzystanie trzech wspólnych deskryptorów z dziesięciu najlepszych deskryptorów13. Ten framework może zostać wprowadzony jako aplikacja na Androida, która może być używana do sprawdzania jakości głosu w życiu codziennym w każdej chwili13.













