Частотная модификация в слуховом аппарате – залог лучшего понимания речи

21 Март 2017

Частотная модификация в слуховом аппарате – залог лучшего понимания речи

Источник: Исток-Аудио

Хорст Варнке, журнал «Hörakustik» № 2 за 2016 год

От чего зависит достижение максимально возможной естественности звука? В первую очередь, от разборчивости высокочастотных звуков, которые большинство людей с сильной потерей слуха, к сожалению, не слышит. А без этих звуков невозможно добиться естественности звучания даже в самых продвинутых слуховых аппаратах. Специалисты компании Oticon много лет работают над уникальными стратегиями обработки звука, чтобы помочь слабослышащим людям понимать слова собеседника в условиях сильного окружающего шума.

Мозг и слух

Под общим понятием «brain hearing» специалисты датской компании Oticon аккумулируют знания, полученные из исследований активности мозга. Например, они изучают, почему при одинаковых аудиограммах испытуемые получают неодинаковую пользу, причем это касается различных функций слуховых аппаратов. Результаты этих же исследований подтверждают, что максимально широкая полоса пропускания слуховых аппаратов дает много преимуществ. Это утверждение справедливо и для таких степеней потери слуха, при которых слабослышащий человек принимает лишь малую часть высокочастотных компонентов.

Слышимость высокочастотных речевых звуков

Высокочастотные речевые звуки, такие как /с/, /з/, /в/, /ф/ или /ш/, содержат разную речевую информацию. Но при этом они играют решающую роль в формировании четкости речи (Рис. 1). Эти звуки часто не слышны людям с сильной потерей слуха, что негативно отражается на понимании речи. Особо такая ограниченность может повлиять на речевое развитие детей: не слыша высокочастотные компоненты, дети не могут научиться их произносить. Результатом всегда будет нечеткое, неразборчивое произношение и, как следствие, проблемы при общении с другими людьми.

Рис. 1. Для фразы «Strawberry jam is sweet» («Клубничный джем сладкий») речевые звуки выше или ниже 3 кГц обозначены на рисунке соответственно синим или красным цветом.

Если некоторым слабослышащим слуховые аппараты могут полностью восстановить слышимость, то другим высокочастотного усиления оказывается недостаточно. У этого явления несколько причин:

Такие звуки, как /с/ или /ш/, из-за особенностей их воспроизведения (поток воздуха проходит через узкое место голосового тракта) имеют небольшую энергию (Рис. 2 вверху).
Частотная характеристика сверхмощных слуховых аппаратов на высоких частотах резко падает (Рис. 2 внизу).
Мертвые зоны ограничивают пользу от протезирования слуховым аппаратом. Мертвые зоны – места на базилярной мембране, в которых внутренние волосковые клетки и/или нейроны больше не действуют. Эти участки затрудняют или полностью блокируют понимание речи, а также мешают восприятию окружающих звуков.

Рис. 2. Верхнее изображение показывает относительную речевую энергию (по вертикали) в зависимости от частоты (по горизонтали). Нижнее изображение демонстрирует частотно-зависимое максимальное усиление (по вертикали) на примере слухового аппарата Sensei SP от Oticon. По горизонтали – частота.

Частотная модификация

Если людям с сильной потерей слуха не хватает высокочастотного усиления, решить эту проблему можно с помощью частотной модификации. В специализированной литературе вместо этого термина используется общее понятие «частотное понижение» (Frequency Lowering). Однако более правильным будет именно термин «частотная модификация», так как, во-первых, описываемый метод не является реальным понижением частоты. Во-вторых, слово «понижение» в некоторых языках имеет негативный смысл. Кроме того, следует помнить, что наша цель – не понижение, а повышение степени разборчивости речи.Частотная модификация предоставляет слабослышащим людям те высокочастотные компоненты сигнала, которые им не слышны, в более низком частотном диапазоне. Доказано, что частотная модификация в некоторых случаях позволяет улучшить понимание речи как в тихой, так и в шумной обстановке. Каждый производитель реализует этот алгоритм по-своему. Как правило, речь идет о том, чтобы переместить оригинальный высокочастотный диапазон в целевую область, которая находится в слышимом, более низкочастотном диапазоне. Важнейшие методы модификации представлены на Рис. 3

Рис. 3. Обзор важнейших методов частотной модификации.

Рассмотрим подробнее составляющие частотной модификации.

Частотная компрессия. Оригинальная область выше стартовой частоты сжимается, а верхняя граничная частота перемещается вниз. Таким образом, все сигналы между стартовой и верхней граничной частотой будут сжаты и изменены. Доля высокочастотных компонентов при этом сильно уменьшается, что используется для дополнительного подавления самовозбуждения. Из-за относительно сильного изменения сигнала время привыкания к таким слуховым аппаратам увеличивается.
Частотный перенос. Оригинальная высокочастотная область «вырезается» и копируется в области средних частот. В целевой области происходит перекрывание сигналов, что может привести к возникновению артефактов и изменению тембра. Остальной частотный диапазон не затрагивается. Этот метод отличается меньшим изменением звука, чем компрессия, однако и здесь также снижается качество воспроизведения высоких частот.
Частотная композиция. Высокочастотная оригинальная область копируется в целевой области. Однако в отличие от предыдущих методов, здесь сохраняется весь частотный диапазон. Таким образом, сигналы передаются с наименьшими слышимыми изменениями звука. Метод, описанный ниже, использует именно частотную композицию.

Speech Rescue

Метод частотной композиции от Oticon называется Speech Rescue. Высокочастотные неслышимые компоненты копируются и добавляются с минимальным перекрыванием в частотный диапазон, воспринимаемый слабослышащим человеком. Основанный на стратегиях Brain Hearing, этот метод реализует три принципа:
Максимальное содержание в целевой области. Speech Rescue использует естественные динамические характеристики речи: в присутствии высокочастотных речевых компонентов в диапазоне средних частот речевая энергия за счет образования гласных практически отсутствует (Рис. 1). Поэтому Speech Rescue не сжимает речь, а «копирует» высокочастотные компоненты из оригинальной области и добавляет их в частотный диапазон, который воспринимает слабослышащий. Два-три скопированных «частотных пакета» добавляются из дальнего высокочастотного диапазона в более узкую целевую область, т.е. фактически складываются в штабель (одно из значений английского слова «compose» – складывать). Благодаря этому целевая область перекрывается в минимальной степени (Рис. 4).

Рис. 4. Разные частоты активируют в слуховой коре разные зоны. Speech Rescue копирует высокочастотные области (фиолетовый цвет) и добавляет их к воспринимаемым среднечастотным областям (зеленый цвет). Теперь мозг может обрабатывать звуки.

Максимальное сохранение естественности. Speech Rescue работает без прямой компрессии. Это позволяет сохранить гармонические обертоны из целевой и оригинальной областей, так как гармонические обертоны высокочастотных согласных добавляются к обертонам гласных с сохранением структуры. Звук становится более естественным.
Максимальное сохранение оригинальной области. Speech Rescue продолжает акустическую стимуляцию оригинальной области. Передача высоких и средних частот осуществляется параллельно. При этом транслируется максимальное количество информации. Слабослышащий получает оптимально возможную широкополосную передачу и хорошее качество звука. На Рис. 5 показано действие Speech Rescue в спектральном представлении. В той области, в которой из-за отсутствия гласных передается мало энергии, находится место для копирования высокочастотных компонентов.

Рис. 5. Слева представлен спектр звука /с/ без Speech Rescue, справа – со Speech Rescue.

Speech Rescue в настройке слуховых аппаратов

Слухопротезист может настроить частотную композицию при помощи около 140 разных комбинаций или настроек параметров. В настроечной программе (Genie версии 2015.2 или выше) для этого имеются соответствующие рабочие инструменты. В связи с тем, что мы по-прежнему отталкиваемся от правила, что максимально широкая полоса пропускания предоставляет лучшую поддержку даже в сомнительных случаях, Speech Rescue в программе Genie деактивирована при стандартной настройке. Рекомендуем включать ее только тогда, когда для слышимости высоких частот не хватает традиционного усиления. После активации частотная композиция начинает работать непрерывно. Программа настройки предложит создать конфигурацию на основе тональной аудиограммы, которая маркируется целевым символом (Рис. 6).

Рис. 6. Программа настройки Genie предлагает много возможностей для индивидуальной настройки Speech Rescue. Свое предложение программа маркирует целевым символом.

Тональная аудиограмма сравнивается с усиливаемым речевым спектром. На его основе определяется максимальная слышимая частота, при которой усиливаемый спектр находится ниже порогов слышимости клиен та. То есть максимальная слышимая частота представляет собой точку пересечения порога слышимости с верхней ограничительной линией усиленного речевого спектра. Программа Genie выбирает из десяти возможных конфигураций те, у которых верхняя частота примерно соответствует максимальной слышимой частоте (Рис. 7).

Рис. 7. Максимальная слышимая частота – точка, в которой усиленный речевой спектр уже не превышает порог слышимости.

Десять возможных комбинаций из оригинальной и целевой областей ориентируются на избирательное частотное разрешение базилярной мембраны, т.е. на слуховые фильтры. Эти фильтры определяются шириной кохлеарных полосных фильтров, возрастают в логарифмической зависимости в сторону высоких частот и приводятся в единицах ERB (equivalent rectangular bandwidth, эквивалентная прямоугольная ширина полосы). В соответствии с этим естественным распределением ощущений компоненты, копируемые из оригинальной области в область средних частот, добавляются и кодируются заново таким образом, что в этой области вновь возникает логарифмическое распределение. При этом воспринимаемая ширина полосы оригинальной области (4-5 ERB) примерно соответствует ширине полосы целевой области (3 ERB). Так достигается наименьшая компрессия копируемого сигнала. Для конфигураций с первой по пятую оригинальная область делится на три подобласти, которые копируются друг на друга (складываются в штабель) в очень узкой целевой области на линейной шкале. Конфигурации с шестой по десятую осуществляют копирование в целевую область, которая шире располагается на линейной шкале, поэтому здесь функция работает только с двумя подобластями (Рис. 8). Оригинальная область доходит до 10 кГц, что дает возможность передавать такие частотные диапазоны, которые до сих пор невозможно было передать при помощи сверхмощных слуховых аппаратов. Если попросить нормально слышащих людей оценить звук при наивысшей интенсивности частотной композиции, то они воспринимают его воспроизведение как слабый шепот. Слухопротезист может оценить это явление самостоятельно, но обязательно с соблюдением мер предосторожности, так как настройка осуществляется для сверхмощных аппаратов.

Рис. 8. Конфигурации Speech Rescue.А) Оригинальная область (серый цвет) разделяется и «складывается штабелем»или копируется друг на друга по стрелочке в целевую область (красный цвет).Этот пример соответствует пятой конфигурации. В) Десять возможных комбинаций оригинальной и целевой области. С) Соответствующие частотные области.

Точная настройка

После активации Speech Rescue можно оптимизировать настройку. Если после одобрения предложения, которое сделала программа настройки, такие высокочастотные звуки, как /с/ или /ш/, по-прежнему не слышны, то необходимо выбрать другую конфигурацию. Для этого регулятор сдвигается влево до тех пор, пока эти звуки не начнут восприниматься. Это проверяется посредством произношения звука /с/. В некоторых системах измерений в реальном ухе, таких как Verifit и Affinity, эти сигналы уже предлагаются, и слухопротезист с их помощью может провести объективную проверку пользы настроенного слухового аппарата. В аудиологическом представлении в программе настройки можно использовать для визуального отображения вид сигнала «Речевой звук С» или «Речевой звук Ш» (Рис. 9). После этого для оптимизации результата можно варьировать интенсивность: «резкость» для звука С при этом будет изменяться (Рис. 6). Согласно стандарту настройки слуховых аппаратов, высокочастотное усиление включено всегда. Если слабослышащему усиление высоких частот неприятно, его можно снизить с помощью триммера настройки или полностью отключить щелчком мышки (Рис. 6). При асимметричных потерях слуха Speech Rescue необходимо настраивать отдельно для каждого уха.

Рис. 9. В отображении в программе настройки можно выбрать вид сигнала «Речевой звук Ш», чтобы визуально показать действие Speech Rescue.

Функции Speech Rescue и Speech Guard

Слуховые аппараты, обладающие обеими функциями Speech Rescue и Speech Guard, наилучшим образом поддерживают функционирование мозга в процессе понимания (Рис. 10). Speech Rescue «спасает» неслышимые высокочастотные компоненты сигнала посредством копирования «частотных пакетов» в слышимую среднечастотную область. Speech Guard 2.0 принимает эти «спасенные» частотные пакеты и усиливает их максимально линейно в индивидуальном динамическом диапазоне таким образом, чтобы сохранить речевую огибающую. В итоге частотная композиция сохраняет больше динамики, контраста и нюансов, чем традиционные методы компрессии.

Рис. 10. Сочетание Speech Rescue и Speech Guard обеспечивает наилучшую передачу речи.

Значимость метода для людей с сильными потерями слуха

Речевая огибающая может очень точно отображаться в слуховой коре моз га. Чем лучше она отображается, тем качественнее разборчивость речи. Поэтому выбор стратегии компрессии является одновременно и ключом к пониманию речи. Это имеет большое значение при протезировании людей с сильной потерей слуха, так как они из-за ухудшенного частотного разрешения могут понимать речь и отличать звуки друг от друга преимущественно на основе временной информации.

Заключение

При протезировании людей с сильной потерей слуха необходимо стремиться к тому, чтобы звуки в слуховых аппаратах звучали максимально естественно. Это же относится и к широкой частотной передаче. Сегодня частотная передача в диапазоне до 10 кГц возможна и для сверхмощного протезирования, поскольку слухопротезист имеет в своем арсенале различные возможности для точной настройки Speech Rescue. Пользователи при этом слышат большее количество речевых нюансов, понимание речи заметно улучшается, а слуховые усилия заметно уменьшаются. В итоге слабослышащий человек гораздо меньше устает во время разговора.