08 Ноябрь 2017

Цифровой слух

Цифровой слухDon Monroe Communications of the ACM, Vol. 60 No. 10, Pages 18-20

Подобно многим другим технологиям, слуховые аппараты непрерывно совершенствовались в течение последних двадцати лет. Цифровая обработка звука позволила реализовать более сложные и персонализированные функции, что положительно сказалось на удовлетворенности пользователей. Тем не менее, в сложной для общения обстановке, например, на вечеринках, слабослышащему человеку тяжело следить за ходом беседы, так же как и нормально слышащему человеку зачастую нелегко участвовать в оживленной телеконференции.
Компании-производители и независимые исследователи продолжают поиск новых технологий, стараясь понять, как слуховая система человека обрабатывает сложные «звуковые сцены», требующие большего, чем обычное звукоусиление. «Нам нужно не просто восстановить слышимость», – говорит Кристин Джонс, директор Центра аудиологических исследований Phonak в Уорренвилле (штат Иллинойс), – «Нарушение точности звуковосприятия препятствует полному восстановлению слуховой функции, даже если звук вновь стал слышимым».
Кроме того, установлено, что обработка звука происходит у всех по-разному, поэтому невозможно выбрать слуховой аппарат, одинаково удовлетворяющий всех пользователей. По мере накопления информации компании-производители предлагают пути решения вышеуказанных проблем, основанные на новых методиках настройки слуховых аппаратов и индивидуализированных пользовательских элементах управления.

Цифровая революция

Цифровые процессоры сигналов (ЦПС) впервые были применены в слуховых аппаратах в 1996 г. В последующие годы они стали использоваться почти во всех слуховых аппаратах, в первую очередь, благодаря возможности гибкого программирования различных функций.
Например, простое усиление позволяет воспринимать тихие звуки, но громкие звуки становятся дискомфортными. ЦПС позволяет легко настроить усиление и компрессию динамического диапазона в соответствии с индивидуальной потерей слуха на разных частотах. Кроме того, ЦПС подавляет обратную связь, возникающую из-за близкого расположения микрофона и телефона, а также уменьшает ненужные фоновые шумы, такие как шум ветра.
В последние годы производители слуховых аппаратов стали применять технологии частотного понижения. «У пациентов с большими высокочастотными потерями слуха можно сдвинуть высокие частоты в область с частично сохранной функцией восприятия», – говорит Брент Эдвардс, технический директор компании Earlens (Менло-Парк, штат Калифорния). – «Конечно, это своего рода искажение реального звука, но при эффективном его применении можно добиться восприятия определенных фонем слуховой системой».
На протяжении многих лет ученые исследуют и другие стратегии обработки звука, но многие из них остаются в стенах лабораторий из-за серьезных ограничений, обусловленных небольшими размерами устройств и потребностью в низком энергопотреблении для экономии заряда батареи. Кроме того, обработка звука должна выполняться с минимальной задержкой, в частности, потому, что обработанный сигнал должен поступать в ухо одновременно со звуком, прошедшим через обходные каналы (венты), используемые для предотвращения дискомфортного ощущения окклюзии слухового прохода.
В ряде случаев инженеры могут значительно повысить эффективность слуховых аппаратов за счет применения внешних устройств. Например, использование собеседником прикрепленного к одежде микрофона устраняет неблагоприятное воздействие фонового шума, а объединение сигнала нескольких размещенных на столе микрофонов позволяет пользователю активно участвовать в дискуссиях. Внешние акустические колонки также могут обеспечить лучшее пространственное звуковосприятие по сравнению с микрофонами, расположенными в ухе (или у уха). Тем не менее, в повседневной жизни предпочтение отдается небольшим устройствам с малым энергопотреблением.
Одним из вариантов внешних устройств, активно используемых многими людьми, является смартфон. Связав слуховые аппараты с приложением смартфона по каналу Bluetooth, можно воспользоваться многофункциональным и интуитивным интерфейсом, даже при низкой скорости обмена данными. Увеличив скорость передачи данных, можно делегировать смартфону, обладающему более емкой батареей и большой вычислительной мощностью, часть обработки сигнала, однако пока это связано с неприемлемой временнóй задержкой.

Слуховые сцены

Хотя повышение вычислительной мощности слуховых аппаратов приносит неоспоримую пользу, будущие проекты должны выходить за рамки чистой электротехники, чтобы имитировать сложные и уникальные способы обработки и интерпретации звуков людьми. Новая популярная концепция – анализ слуховой сцены. Установлено, что люди воспринимают звук не как комбинацию разных частот, а как отдельные источники, каждый из которых излучает волны со схожими характеристиками. Поэтому слуховые аппараты должны сохранить или акцентировать признаки, помогающие слушателю идентифицировать важные для него источники звука и игнорировать остальные.
В качестве шага на пути к этой цели производители слуховых аппаратов часто используют категоризацию звукового окружения и изменение алгоритмов обработки сигнала в соответствии с текущей категорией. «Мы рассматриваем не менее 12 различных характеристик звука, в том числе, частотный спектр, параметры модуляции и угол поступления звука, вычисляемый путем сравнения сигнала двух микрофонов,» – говорит Френсис Кук, сотрудник отдела исследований клинического звукоусиления (ORCA-USA) компании Widex (Лайл, штат Иллинойс).
На основании этих характеристик можно предсказать наличие в звуковом окружении музыки, речи в тишине, речи на железнодорожной станции и т.п. Обнаруженная слуховая сцена определяет параметры по умолчанию, такие как шумоподавление в шумной обстановке.
Слуховую сцену также можно использовать для формирования луча направленности, например, путем беспроводного объединения звуковых сигналов обоих слуховых аппаратов. Такой подход позволяет преимущественно усилить звуки, поступающие спереди. «Это – одна из самых эффективных наших функций,» – говорит Джонс, – «но, в зависимости от сцены, мы используем разные уровни формирования луча направленности». Например, по мере повышения уровня фонового шума эффективный луч сужается. Однако, если сцена соответствует салону автомобиля, направленность отключается, потому что собеседники могут находиться сбоку или позади слушателя.

Индивидуальные стратегии

Такой автоматический выбор алгоритмов не лишен недостатков. Это обусловлено не только различными индивидуальными предпочтениями, но и различными способами обработки звука мозгом.
«Один из параметров звука, помогающих различить отдельные источники, входящие в слуховую сцену, это общая модуляция звукового сигнала,» – говорит Кук. – «Некоторые люди, особенно те, у кого нарушение слуха сочетается с когнитивными расстройствами, при идентификации источника больше полагаются на временную структуру звуковых волн, например на одновременное увеличение громкости различных по частоте звуков. Слуховые аппараты, быстро реагирующие на повышение уровня сигнала в попытке защитить пользователя от внезапных громких звуков, искажают временную структуру, затрудняя использование этого параметра».
Напряжение и внимание, необходимые для понимания речи, могут оказаться чрезмерными для слабослышащего человека, но их сложно оценить. «Раньше мы говорили, что двумя показателями эффективности слухового аппарата являются разборчивость речи и качество звучания. Теперь можно добавить третий – когнитивное воздействие,» – говорит Эдвардс. – «Некоторые технологии незначительно влияют на разборчивость речи, но снижают когнитивную нагрузку».
Он добавил: «Одна из самых острых тем в современной науке о слухе – так называемая скрытая тугоухость, при которой утрачивается часть нервных окончаний. Способность воспринимать чистые тоны при этом не страдает. Ситуация похожа на потерю половины пикселей в телевизоре высокого разрешения».
«Стандартный тест определения порога слышимости ничего не скажет вам о том, как пациент будет слышать, скажем, в ресторане,» – предупреждает Эдвардс. – «Разрабатывая новые технологии, вы должны разрабатывать и новые методы оценки их эффективности. Это то, что не всегда понимают инженеры. Современные диагностические методы предоставляют далеко не полную информацию о пациенте».

Индивидуальная настройка

Точная настройка давно стала ключевым элементом подбора слухового аппарата, определяющим его окончательную цену. Эдвардс сравнивает этот процесс с настройкой изображения телевизора техником, который не видит картинку, но руководствуется подсказками пользователя. Он говорит: «В настоящее время разрабатываются системы, позволяющие пациенту самостоятельно настраивать слуховые аппараты. Необходимо найти баланс между настройкой, выполненной специалистом на основании результатов диагностики, и пользовательской настройкой».
«Мы неплохо поработали над созданием усредненных алгоритмов, основанных на степени тугоухости и конфигурации аудиограммы», – говорит Джонс, обладающая большим практическим опытом настройки слуховых аппаратов, в том числе, детям с ограниченными коммуникационными навыками. – «Однако два пациента с одинаковыми аудиограммами могут обладать совершенно разными уровнями функционального слухового поведения. Поэтому нельзя забывать о точной настройке, исходящей из их индивидуальных возможностей».
Учитывая высокую стоимость современных слуховых аппаратах (в США она может доходить до 4000 долларов за один аппарат), нельзя не принимать во внимание мнение сторонников более дешевых «безрецептурных» устройств, продаваемых без посредника (ОТС). Изменение законодательства может подвигнуть такие компании, как Dolby или Bose, использовать свой опыт в области потребительской электроники при разработке персональных звукоусиливающих устройств.
«Я не против развития категории OTC если она не будет негативно сказываться на традиционных путях распределения и подбора слуховых аппаратов», – говорит Эдвардс. В свою очередь, Кук предупреждает, что такая безрецептурная продукция вряд ли будет обладать сложными и основанными на медицинских исследованиях функциям, как слуховые аппараты, в частности, предлагаемые его компанией. Напротив, он сравнивает их с очками для чтения, продаваемыми в обычных аптеках.
«Как аудиолог, я не уверена, что покупка безрецептурной продукции положительно скажется на большинстве слабослышащих людей», – соглашается Джонс, – «хотя при незначительных проблемах со слухом такой подход может оказаться приемлемым. Большинство клиентов полагаются на опыт и знания аудиолога, настраивающего слуховые аппараты в соответствии с их потерей слуха и индивидуальными потребностями».

Различение источников звука

«Несмотря на технологический прогресс, пользователи слуховых аппаратов все еще испытывают серьезные проблемы, пытаются различить нужный голос в шуме других голосов», – говорит Делан Ванг из Университета штата Огайо. – «Любой производитель слуховых аппаратов согласится, что проблема коктейльной вечеринки не решена, но требует решения».
В своей лаборатории Ванг с коллегами разделяют аудиопоток на сегменты длиной 20 мс в разных частотных диапазонах и проверяют, какие из них играют важную роль в понимании речи, а какими можно пренебречь в шумной обстановке. Подобная двоичная классификация с одновременной маскировкой применяется для повышения эффективности звуковой кодировки МР3. «После формулирования проблемы классификации можно воспользоваться современными методами машинного обучения, в частности, нейронными сетями», – говорит Ванг. Лабораторные исследования показали, что маскировка «зашумленных» фрагментов значительно повышает разборчивость речи.
Если результаты подобных исследований удастся применить в реальных устройствах, можно будет помочь мозгу слушателя выделить нужные источники звука в сложной акустической обстановке. «Однако, если помеха также представляет собой речь», – говорит Джонс, – «подобное разделение окажется неэффективным. Придется разделять целевой сигнал и помеху, исходя из направления и, возможно, уровня сигналов. Это серьезная проблема».
Несмотря на перечисленные проблемы, «уровень удовлетворенности клиентов своими слуховыми аппаратами намного выше, чем несколько лет назад, особенно в доцифровую эпоху», – говорит Кук. Он уточняет: «По данным опроса, проведенного по инициативе производителей, почти 90% сегодняшних пользователей заявляют о своей удовлетворенности слуховыми аппаратами. Но удовлетворенность – это движущаяся цель. По мере совершенствования технологий, ожидания пользователей в отношении удовлетворенности слуховыми аппаратами также возрастают».