12 Февраль 2017

Влияние когнитивных факторов на результаты использования частотного понижения

Jennifer Schumacher, AuD
Источник: Schumacher, J. (2016, March). The influence of cognitive factors on outcomes with frequency lowering. AudiologyOnline, Article 16425.

Введение

После того, как частотное понижение стало доступным в коммерческих цифровых слуховых аппаратах, исследователи задались вопросом о преимуществах, которые эта технология обеспечивает слабослышащим пациентам. Литература изобилует противоречивыми данными по этому вопросу (Simpson, Hersbach, McDermott, 2005, 2006; Glista и др., 2009; Ching и др., 2013; Alexander, Kopun, Stelmachowicz, 2014). С достоверностью можно сказать, что частотное понижение – не панацея для пациентов с нарушениями слуха. Установлено, что результаты применения частотного понижения зависят от порогов слышимости, наклона аудиограммы, параметров частотного понижения и опыта использования этой технологии пациентом (McCreery,Venediktov, Coleman, Leech, 2012; Alexander, 2013a). Однако, строгой зависимости результатов использования частотного понижения от перечисленных факторов нет.

В последние годы все чаще обсуждается тема влияния когнитивных способностей пациента на успех слухопротезирования (Akeroyd, 2008; Lunner, Rudner, Ronnberg, 2009). Известно, что слух включает в себя сложные процессы, выходящие за рамки периферической слуховой системы, и что эти процессы протекают у разных людей по-разному. Когнитивные процессы, связанные с пониманием речи, можно представить как конечное множество ресурсов, предназначенных для обработки речи и хранения услышанного речевого материала в краткосрочной памяти (Lunner и др., 2009). Из-за конечности этих ресурсов вовлечение большего их числа в обработку речи означает сокращение числа ресурсов, доступных для краткосрочного хранения информации (Lunner и др., 2009).

Для количественной оценки способности обработки информации отдельными людьми можно воспользоваться специфическими когнитивными тестами. Затем можно проанализировать результаты этих тестов в привязке к показателям выполнения таких слуховых задач, как разборчивость речи или слуховое напряжение, при использовании различных функций или алгоритмов слуховых аппаратов. На данный момент установлена взаимосвязь индивидуальных когнитивных способностей слушателя с обработкой сигнала в слуховом аппарате (Lunner, Sundewall-Thoren, 2007; Cox, Xu, 2010; Sarampalis, Kalluri, Edwards, Hafter, 2009). В частности, люди, испытывающие сложности с выполнением задач, связанных с рабочей памятью, хуже воспринимают функции слуховых аппаратов, требующие большей нагрузки по обработке информации (Lunner, Sundewall-Thoren, 2007; Cox, Xu, 2010; Foo, Rudner, Ronnberg, Lunner, 2007).

В настоящей статья мы рассмотрим существующие доказательства взаимосвязи когнитивных способностей с результатами применения частотного понижения, а также вытекающие отсюда практические аспекты.

Что такое частотное понижение?

Алгоритмы частотного понижения изменяют исходный акустический сигнал с целью обеспечения слышимости высокочастотных звуков, неслышимых при традиционном звукоусилении. Для этого высокочастотные звуки "перемещают" в более низкочастотную область с пригодным для коррекции слухом. Сторонники частотного понижения надеются, что оно поможет обнаруживать высокочастотные звуки и, следовательно, понимать речь. Для частотного понижения в современных слуховых аппаратах используются различные методы обработки сигнала (Alexander, 2013a).

Один из этих методов представляет собой частотную транспозицию. Вначале идентифицируется область высокочастотных сигналов, находящихся выше некоторой граничной частоты. Этот диапазон не усиливается; вместо этого, пиковый сигнал транспонируется в более низкочастотную область, на одну-две октавы ниже исходной частоты перемещаемого сигнала. Гармоническая структура перенесенного пикового сигнала сохраняется.

С частотной транспозиций схожа частотная трансляция. Как и при транспозиции, обнаруженный в высокочастотной области пиковый звук переносится в частотную область, расположенную ниже граничной частоты. При этом алгоритм понижения частоты высокочастотного сигнала позволяет сохранить его исходную гармоническую структуру. Однако, в отличие от транспозиции, усиливается весь частотный диапазон слухового аппарата, включая высокочастотную область, из которой были "перенесены" звуки. В современных версиях данной функции понижение частоты активируется только в определенных акустических условиях, например, только для сигналов, содержащих речь (Alexander, 2013a).

Частотная компрессия отличается как от транспозиции, так и от трансляции. Вместо копирования высокочастотных звуков в низкочастотную область, изменяется спектральное соотношение входных и выходных высокочастотных сигналов. Это позволяет вместить больший диапазон высокочастотных звуков в суженный частотный диапазон пациента, подобно тому, как амплитудная компрессия позволяет вместить широкий диапазон интенсивностей в суженный динамический диапазон слабослышащего человека. Вся обработка происходит в диапазоне, находящемся выше граничной частоты (в данном случае ее можно считать порогом частотной компрессии).

Стратегии, используемые при частотной компрессии, можно разделить на линейные и нелинейные. Линейная частотная компрессия сохраняет постоянное соотношение частот входного и сжатого выходного сигналов. Напротив, нелинейная компрессия сжимает высокие частоты в большей степени, чем частоты, расположенные ближе к порогу компрессии (Phonak, 2013).

Влияют ли когнитивные показатели на результаты частотного понижения?

Важно помнить, что задача частотного понижения состоит в улучшении слышимости высокочастотных звуков, но "расплатой" за это служит нарушение частотного и амплитудного состава исходного сигнала (Kates, Arehart, Souza, 2013). Такое искажение сигнала способно улучшить слышимость, но может потребовать бóльших когнитивных затрат от слушателя. Напомним (см. Введение), что дополнительные затраты на обработку сигнала сокращают ресурсы, доступные для краткосрочного хранения информации, становясь существенным препятствием для тех пользователей, у которых решение задач краткосрочной памяти уже требует привлечения дополнительных ресурсов.

В свете вышесказанного можно предположить:
  • Частотное понижение требует привлечения бóльших когнитивных ресурсов по сравнению с традиционным звукоусилением, для того, чтобы поддержать разборчивость речи на должном уровне.
  • Чем больше искажение сигнала (обусловленное окружающим шумом или более агрессивными настройками частотной компрессии), тем ниже показатели разборчивости речи.
  • Люди с низкими показателями рабочей памяти реагируют на частотное понижение хуже, чем их ровесники с лучшей рабочей памятью.
Для исследования возможной взаимосвязи частотного понижения и когнитивных показателей Daneman и Carpenter (1980) разделили участников своего исследования на группы с "низкими" и "высокими" когнитивными способностями, воспользовавшись для этого тестом "диапазона чтения". Все участники исследования успешно прошли скрининг когнитивного функционирования, поэтому термины "низкие способности" и "высокие способности" относятся к нормальным вариациям рабочей памяти, не являясь показателем общего когнитивного функционирования. Затем показатели разборчивости речи и задач на качество звука, полученные с частотной компрессией и без нее, сравнивали между группами с "плохой" и "хорошей" рабочей памятью.

Arehart, Souza, Baca, Kates (2013) изучали влияние рабочей памяти на понимание речи, подвергшейся частотной компрессии. Участниками исследования были пожилые люди, поделенные на группы с плохой и хорошей рабочей памятью. Значимых различий возраста и порогов слышимости между группами не было. В качестве стимулов использовали речевой материал, подвергшийся компрессии при трех вариантах порога (2, 1.5, 1 кГц) и трех коэффициентах компрессии (3:1, 2:1, 1.5:1); для сравнения использовали традиционное усиление; все варианты сигнала предъявляли в тишине и на фоне речевого шума при различном отношении сигнал-шум (-10, -5, 0, +5 и +10 дБ ОСШ). В среднем показатели разборчивости речи ухудшались по мере увеличения искажений (более низкое ОСШ и более агрессивная частотная компрессия). Возраст также влиял на результаты – показатели более пожилых испытуемых были хуже, чем у более молодых. Кроме того, результаты зависели от объема рабочей памяти. Испытуемые из группы с хорошей рабочей памятью справлялись с задачей лучше, чем испытуемые из группы с плохой рабочей памятью. Это было особенно заметно при большем искажении стимулов; испытуемые с хорошей рабочей памятью были менее восприимчивы к искажениям, обусловленным частотным понижением и шумом, чем испытуемые с плохой рабочей памятью.

В другом исследовании не было найдено взаимосвязи рабочей памяти с разборчивостью речи, подвергшейся частотной компрессии (Ellis, Munro, 2013, 2015). Ellis и Munro (2013) изучили показатели рабочей памяти и эффективность частотной компрессии, воспользовавшись тестом разборчивости речи в шуме. Авторы применяли фиксированный порог компрессии (1.6 кГц) при двух вариантах коэффициента компрессии (2:1 и 3:1), но, в отличие от Arehart и др. (2013), участники исследования были нормальнослышащими. Объем рабочей памяти не влиял на показатели разборчивости речи, подвергшейся частотной компрессии. Отличие результатов, полученных в данной работе, от результатов Arehart и др. (2013), по-видимому, можно объяснить взаимодействием порогов слышимости и когнитивных способностей. Souza, Arehart, Shen, Anderson, Kates (2015) проанализировали данные Arehart и др. (2013) и обнаружили взаимодействие рабочей памяти и порогов слышимости. Испытуемые с худшей рабочей памятью и худшими порогами слышимости демонстрировали наихудшие результаты в тесте с частотной компрессией.

Ellis и Munro (2015) проводили аналогичное исследование у людей с нарушенным слухом. В отличие от предыдущих работ (Ellis, Munro, 2013; Arehart и др., 2013), настройки частотной компрессии были индивидуальными для каждого пациента. Нередко они были более консервативными по сравнению с использовавшимися в исследовании Arehart и др. (2013). Не было обнаружено влияние рабочей памяти на распознавание подвергшейся частотной компрессии речи. Вполне возможно, что индивидуальная, более консервативная настройка частотной компрессии сводит к минимуму возникающие искажения и не требует привлечения такого количества когнитивных ресурсов, которое существенно зависело бы от объема рабочей памяти.

Вероятно, когнитивные факторы не оказывают значимого влияния на оценку качества речи, подвергшейся частотной компрессии. В ряде работ изучалась зависимость оценки качества звучания компрессированной речи от различных факторов (Kates и др., 2013; Souza, Arehart, Shen, Anderson, Kates, 2013; Souza и др., 2015). Согласно полученным данным, оценка качества звучания во многом определялась количеством искажений в сигнале, подвергшемся частотной компрессии. Более агрессивные настройки компрессии (низкий порог компрессии, высокий коэффициент компрессии) сопровождались худшими показателями разборчивости речи и более низкими оценками качества звучания (Kates и др., 2013; Souza и др., 2013; Souza и др., 2015). Добавление шума (по сути, дополнительного искажения) к речи приводило к еще большему снижению оценки качества звучания. Обнаружено суммирование воздействия шума и более агрессивных параметров компрессии (Souza и соавт., 2015).

Несколько иначе подошли к изучению когнитивных способностей и частотного понижения Kokx-Ryan и др. (2015). Вместо измерения емкости рабочей памяти и ее категоризации на высокую и низкую, проводилось непосредственное измерение когнитивных способностей в ходе тестирования разборчивости речи. Испытуемые выполняли тест разборчивости речи в тишине и в шуме. Объем доступных "незадействованных" когнитивных ресурсов измерялся посредством одновременно проводимого дополнительного теста на время реакции. Более высокие показатели этого дополнительного теста свидетельствуют о наличии свободных когнитивных ресурсов и, соответственно, меньших усилиях, затрачиваемых на выполнение теста с разборчивостью речи. Испытуемым предлагалось пройти это двойное тестирование с частотной компрессией и с традиционным звукоусилением. Перед проведением исследования настройки частотной компрессии оптимизировали для каждого испытуемого, выбирая вариант, соответствовавший наилучшему распознаванию согласных звуков.

Не обнаружено влияния частотной компрессии ни на один из измерявшихся показателей. Средняя разборчивость речи в тишине и в шуме, а также среднее время реакции в тишине и в шуме были одинаковыми, независимо от включения или выключения частотной компрессии. Было бы любопытно узнать у испытуемых, как они оценивают собственное слуховое напряжение в ходе выполнения заданий. Возможно, удалось бы обнаружить некую взаимосвязь, как это было в исследовании Sarampalis и др. (2009), изучавших разборчивость речи при включенном и выключенном шумоподавлении. Показатели разборчивости были одинаковыми в обоих случаях, но испытуемые положительно отзывались о шумоподавлении с точки зрения слухового напряжения.

Souza и др. (2015) использовали нелингвистический показатель времени реакции при сравнении разборчивости речи с включенной и выключенной частотной компрессией. Как и в работе Kokx-Ryan и др. (2015), корреляция между временем реакции и разборчивостью речи отсутствовала. Возможно, это объясняется нелингвистическим характером дополнительной задачи.

Что это означает для пациентов?

Анализируя приведенные выше исследования, можно прийти к двум выводам. Во-первых, принимая решение об использовании частотного понижения, по крайней мере, в некоторых случаях, необходимо учитывать не только демографические (возраст) и периферические (пороги слышимости) факторы, но и когнитивный статус пациента (Kates и др., 2015). Во-вторых, важно свести к минимуму искажения, связанные с частотным понижением, как с точки зрения настроек, так и в плане реализации самой этой функции.

Было бы целесообразно дополнить стандартное обследование тестированием разборчивости речи в шуме [например, тест QuickSIN (Killion, Niquette, Gudmundsen, Revit, Banerjee, 2004)] для оценки способности пациента понимать искаженную шумом речь. Установлено, что показатели теста QuickSIN наилучшим образом прогнозируют разборчивость речи, подвергшейся частотной компрессии (Kates и др., 2013). Не исключено, что результаты QuickSIN можно рассматривать как показатели "восприимчивости" к искажениям, независимо от того, связаны ли они с шумом или с особенностями обработки сигнала. Пациенты с низкими показателями QuickSIN могут испытывать затруднения при использовании алгоритмов частотного понижения.

В настоящее время нет клинических средств оценки объема рабочей памяти. Однако, специалисты могут воспользоваться скрининговыми тестами оценки общих когнитивных функций, например, Mini Mental State Examination (MMSE; Folstein, Folstein, McHugh, 1975). Хотя этот тест не измеряет объем рабочей памяти, он может выявить пациентов с общим дефицитом когнитивных функций. У таких пациентов следует с осторожностью пользоваться технологиями, модифицирующими исходный сигнал, в том числе, частотным понижением.

Не исключено, что в дальнейшем можно будет пользоваться объективными средствами выбора оптимальных настроек частотного понижения для конкретных пациентов (Kirby, Brown, 2015). Пока же рекомендуется выбирать минимальные параметры частотного понижения, необходимые для обеспечения слышимости высокочастотных звуков (Alexander, 2013b) и приводящие к минимальным искажениям (Stender, Groth, 2014). Результаты обсуждавшихся в данной статье исследований поддерживают эту рекомендацию. Напомним, что бóльшая частотная компрессия сопровождалась худшей разборчивостью речи и низкими показателями качества звучания (Arehart и др., 2013; Souza и др., 2013; Souza и др., 2015). Ни в одной из публикаций не указаны конкретные параметры частотного понижения; каждый случай требует индивидуального подхода. Кроме того, без верификации невозможно определить, какие настройки обеспечивают минимальные искажения у конкретного пациента.

Сведение к минимуму искажений должно стать одним из основных принципов разработки новых вариантов частотного понижения. Например, алгоритм Resound SoundShaper подразумевает линейную частотную компрессию, способствующую сохранению гармонической структуры сжатого речевого сигнала и поддержанию качества звучания (Haastrup, 2013). Кроме того, высокочастотные звуки подвергаются компрессии только в том случае, если они содержат речь. Программа настройки предлагает активировать SoundShaper, если степень и наклон высокочастотной тугоухости предполагают возможный положительный эффект данной функции, но активация SoundShaper производится только специалистом вручную. Параметры настройки SoundShaper позволяют специалисту индивидуализировать параметры частотной компрессии, одновременно предотвращая избыточную компрессию высокочастотных звуков.

Заключение

Мы постоянно расширяем наши знания о влиянии многих факторов, в частности, когнитивных способностей, на результаты слухопротезирования. Частотное понижение становится широко используемой технологией, поэтому мы должны тщательно взвешивать потенциальные преимущества и риски ее применения у конкретных пациентов.

Литература
  • Akeroyd, M. (2008). Are individual differences in speech reception related to individual differences in cognitive ability? A survey of twenty experimental studies with normal and hearing-impaired adults. International Journal of Audiology, 47, S53–S71.
  • Alexander, J.M. (2013a). Individual variability in recognition of frequency-lowered speech. Seminars in Hearing, 34, 86-109.
  • Alexander, J.M. (2013b). 20Q: The highs and lows of frequency lowering amplification. AudiologyOnline, Article #11772. Retrieved from: www.audiologyonline.com
  • Alexander, J.M., Kopun, J. G., & Stelmachowicz, P.G. (2014). Effects of frequency compression and frequency transposition on fricative and affricate perception in listeners with normal hearing and mild to moderate hearing loss. Ear & Hearing, 35, 519-532.
  • Arehart, K.H., Souza, P., Baca, R., & Kates, J.M. (2013). Working memory, age, and hearing loss: Susceptibility to hearing aid distortion. Ear & Hearing, 34, 251-260.
  • Ching, T. Y., Day, J., Zhang, V., Dillon, H., VanBuynder, P., Seeto, M., … Flynn, C. (2013). A randomized controlled trial of nonlinear frequency compression versus conventional processing in hearing aids: speech and language of children at three years of age. International Journal of Audiology, 52, S46-S54.
  • Cox, R.M., & Xu, J. (2010). Short and long compression release times: Speech understanding, real-world preferences, and association with cognitive ability. Journal of the American Academy of Audiology, 21, 121–138.
  • Daneman, M., & Carpenter, P.A. (1980). Individual differences in working memory and reading. Journal of Verbal Learning and Verbal Behavior, 19, 450–466.
  • Ellis, R. J., & Munro, K. J. (2013). Does cognitive function predict frequency compressed speech recognition in listeners with normal hearing and normal cognition? International Journal of Audiology, 52, 14–22.
  • Ellis, R. J., & Munro, K. J. (2015). Predictors of aided speech recognition, with and without frequency compression, in older adults. International Journal of Audiology, 54, 467–475.
  • Folstein, M.F., Folstein, S.E., & McHugh, P.R. (1975). Mini-Mental State – Practical method for grading cognitive state of patients for the clinician. Journal of Psychiatric Research, 12, 189–198.
  • Foo, C., Rudner, M., Rönnberg, J., & Lunner, T. (2007). Recognition of speech in noise with new hearing instrument compression release settings requires explicit cognitive storage and processing capacity. Journal of the American Academy of Audiology, 18, 618–631.
  • Glista, D., Scollie, S., Bagatto, M., Seewald, R., Parsa, V., & Johnson, A. (2009). Evaluation of nonlinear frequency compression: Clinical outcomes. International Journal of Audiology, 48, 632–644.
  • Haastrup, A. (2013). Improving high frequency audibility with Sound Shaper. Retrieved from: http://www.resound.nl/~/media/DownloadLibrary/ReSound/Products/LiNX/White,-sp-,paper,-sp-,sound,-sp-,shaper.ashx.
  • Kates, J.M., Arehart, K.H., & Souza,P. (2013).Integrating cognitive and peripheral factors in predicting hearing-aid processing benefit. Journal of the Acoustical Society of America, 134, 4458–4469.
  • Killion, M. C., Niquette, P. A., Gudmundsen, G. I., Revit, L. J., & Banerjee, S. (2004). Development of a quick speech-in-noise test for measuring signal-to-noise ratio loss in normal-hearing and hearing impaired listeners. Journal of the Acoustical Society of America, 116, 2395–2405.
  • Kirby, B.J., & Brown, C.J. (2015). Effects of nonlinear frequency compression on ACC amplitude and listener performance. Ear & Hearing, 36, 261-270.
  • Kokx-Ryan, M., Cohen, J., Cord, M.T., Walden, T.C., Makashay, M.J., Sheffield, B.M., & Brungart, D.S. (2015). Benefits of nonlinear frequency compression in adult hearing aid users. Journal of the American Academy of Audiology, 26, 838-855.
  • Lunner, T., Rudner, M., & Rönnberg, J. (2009). Cognition and hearing aids. Scandinavian Journal of Psychology, 50, 395–403.
  • Lunner, T., & Sundewall-Thoren, E. (2007). Interactions between cognition, compression, and listening conditions: Effects on speech-in-noise performance in a two-channel hearing aid. Journal of the American Academy of Audiology, 18, 604–617.
  • McCreery, R. W., Venediktov, R. A., Coleman, J. J., & Leech, H. M. (2012). An evidence-based systematic review of frequency lowering in hearing aids for school-age children with hearing loss. American Journal of Audiology, 21, 313–328.
  • Phonak. (2013). SoundRecover: Background information from the field of audiology. Retrieved on December 17, 2015 at http://www.phonakpro.com/content/dam/phonakpro/gc_hq/en/resources/evidence/white_paper/documents/Compendium_No3_SoundRecover.pdf.
  • Sarampalis, A., Kalluri, S., Edwards, B., & Hafter, E. (2009). Objective measures of listening effort: Effects of background noise and noise reduction. Journal of Speech Language Hearing Research, 52, 1230–1240.
  • Simpson, A., Hersbach, A. A., & McDermott, H. J. (2005). Improvements in speech perception with an experimental nonlinear frequency-compression hearing device. International Journal of Audiology, 44, 281-292.
  • Simpson, A., Hersbach, A. A., & McDermott, H. J. (2006). Frequency compression outcomes for listeners with steeply sloping audiograms. International Journal of Audiology, 45, 619-629.
  • Souza, P., Arehart, K.H., Shen, J., Anderson, M., & Kates, J.M. (2015). Working memory and intelligibility of hearing-aid processed speech. Frontiers in Psychology, 6, 1-14. doi: 10.3389/fpsyg.2015.00526.
  • Souza, P., Arehart, K.H., Kates, J.M.,Croghan, N.B., & Gehani, N. (2013). Exploring the limits of frequency lowering. Journal of Speech Language Hearing Research, 56, 1349–1363.
  • Stender, T. and Groth, J. (2014). Evidence-based and practical considerations when fitting Sound Shaper for individual patients. Hearing Review, 24, 20-23.

Breadcrumbs