Как это устройство заставляет глухих читать то, что вы говорите

Последнее обновление Май 9, 2022

К 2050 году число людей с проблемами слуха в мире приблизится к 900 миллионам, и они столкнутся с различными проблемами при общении, потому что немногие люди учат и понимают язык жестов или слуховые аппараты очень дороги.

Чтобы изменить эту ситуацию, Леонсио Хуаман, консультант отдела когнитивных услуг глобального бизнеса в IBM Peru, разработал устройство под названием Vision D.

«Это средство просмотра, которое показывает в тексте то, что говорит собеседник, это как если бы перед вами был субтитр из слов, которые говорит собеседник», – объяснил он в разговоре с Excelsior.

Он объяснил, что Vision D – это не устройство, которое читает по губам людей, на самом деле оно принимает голосовой сигнал и фильтрует его, устраняя внешний шум и отдавая предпочтение более громкому голосу для его обработки и преобразования. в тексте, который позже отображается в средстве просмотра.

Уаман добавил, что Vision D можно разместить в очках любого типа, а экран расположен в сантиметре или полутора сантиметрах от стекла, что позволяет легко читать текст.

Он добавил, что все это возможно благодаря платформе IBM Watson, которая позволяет переходить от речи к тексту и при желании даже добавлять перевод с нескольких языков, чтобы облегчить общение для тех, у кого проблемы со слухом.

Vision D является функциональным и был протестирован с помощью Ассоциации глухой молодежи и подростков Перу, которая для его использования должна нажать кнопку в то время, когда другой человек говорит, чтобы уловить голос через

компьютерный микрофон, он обрабатывается, а затем текст поступает в программу просмотра.

План восхождения

«Это 100% функциональный прототип, и у нас есть план улучшения, чтобы сделать его в меньшем масштабе и более портативным», – добавил разработчик.

Для этого он участвует в таких мероприятиях, как «Новаторы до 35 лет», и ищет финансирование, которое позволит ему приобрести необходимые технологии, чтобы уменьшить его размер, добавить новые функции и получить возможность коммерциализировать его.

Например, вы хотите, чтобы преобразование речи в текст происходило быстрее и в режиме реального времени, добавьте опцию распознавания голосов и установите индикатор, чтобы пользователь знал, кто говорит, а также интегрировать датчики вибрации, чтобы определять, откуда исходит звук. .

«Как только у вас появятся средства, через восемь месяцев у вас будет удобный продукт, который будет разделен на пять месяцев разработки, а затем тесты, чтобы увидеть, как отреагирует пользователь», – сказал он.

Пока вы не получите окончательный продукт, вы сможете установить цену на устройство, однако у вас есть план доставить первые устройства в Ассоциацию глухой молодежи и подростков Перу, которые помогли вам.

В будущем Хуаман считает, что сети пятого поколения (5G) будут иметь важное значение для улучшения работы Vision D, предлагая путь без помех и меньшую задержку для обработки голоса и визуализации текста.

КАК ЭТО РАБОТАЕТ?

Микрофон улавливает звук, чтобы начать процесс.

Это идет на микропроцессор Raspberry Pi и подключение к службе искусственного интеллекта IBM для преобразования речи в текст через облако.

Обработка текста осуществляется благодаря плате Arduino, которая отправляет результат на светодиодный экран.

Текст проецируется на зрителя, находящегося на очках пользователя.

Если запрограммировано, он может переводить на несколько языков.

СОГЛАСНО ВОЗ

466 миллионов человек во всем мире страдают проблемами слуха.

В 2050 году их число может вырасти до 900 миллионов.

Программный код Vision D доступен сообществу разработчиков с открытым исходным кодом, так что они могут эргономично улучшить модель экрана, получать обновления и предложения, которые могут расширить возможности устройства.

—

С информацией из Money in Image

Foto: ***Vision D**

Источник записи: https://www.globalmedia.mx