Как перевести голосовое сообщение в текст в WhatsApp

199 342
< Журнал

С одной стороны, голосовые сообщения — это очень удобно, не нужно набирать огромный текст. Но с другой, не всегда есть возможность прослушать аудио, например, если вы на совещании или в очень шумном месте. Чтобы каждый раз не просить собеседника переписать сообщение, можно конвертировать его в текст. В статье рассмотрим, как перевести голосовое сообщение WhatsApp в текст. Расскажем как это сделать на Android и iOS, а также дадим советы по повышению точности распознавания.

Встроенные функции ватсапа не позволяют автоматически преобразовать голосовое сообщение в текстовое, поэтому придется скачать специальную программу из магазина приложений. Для каждой операционной системы есть несколько вариантов. Рассмотрим, как перевести аудио с помощью самых популярных приложений.

 

Как перевести голосовое сообщение в текст в WhatsApp на Android

Для Android можно воспользоваться приложением Transcriber. У него есть платная и бесплатная версии — основное отличие в наличии рекламы.

Краткая инструкция по использованию:

  1. Установите приложение Transcriber из магазина Google Play. После запуска изучите интерфейс: там будет храниться история транскрибаций. Настройки менять не нужно.

  2. Перейдите в чат WhatsApp, где находится голосовое сообщение, которое нужно перевести в текст.

  3. Нажмите и удерживайте голосовое сообщение, чтобы вызвать контекстное меню. Затем нажмите кнопку «Поделиться».

Скриншот: выбор опции 'Поделиться' в WhatsApp

  • В списке приложений для обмена выберите Transcriber.

  • Дождитесь, пока приложение загрузит аудио. Алгоритмы автоматически распознают речь и переведут сообщение в текстовый формат.

Другие программы, которые конвертируют аудиосообщения: Speech to text WhatsApp, Audio Message to text for WA. Принцип работы приложений похож на показанный выше: поделитесь голосовым сообщением с программой, и она преобразует его в текст.

 

Как конвертировать аудиосообщение в текст на iOS

Для телефонов Apple есть приложение Scribbn. Оно доступно бесплатно с рекламой. Если вы хотите избежать просмотра рекламных роликов, можно оплатить пакет минут. Самый простой тариф — 99 рублей за 40 минут. Также предоставляется пробный лимит — 900 секунд (15 минут), которого хватит при редком использовании.

Инструкция по переводу аудиосообщения в текстовый формат:

  1. Скачайте приложение Scribbn из официального магазина App Store.

  2. Установите приложение, следуя подсказкам системы.

  3. Изучите интерфейс приложения. Вы можете загрузить и конвертировать любые сохранённые на устройстве аудиофайлы.

  4. Откройте чат (например, WhatsApp, Telegram), в котором находится нужное голосовое сообщение.

  5. Нажмите и удерживайте голосовое сообщение, чтобы вызвать контекстное меню. Затем выберите опцию «Переслать».

  6. После пересылки нажмите на значок «Поделиться» (квадрат со стрелкой вверх).

Скриншот: выбор опции 'Переслать' в мессенджере на iOS

  • В списке приложений выберите Scribbn, чтобы открыть в нём аудиосообщение.

Скриншот: выбор приложения Scribbn при экспорте аудио

  • Приложение автоматически загрузит аудио и конвертирует его в текст с помощью встроенных алгоритмов распознавания речи.

Еще приложения для преобразования голосовых сообщений в текст: Textr, Voicepop. Принцип действия похож на описанный выше: установить и поделиться из чата нужным аудио с программой.

 

Как перевести длинные аудиосообщения в текст

Такая функция или услуга называется транскрибация. Она необходима, когда собеседник продиктовал целую лекцию, а вам нужно это законспектировать. Чтобы не слушать, останавливать и печатать — аудио можно сразу перевести в текстовой формат. Например, с помощью технологии speech-to-text от MANGO OFFICE. Она пригодится, если вы переводите большие объемы голосовых материалов в текст. Для этого нужно будет сохранить аудиосообщение в файлах, а затем загрузить его на сайт.

Узнать больше

Технология speech to text online на 80% сокращает время прослушивания записей, сервис сам формирует отчеты. Помимо расшифровки аудиосообщений, технология позволяет анализировать 100% разговоров с клиентами и собирать данные об эффективности общения в удобный отчет. Система покажет, в каком месте сотрудник или клиент произносили нужные фразы и количество вхождений в разговоре.

Просматривайте разговоры с вхождениями интересующих вас слов. Например, акция, распродажа. Отслеживайте упоминания о ваших конкурентах, либо проверяйте менеджеров на качество общения. Например, кто из сотрудников произносит слова-паразиты. Оставьте заявку, чтобы узнать обо всех полезных функциях и получить расчет.

 

Почему приложения могут неидеально распознать речь

Результат не всегда получается точным, но обычно суть разобрать можно. Приложения не смогут правильно перевести аудио в текст при условиях:

  • Собеседник говорит тихо или на заднем фоне громкие шумы, например, он едет в метро или ветер задувает в динамик.

  • В сообщении используются сокращения или сленг. Приложения попытаются найти схожее слово из своего словаря. Например, аббревиатуру ЖКХ, программы могут перевести как «Жека».

  • Нечеткое произношение слов. Программа попробует транскрибировать это слово как максимально приближенное к общеизвестному.

 

Как поступить, если нет возможности прослушать голосовое сообщение

Если ни один из способов не подошел или нет времени скачивать приложение, есть несколько вариантов: 

  1. Самый простой способ — это попросить собеседника напечатать текст или предупредить, что отложите прослушивание до удобного момента. Возможно, сообщение не так важно послушать сразу, и собеседник подождет пару часов.

  2. Поднесите смартфон к уху. Тогда включится специальный режим, и вы будете слышать аудиосообщение, как будто говорите по телефону. Возможно, в очень шумном помещении вы все равно не сможете отчетливо услышать собеседника.

  3. Подключите наушники. Это не самый быстрый и удобный способ, но если срочно нужно прослушать аудио, а в помещении очень шумно, наушники помогут выйти из ситуации.

 

Используемые продукты и сервисы

Главное о переводе голоса в текст в ватсапе

  • В WhatsApp пока не предусмотрена встроенная функция по переводу аудио в текст, хотя большинство современных телефонов уже умеют преобразовывать речь. 

  • В 2021 году разработчики WA рассказали об идее реализовать функцию перевода голосовых сообщений в текст. Но позднее стало известно, что разработка этого инструмента приостановлена. Пока такой функции нет, можно воспользоваться специальными программами. Но для этого собеседник должен четко произносить текст, без сокращений и аббревиатур, а на заднем плане не должно быть громких звуков. 

  • MANGO OFFICE транскрибирует записи разговоров с помощью робота (искусственного интеллекта). Расшифрованный текст анализируется, помечается метками на основе содержания и добавляется к записям разговора.

< читать Журнал

 

Краткий пересказ статьи от нейросети YandexGPT

Разбор статьи от ИИ Perplexity