Наверх

Facebook представила систему распознавания речи

Главная страница Социальные сети
12 Punto 14 Punto 16 Punto 18 Punto

Facebook разработала систему распознавания речи wav2vec Unsupervised (wav2vec-U). В компании заверяют, что технология не требует транскрибированных данных; в нее можно просто загрузить образцы речи и случайный текст на нужном языке. Система сама распознает слова и фразы и соотнесет их со словарем.

Как передает Axar.az, Wav2vec-U начинается с изучения структуры речи в представленном отрывке аудио. Система разбивает запись на речевые единицы, которые приблизительно соответствуют отдельным звукам. Чтобы научиться распознавать слова в аудиозаписи, Facebook обучила генеративную состязательную сеть (GAN). Генератор берет каждый аудиосегмент и предсказывает фонему, соответствующую звуку на языке. Первоначально транскрипции получались очень плохие, признают в компании, но со временем и с учетом обратной связи дискриминатора они стали точнее.

Facebook протестировала wav2vec-U на таких языках, как суахили и татарский, для которых в настоящее время недоступны высококачественные модели распознавания речи, поскольку им не хватает данных для обучения. Система показала на 63% меньше ошибок, чем предыдущая аналогичная технология. В качестве исходных данных в нее загрузили почти 10 часов речи и 3 000 написанных фраз.

Новая модель Facebook AI - это последняя разработка за несколько лет работы над моделями распознавания речи. Ее предшественниками стали wav2letter, wav2vec, Librilight, wav2vec 2.0, XLSR и wav2vec 2.0.

Дата
2021.05.23 / 09:57
Автор
Axar.az
Комментарии
Смотрите также

Хотят ли в Азербайджане закрытия TikTok?

В Украине заблокировали 200 YouTube-каналов

В Казахстане хотят запретить TikTok

В WhatsApp появилась новая функция

В WhatsApp новая функция

В этой стране закрывают TikTok

В России хотят запретить TikTok

В Азербайджане взялись за тиктокеров

Apple начала блокировать Telegram

Азербайджанцев призвали к бдительности - Видео

Лента новостей
  
  
  
Bize yazin Bağla
ArxivBağla