Разработана офлайн-система распознавания речи, работающая с точностью в 97%

Кaк прaвилo, рaзличныe систeмы рaспoзнaвaния рeчи, лиц, пeрeвoдчики и прoчиe испoльзуют oгрoмныe сeрвeрныe мощности интересах своей работы. Однако современные алгоритмы нейросетей помогают вынудить действительно потрясающих результатов. За разработку отвечает систематизирование исследователей из Университета Ватерлоо и стартапа под названием DarwinAI. Их методика получила название EdgeSpeechNets. «В этом исследовании наша сестра используем стратегию создания архитектуры с низким уровнем нагрузки сверху устройство, но со всеми плюсами подхода с использованием мощной нейросети с глубоким машинным обучением.»
Про начала эксперты создали прототип будущей системы, какой-нибудь выполнял распознавание речи, но обладал ограниченным словарным запасом. Присутствие этом он был способен выявлять известные ему ключевые тары-бары даже из очень быстрого потока речи. Немного погодя этого полученные данные использовались для преобразования звукового сигнала в математическую формулу. Сия формула и использовалась в дальнейшем для проектирования нейросети, которая обладала бы высокой производительностью, однако была бы не требовательна к железу. Для сего использовалось хранилище Google Speech Commands, которое заключает 65000 1-секундных звуковых образцов. В итоге одна с версий системы, а именно EdgeSpeechNet-D, показала просто бесподобный результат, достигнув точности в 97% на довольно слабом смартфоне Motorola Moto E c процессором 1,4 ГГц. «EdgeSpeechNet имеет побольше высокую точность распознавания при гораздо низких затратах возьми вычисления. Полученные результаты демонстрируют, что EdgeSpeechNet смогла вымучить самой современной производительности, требуя значительно меньше вычислительной мощности, по какой причине делает их очень подходящими для использования в мобильных устройствах и приложениях.»
Эту и кое-кто новости вы можете обсудить в нашем чате в Телеграм.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *