Google създаде ИИ, звучащ досущ като човек


Компанията Google публикува ново изследване, в което показва постигнатия напредък в системите за преобразуване на текст в реч (text-to-speech, TTS).

В изследването са показани резултатите на система с елементи на изкуствен интелект, наречена Tacotron 2, за която от компанията твърдят, че е способна „чете“ непознат текст и да го преобразува в глас, който е на практика неотличим от този на истински човек. Но нека не приемаме думите им на доверие, а да се уверим сами!

В един от примерите системата трябва да прочете израза „That girl did a video about Star Wars lipstick.“ По-долу са дадени два прочита на това изречение – единият направен от човек, а другият от машина, която за първи път попада на този текст.


От Google не казват кой прочит е на човек и кой – на машина, така че може би вие ще успеете да хванете разликата.

При друга демонстрация на машината е представен текста „The buses aren’t the PROBLEM, they actually provide a SOLUTION.“ Анализирайки го, тя правилно разбира, че думите, написани с главни букви, означават да се наблегне на тях при прочит:

Системата всъщност съдържа две неврални мрежи. Първата е отговорна за превръщане на текста в спектограма – визуален начин за представяне на честотата на звуците. Втората мрежа получава тези спектограми и на тяхна база генерира съответните звуци. Повече примери могат да бъдат открити на тази страница: https://google.github.io/tacotron/publications/tacotron2/index.html

Tacotron 2 ще намери бързо и непосредствено приложение още в настоящето, като постепенно бъде интегрирана в услугата Google Асистент, която се превръща във все по често използван начин за общуване и изискване на информация от умните устройства наоколо.

© 2015 — 2024
zanaukata.eu

Харесайте ни във Facebook!


Затвори