Google създаде ИИ, звучащ досущ като човек
Компанията Google публикува ново изследване, в което показва постигнатия напредък в системите за преобразуване на текст в реч (text-to-speech, TTS).
В изследването са показани резултатите на система с елементи на изкуствен интелект, наречена Tacotron 2, за която от компанията твърдят, че е способна „чете“ непознат текст и да го преобразува в глас, който е на практика неотличим от този на истински човек. Но нека не приемаме думите им на доверие, а да се уверим сами!
В един от примерите системата трябва да прочете израза „That girl did a video about Star Wars lipstick.“ По-долу са дадени два прочита на това изречение – единият направен от човек, а другият от машина, която за първи път попада на този текст.
От Google не казват кой прочит е на човек и кой – на машина, така че може би вие ще успеете да хванете разликата.
При друга демонстрация на машината е представен текста „The buses aren’t the PROBLEM, they actually provide a SOLUTION.“ Анализирайки го, тя правилно разбира, че думите, написани с главни букви, означават да се наблегне на тях при прочит:
Системата всъщност съдържа две неврални мрежи. Първата е отговорна за превръщане на текста в спектограма – визуален начин за представяне на честотата на звуците. Втората мрежа получава тези спектограми и на тяхна база генерира съответните звуци. Повече примери могат да бъдат открити на тази страница: https://google.github.io/tacotron/publications/tacotron2/index.html
Tacotron 2 ще намери бързо и непосредствено приложение още в настоящето, като постепенно бъде интегрирана в услугата Google Асистент, която се превръща във все по често използван начин за общуване и изискване на информация от умните устройства наоколо.