Google w newsletterze wysłanym do twórców Actions on Google ogłosił, że w dniach od 4 do 11 marca będzie robił update głosów dostępnych w Google Assistant. Co to tak naprawdę oznacza?

Google Assistant będzie brzmiał bardziej… ludzko.

Jednym z wyzwań związanych z rozwojem technologii głosowej (a tym samym również asystentów głosowych) jest przetwarzanie i interpretowanie mowy oraz tworzenie modeli Text-To-Speech, które brzmią jak człowiek, a nie maszyna.

Technologia, która będzie wspierała nowe głosy Google Assistant to WaveNet – jedno z topowych rozwiązań TTS dostępnych na rynku. W badaniu, w którym mierzono subiektywną jakość dźwięku na dwóch najbardziej rozwiniętych modelach języków (amerykański angielski i mandaryński) WaveNet osiągnął naprawdę spektakularne wyniki.

źródło: https://deepmind.com/blog/wavenet-generative-model-raw-audio/

Nowe głosy będą brzmieć bardziej naturalnie i mogą oddawać typowe ludzkie cech (np. przerwy na oddychanie). Oznacza to, że diametralnie zwiększy się płynność i wierność dźwiękowa odpowiedzi Asystanta.

Jakich rynków dotknie zmiana?

Po cztery uaktualnione głosy (dwa kobiece i dwa męskie) zostaną udostępione dla użytkowników Akcji po angielsku, francusku, niemiecku, koreańsku, rosyjsku i… polsku!

Po jednym nowym kobiecym głosie trafi do użytkowników w Japonii, Włoszech, Portugalii, Holandii i Szwecji.

Rollout nowych głosów rozpocznie się w poniedziałek 4 marca i potrwa przez cały tydzień. Akcje dostępne po polsku będą zmieniać swoje głosy bez ingerencji ich twórców, więc któregoś dnia korzystając z Asystenta po prostu usłyszymy inny, bardziej naturalny głos.

A jak będą brzmiały Akcje? Na szczęście nie jest to niespodzianką! Google umożliwia przesłuchanie głosów już teraz. Są one dostępne na ich stronie internetowej.

Nowe głosy to coś więcej niż tylko inny dźwięk.

Ruch Google to krok w świetnym kierunku – zwiększenia naturalności korzystania z asystentów głosowych oraz korzystania z ogromnych zasobów WaveNet.