Megdöbbentően jó a Google új gépi hangja

A témát ebben részben 'Hírek!' CF dealer hozta létre. Ekkor: 2017. december 28..

  1. CF dealer / Tulajdonos Vezetőségi tag

    Csatlakozott:
    2011. június 15.
    Hozzászólások:
    24,509
    Kapott lájkok:
    2,269
    Beküldött adatlapok:
    0
    Nem:
    Férfi
    Lakhely :
    deutschland
    Hangjelzés a Chaten:
    nem
    Szinte megkülönböztethetetlen a valódi beszédtől a végeredmény.


    Ugyan az elmúlt években különösen nagy fejlődésen ment keresztül a számítógép által generált beszéd minősége, ám a Google most a riválisoknak alaposan odapirítva bemutatta a második generációs hangképző technológiáját. A rendszer szinte teljesen tökéletesen képes utánozni annak a személynek a beszédét, akinek a hangmintáival betanították, bár egyelőre csak papírról felolvasós stílusban.

    [​IMG]
    Forrás: Dreamstime

    A Tacotron 2 érdekessége, hogy két különálló neurális hálózat segítségével működik. Az egyik rendszer leképezi a bemenetként megadott szöveg spektrogramját, majd átadja a Wavenet nevű másik rendszernek, amely az adatok használatával legenerálja a végleges beszédet.

    A rendszer talán legnagyobb fegyvere, hogy angol nyelven a szövegkörnyezet elemzésének, továbbá az írásjelek megértésének köszönhetően igazán remekül tud hangsúlyozni.

    Ezen a weblapon meghallgatható néhány a rendszerrel generált példamondat, a legutolsó „Tacotron 2 or Human?" részben pedig összehasonlítható a számítógép által generált beszéd, és a gépi hang alapját adó személy beszéde. Fentről lefelé a második, az első, az első, és a második a gépi verzió.

    TOVÁBBI CIKKEK A ROVATBÓL

    Ha szeretne még több érdekes techhírt olvasni, akkor kövesse az Origo Techbázis Facebook-oldalát, kattintson ide!

    Let's block ads! (Why?)

    Forrás...