听上去感觉就是沿用了以往的经验文字转WAV音频