则采用了相反的思路文字转WAV音频