我决定采用第三种方案文字转WAV音频