所以采取了另外的策略了文字转WAV音频