我的建议是第一种文字转WAV音频