但是他自己也明确的清楚文字转WAV音频