现在我们面临的情况无非是两种文字转WAV音频