最普遍的做法就是根本不要去问文字转WAV音频