也很难完全确认文字转WAV音频