只是有些口角文字转WAV音频