最好能够留着他们的活口文字转WAV音频