从他们的语气当中文字转WAV音频