如果忽略表情和气势文字转WAV音频