又再次加重了语气文字转WAV音频