他必须衡量文字转WAV音频