能够从两个方面来解释文字转WAV音频