因为每一次出现文字转WAV音频