因为在之前的推测中文字转WAV音频