这两种可能性都是有的文字转WAV音频