是容许存在两种或者是多种观点的文字转WAV音频