自然不会向其他门派那样严格挑选文字转WAV音频