它都考虑要不要拒绝文字转WAV音频