但绝对不会把这个判断给说出来的文字转WAV音频