应该不会做出这么笨的选择文字转WAV音频