单一的法则确实不够用文字转WAV音频