满足这么复杂的判定条件文字转WAV音频