但我将他们当成客观的规律来分析文字转WAV音频