主要还是从其心性上分析文字转WAV音频