所以一切只能根据他的经验来判断文字转WAV音频