因为按照他和大部分人的常规思维推论文字转WAV音频