因为毕竟这不是属于科学范畴能够估量的文字转WAV音频