所以他最终领悟的应该也是其中的一部分文字转WAV音频