他的心里面基本上是确定了文字转WAV音频