他应该是不至于这么被动的文字转WAV音频