虽然他们已经有了大致的猜测文字转WAV音频