而且他推算过了文字转WAV音频