另一半则是散修文字转WAV音频