虽然他们两个只是在默念文字转WAV音频