所以我很难从中捕捉到有用的信息文字转WAV音频