然后打算捕获它文字转WAV音频