而是老老实实地说出了他的推测文字转WAV音频