因为他相信后者一定知道什么文字转WAV音频