所以他们能够感应到自己和我之间的差距文字转WAV音频