竞争双方似乎分别代表文字转WAV音频