我们都是按照这份协议中的标准要求的文字转WAV音频