只是这很明显不是他们能够猜测多管的文字转WAV音频