而不能拘泥于一些既有硬性条件文字转WAV音频