前者是二十世纪福克斯希望使用的文字转WAV音频