ടെക്സ്റ്റ് എഴുതൂ… ശബ്ദം കേൾക്കൂ!പുതിയ Fish Audio S2 TTS മോഡൽ പുറത്തിറങ്ങി

ടെക്സ്റ്റ്-ടു-സ്പീച്ച് (TTS) ടെക്നോളജിയിൽ വലിയ മുന്നേറ്റവുമായി ‘ഫിഷ് ഓഡിയോ. (Fish Audio) അവരുടെ പുതിയ മോഡലായ ‘ഫിഷ് ഓഡിയോ S2’ (Fish Audio S2) കമ്പനി പുറത്തിറക്കി. ഉപയോക്താക്കൾക്ക് ആവശ്യാനുസരണം ശബ്ദത്തിലെ വികാരങ്ങൾ (Emotion) കൃത്യമായി നിയന്ത്രിക്കാൻ കഴിയും എന്നതാണ് ഈ എഐ മോഡലിന്റെ ഏറ്റവും വലിയ പ്രത്യേകത.

സാധാരണ എഐ ശബ്ദങ്ങളിൽ നിന്ന് വ്യത്യസ്തമായി, ഓരോ വാക്കിലും ഏത് തരത്തിലുള്ള വികാരമാണ് വേണ്ടതെന്ന് ഉപയോക്താവിന് തീരുമാനിക്കാം. അത്ഭുതം, സങ്കടം, സന്തോഷം തുടങ്ങി ഏത് വികാരവും വളരെ സ്വാഭാവികമായി ഈ മോഡൽ ആവിഷ്കരിക്കുന്നു.

എല്ലാവർക്കും ലഭ്യമാകുന്ന രീതിയിൽ ഓപ്പൺ സോഴ്‌സ് ആയാണ് കമ്പനി ഇത് പുറത്തിറക്കിയിരിക്കുന്നത്. ഇത് ഡെവലപ്പർമാർക്കും കണ്ടന്റ് ക്രിയേറ്റർമാർക്കും വലിയ അവസരങ്ങളാണ് നൽകുന്നത്.

150 മില്ലിസെക്കൻഡിൽ താഴെ മാത്രം സമയമെടുത്താണ് ഈ മോഡൽ പ്രവർത്തിക്കുന്നത്. തത്സമയ സംഭാഷണങ്ങൾക്കും (Real-time conversation) ഇത് വളരെ അനുയോജ്യമാണ്. ഒരേസമയം ഒന്നിലധികം ശബ്ദങ്ങൾ ഒരൊറ്റ പാസ്സിൽ (One pass) കൈകാര്യം ചെയ്യാനും ഇതിന് സാധിക്കും.

ഗെയിമിംഗ്, ഓഡിയോബുക്ക് നിർമ്മാണം, വീഡിയോ ഡബ്ബിംഗ്, പോഡ്‌കാസ്റ്റ്, വെർച്വൽ അസിസ്റ്റന്റുകൾ തുടങ്ങി ശബ്ദത്തെ ആശ്രയിക്കുന്ന ഏത് മേഖലയിലും ഫിഷ് ഓഡിയോ S2 വലിയ മാറ്റങ്ങൾ കൊണ്ടുവരുമെന്നാണ് വിലയിരുത്തൽ.

Summary : Fish Audio has launched Fish Audio S2, a new text-to-speech (TTS) model that allows users to precisely control emotions in AI-generated voices. The open-source model delivers highly expressive speech with less than 150ms latency and can handle multiple speakers in a single pass. It is expected to benefit industries such as gaming, audiobooks, dubbing, podcasts, and virtual assistants.