ടെക്സ്റ്റ് എഴുതൂ… ശബ്ദം കേൾക്കൂ!പുതിയ Fish Audio S2 TTS മോഡൽ പുറത്തിറങ്ങി

March 11, 2026

ടെക്സ്റ്റ്-ടു-സ്പീച്ച് (TTS) ടെക്നോളജിയിൽ വലിയ മുന്നേറ്റവുമായി ‘ഫിഷ് ഓഡിയോ. (Fish Audio) അവരുടെ പുതിയ മോഡലായ ‘ഫിഷ് ഓഡിയോ S2’ (Fish Audio S2) കമ്പനി പുറത്തിറക്കി. ഉപയോക്താക്കൾക്ക് ആവശ്യാനുസരണം ശബ്ദത്തിലെ വികാരങ്ങൾ (Emotion) കൃത്യമായി നിയന്ത്രിക്കാൻ കഴിയും എന്നതാണ് ഈ എഐ മോഡലിന്റെ ഏറ്റവും വലിയ പ്രത്യേകത.

സാധാരണ എഐ ശബ്ദങ്ങളിൽ നിന്ന് വ്യത്യസ്തമായി, ഓരോ വാക്കിലും ഏത് തരത്തിലുള്ള വികാരമാണ് വേണ്ടതെന്ന് ഉപയോക്താവിന് തീരുമാനിക്കാം. അത്ഭുതം, സങ്കടം, സന്തോഷം തുടങ്ങി ഏത് വികാരവും വളരെ സ്വാഭാവികമായി ഈ മോഡൽ ആവിഷ്കരിക്കുന്നു.

എല്ലാവർക്കും ലഭ്യമാകുന്ന രീതിയിൽ ഓപ്പൺ സോഴ്‌സ് ആയാണ് കമ്പനി ഇത് പുറത്തിറക്കിയിരിക്കുന്നത്. ഇത് ഡെവലപ്പർമാർക്കും കണ്ടന്റ് ക്രിയേറ്റർമാർക്കും വലിയ അവസരങ്ങളാണ് നൽകുന്നത്.

150 മില്ലിസെക്കൻഡിൽ താഴെ മാത്രം സമയമെടുത്താണ് ഈ മോഡൽ പ്രവർത്തിക്കുന്നത്. തത്സമയ സംഭാഷണങ്ങൾക്കും (Real-time conversation) ഇത് വളരെ അനുയോജ്യമാണ്. ഒരേസമയം ഒന്നിലധികം ശബ്ദങ്ങൾ ഒരൊറ്റ പാസ്സിൽ (One pass) കൈകാര്യം ചെയ്യാനും ഇതിന് സാധിക്കും.

ഗെയിമിംഗ്, ഓഡിയോബുക്ക് നിർമ്മാണം, വീഡിയോ ഡബ്ബിംഗ്, പോഡ്‌കാസ്റ്റ്, വെർച്വൽ അസിസ്റ്റന്റുകൾ തുടങ്ങി ശബ്ദത്തെ ആശ്രയിക്കുന്ന ഏത് മേഖലയിലും ഫിഷ് ഓഡിയോ S2 വലിയ മാറ്റങ്ങൾ കൊണ്ടുവരുമെന്നാണ് വിലയിരുത്തൽ.

Today we launch Fish Audio S2, a new generation of expressive TTS with absurdly controllable emotion.

– open-source
– sub 150ms latency
– multi-speaker in one pass

Real freedom of speech starts now 👇 pic.twitter.com/nIXumES4QX
— Fish Audio (@FishAudio) March 10, 2026

Summary : Fish Audio has launched Fish Audio S2, a new text-to-speech (TTS) model that allows users to precisely control emotions in AI-generated voices. The open-source model delivers highly expressive speech with less than 150ms latency and can handle multiple speakers in a single pass. It is expected to benefit industries such as gaming, audiobooks, dubbing, podcasts, and virtual assistants.