Google का AI बोलेगा अब आपके स्टाइल में, 70 भाषाओं को सपोर्ट करेगा Gemini 3.1 Flash TTS

जेमिनी 3.1 फ्लैश टीटीएस / फोटो- गूगल कीवर्ड
Google Gemini 3.1 Flash TTS मॉडल टेक्स्ट को इंसानों जैसी नेचुरल और एक्सप्रेसिव आवाज में बदल सकता है. इसमें यूजर्स टोन, स्पीड और स्टाइल कंट्रोल कर सकते हैं. साथ ही इसमें 70+ भाषाओं का सपोर्ट और मल्टी-स्पीकर जैसे फीचर्स दिए गए हैं.
अब AI सिर्फ लिखकर जवाब देने तक ही नहीं रह गया है, बल्कि बोलकर भी यूजर्स को बेहतर एक्सपीरियंस देने लगा है. इसी कड़ी में Google ने भी अपने AI इकोसिस्टम को और मजबूत करते हुए नया टेक्स्ट-टू-स्पीच मॉडल Gemini 3.1 Flash TTS लॉन्च कर दिया है. यह नया मॉडल टेक्स्ट को बेहद नेचुरल और इंसानों जैसी आवाज में बदल सकता है. इसकी खास बात यह है कि अब यूजर्स AI को बता सकते हैं, कि उसे कैसे बोलना है. जैसे फास्ट, स्लो या किसी खास अंदाज में. कंपनी का दावा है कि यह अब तक का सबसे नेचुरल, एक्सप्रेसिव और कंट्रोल करने में आसान वॉयस AI मॉडल है.
क्या है Gemini 3.1 Flash TTS?
Gemini 3.1 Flash TTS Google का नया AI मॉडल है, जो टेक्स्ट को आवाज में बदलने के तरीके को और बेहतर बनाता है. इसकी सबसे बड़ी खासियत यह है, कि आप सिर्फ टेक्स्ट के जरिए ही आवाज का टोन, स्पीड और स्टाइल कंट्रोल कर सकते हैं. यानी अब AI सिर्फ टेक्स्ट पढ़ेगा ही नहीं, बल्कि आपके बताए गए स्टाइल में बोलेगा, जैसे आप चाहें वैसा एक्सप्रेशन देगा. इससे ऑडियो पहले से ज्यादा नेचुरल और इंसानों जैसा महसूस होगा.
स्पेशल ऑडियो टैग्स से मिलेगा ज्यादा कंट्रोल
इस मॉडल में खास ऑडियो टैग्स दिए गए हैं, जिनकी मदद से आप आवाज की डिलीवरी को और बारीकी से कंट्रोल कर सकते हैं. जैसे-
- पॉज (रुकने का समय)
- स्पीड (बोलने की रफ्तार)
- एम्फेसिस (किस शब्द पर जोर देना है)
इन सबको बिना किसी दिक्कत के आसानी से सेट किया जा सकता है, जिससे आउटपुट ज्यादा रियल और प्रोफेशनल बनता है.
मिलेगा मल्टी-स्पीकर सपोर्ट
Gemini 3.1 Flash TTS में मल्टी-स्पीकर सपोर्ट भी दिया गया है. इसका मतलब है कि एक ही ऑडियो में अलग-अलग आवाजें इस्तेमाल की जा सकती हैं. हर आवाज का अपना अलग स्टाइल और पहचान होगी, जिससे स्टोरीटेलिंग, कस्टमर सपोर्ट और कंटेंट क्रिएशन में बड़ा फायदा मिलेगा.
70+ भाषाओं का सपोर्ट करेगा फीचर
यह मॉडल 70 से ज्यादा भाषाओं को सपोर्ट करता है, जिससे इसे ग्लोबल लेवल पर इस्तेमाल किया जा सकता है.
Google ने इसमें खासतौर पर ऑडियो क्वालिटी को बेहतर बनाया है, ताकि आवाज ज्यादा क्लियर और इंसानों के करीब लगे.
सेफ्टी के लिए SynthID फीचर
Google ने इसमें SynthID नाम की टेक्नोलॉजी भी जोड़ी है, जो AI द्वारा बनाए गए ऑडियो में एक इनविजिबल वॉटरमार्क जोड़ती है. इससे यह पहचानना आसान हो जाएगा, कि कौन सा ऑडियो AI से बना है, जिससे ट्रांसपेरेंसी और सिक्योरिटी दोनों बढ़ती हैं.
कैसे कर सकते हैं इस्तेमाल?
Gemini 3.1 Flash TTS फिलहाल प्रीव्यू मोड में उपलब्ध है. डेवलपर्स इसे Gemini API और Google AI Studio के जरिए इस्तेमाल कर सकते हैं. एंटरप्राइज यूजर्स इसे Vertex AI के जरिए एक्सेस कर सकते हैं. वहीं, आम यूजर्स के लिए यह Google Vids जैसे टूल्स में उपलब्ध है.
यह भी पढ़ें: आपकी आदतें समझकर जवाब देगा Gemini, Google ने भारत में रोलआउट किया नया फीचर
प्रभात खबर डिजिटल टॉप स्टोरी
लेखक के बारे में
By Shivani Shah
डिजिटल पत्रकारिता में 3 सालों का अनुभव है. प्रभात खबर में जूनियर टेक कंटेंट राइटर के तौर पर काम कर रही हैं. टेक्नोलॉजी कैटेगरी में ये स्मार्टफोन से लेकर टेक-टिप्स, गैजेट्स, एआई, सॉफ्टवेयर और डिजिटल ट्रेंड्स पर रिसर्च-बेस्ड, इन-डेप्थ और यूजर-फोकस्ड कंटेंट लिखती हैं. इसके अलावा ये ऑटोमोबाइल से जुड़ी खबरें भी लिखती हैं.
Prabhat Khabar App :
देश, एजुकेशन, मनोरंजन, बिजनेस अपडेट, धर्म, क्रिकेट, राशिफल की ताजा खबरें पढ़ें यहां. रोजाना की ब्रेकिंग हिंदी न्यूज और लाइव न्यूज कवरेज के लिए डाउनलोड करिए




