xAI ने स्पीच-टू-टेक्स्ट और नई स्टोरेज बिलिंग जोड़ी: ग्रोक एक मीटर्ड एजेंट रनटाइम बन रहा है
xAI के नवीनतम डेवलपर अपडेट केवल एक और पद्धति के बारे में नहीं हैं। वे ग्रोक को एक पूर्ण रनटाइम बिजनेस मॉडल की ओर बढ़ते हुए दिखाते हैं: ऑडियो इन, फ़ाइलें संग्रहीत, खोज चलाना, कोड निष्पादित, और प्रत्येक सतह की स्पष्ट कीमत।
xAI वास्तव में क्या बदल गया
एक्सएआई के रिलीज़ नोट्स में कहा गया है कि स्पीच टू टेक्स्ट 15 अप्रैल, 2026 को उपलब्ध हो गया। समर्पित दस्तावेज़ बैच और स्ट्रीमिंग ट्रांसक्रिप्शन का वर्णन करते हैं, जिसकी कीमत REST के लिए $0.10 प्रति घंटा और स्ट्रीमिंग के लिए $0.20 प्रति घंटा है, जिसमें कई ऑडियो प्रारूप और वास्तविक समय अंतरिम परिणाम शामिल हैं।
वह अपने आप में उपयोगी है. अधिक महत्वपूर्ण बदलाव मूल्य निर्धारण पृष्ठ पर है। xAI अब वेब खोज, वही पेज कहता है कि फ़ाइल और संग्रह भंडारण शुल्क 20 अप्रैल, 2026 से प्रभावी होंगे।
यह नए ऑडियो समापन बिंदु से अधिक क्यों मायने रखता है?
कई टीमें अभी भी एआई लागत को मॉडल-पसंद की समस्या के रूप में सोचती हैं: सस्ता मॉडल चुनें, संकेतों को संपीड़ित करें और आगे बढ़ें। एक बार जब आपका एजेंट कॉल ट्रांसक्रिप्ट करना, फ़ाइलें संग्रहीत करना, वेब पर खोज करना, एक्स ब्राउज़ करना, कॉलिंग टूल और कोड चलाना शुरू कर देता है तो यह अधूरा है। रनटाइम उत्पाद बन जाता है.
xAI उस मूल्य निर्धारण मॉडल को स्पष्ट बना रहा है। खोज बिल किया गया है. कोड निष्पादन बिल किया गया है. ध्वनि सत्रों का बिल दिया जाता है. भंडारण का बिल दिया गया है. एक मिश्रित मानसिक संख्या के अंदर एजेंट के व्यवहार को छिपाने की पुरानी आदत की तुलना में यह बिल्डरों के लिए एक स्वस्थ संकेत है।
TRH कोण: एजेंट लागत अब बहु-सतह है
के लिए Token Robin Hood पाठकों, सबक सीधा है: टोकन पुनर्प्राप्ति को रनटाइम पुनर्प्राप्ति में विस्तारित करना होगा। यदि आपका एजेंट फ़ाइलों को हमेशा के लिए रखता है, उपयोग से अधिक ऑडियो ट्रांसक्रिप्ट करता है, या नियमित संकेतों पर खोज और कोड निष्पादन को ट्रिगर करता है, तो अपशिष्ट अब केवल संदर्भ विंडो के अंदर नहीं है।
एक उपयोगी आंतरिक मीट्रिक प्रति टिकाऊ कलाकृति की लागत है। आप एक प्रतिलेख प्राप्त करने के लिए कितना खर्च करते हैं जिसे कोई वास्तव में पढ़ता है, एक रिपोर्ट जिसे कोई वास्तव में भेजता है, या किसी फिक्स को वास्तव में विलय करता है? एक बार जब आप इसे माप लेते हैं, तो भंडारण प्रतिधारण नीतियां और टूल गेटिंग शीघ्र इंजीनियरिंग के समान ही मायने रखने लगती हैं।
बिल्डरों को आगे क्या करना चाहिए
अपने ग्रोक अकाउंटिंग को चार बकेट में विभाजित करें: टेक्स्ट टोकन, ऑडियो मिनट, टूल इनवोकेशन और संग्रहीत डेटा। कार्य-स्तरीय सीमाएँ जोड़ें ताकि कोई एजेंट चुपचाप उनमें से किसी को भी न फुला सके। पुरानी फ़ाइलों को आक्रामक तरीके से हटाएं, और प्रत्येक प्रतिलेखन को डिफ़ॉल्ट रूप से स्थायी भंडारण न बनने दें।
यदि आप प्रदाताओं की तुलना कर रहे हैं, तो हेडलाइन मॉडल मूल्य निर्धारण के बजाय पूर्ण रनटाइम स्टैक की तुलना करें। इसका मतलब है कि खोज शुल्क, कोड निष्पादन शुल्क, भंडारण शुल्क, और उन उपकरणों के कारण एजेंट को कितना अतिरिक्त संदर्भ जमा होता है, इसकी जाँच करना। असल खर्च अक्सर यहीं छिपा होता है। आगे पढ़ें टोकन वसूली यदि आप व्यापक फ़्रेमिंग चाहते हैं।