Token Robin Hood
एक्सएआई20 अप्रैल, 20267 मिनट

xAI ने स्पीच-टू-टेक्स्ट और नई स्टोरेज बिलिंग जोड़ी: ग्रोक एक मीटर्ड एजेंट रनटाइम बन रहा है

xAI के नवीनतम डेवलपर अपडेट केवल एक और पद्धति के बारे में नहीं हैं। वे ग्रोक को एक पूर्ण रनटाइम बिजनेस मॉडल की ओर बढ़ते हुए दिखाते हैं: ऑडियो इन, फ़ाइलें संग्रहीत, खोज चलाना, कोड निष्पादित, और प्रत्येक सतह की स्पष्ट कीमत।

क्या हुआxAI ने स्पीच-टू-टेक्स्ट को 15 अप्रैल, 2026 को उपलब्ध के रूप में चिह्नित किया, जबकि इसके मूल्य निर्धारण दस्तावेज़ कहते हैं कि फ़ाइल और संग्रह भंडारण शुल्क 20 अप्रैल, 2026 से शुरू होंगे।
बिल्डरों को इसकी परवाह क्यों है?यदि आप ध्वनि, फ़ाइलें, खोज, कोड निष्पादन, या एमसीपी के लिए ग्रोक का उपयोग करते हैं, तो आपका बिल अब केवल टोकन नहीं रह गया है। यह रनटाइम व्यवहार है.
TRH कार्रवाईबजट ऑडियो मिनट, स्टोरेज फ़ुटप्रिंट, टूल कॉल और टोकन उपयोग को अलग-अलग आश्चर्य के रूप में मानने के बजाय एक प्रणाली के रूप में।

xAI वास्तव में क्या बदल गया

एक्सएआई के रिलीज़ नोट्स में कहा गया है कि स्पीच टू टेक्स्ट 15 अप्रैल, 2026 को उपलब्ध हो गया। समर्पित दस्तावेज़ बैच और स्ट्रीमिंग ट्रांसक्रिप्शन का वर्णन करते हैं, जिसकी कीमत REST के लिए $0.10 प्रति घंटा और स्ट्रीमिंग के लिए $0.20 प्रति घंटा है, जिसमें कई ऑडियो प्रारूप और वास्तविक समय अंतरिम परिणाम शामिल हैं।

वह अपने आप में उपयोगी है. अधिक महत्वपूर्ण बदलाव मूल्य निर्धारण पृष्ठ पर है। xAI अब वेब खोज, वही पेज कहता है कि फ़ाइल और संग्रह भंडारण शुल्क 20 अप्रैल, 2026 से प्रभावी होंगे।

यह नए ऑडियो समापन बिंदु से अधिक क्यों मायने रखता है?

कई टीमें अभी भी एआई लागत को मॉडल-पसंद की समस्या के रूप में सोचती हैं: सस्ता मॉडल चुनें, संकेतों को संपीड़ित करें और आगे बढ़ें। एक बार जब आपका एजेंट कॉल ट्रांसक्रिप्ट करना, फ़ाइलें संग्रहीत करना, वेब पर खोज करना, एक्स ब्राउज़ करना, कॉलिंग टूल और कोड चलाना शुरू कर देता है तो यह अधूरा है। रनटाइम उत्पाद बन जाता है.

xAI उस मूल्य निर्धारण मॉडल को स्पष्ट बना रहा है। खोज बिल किया गया है. कोड निष्पादन बिल किया गया है. ध्वनि सत्रों का बिल दिया जाता है. भंडारण का बिल दिया गया है. एक मिश्रित मानसिक संख्या के अंदर एजेंट के व्यवहार को छिपाने की पुरानी आदत की तुलना में यह बिल्डरों के लिए एक स्वस्थ संकेत है।

TRH कोण: एजेंट लागत अब बहु-सतह है

के लिए Token Robin Hood पाठकों, सबक सीधा है: टोकन पुनर्प्राप्ति को रनटाइम पुनर्प्राप्ति में विस्तारित करना होगा। यदि आपका एजेंट फ़ाइलों को हमेशा के लिए रखता है, उपयोग से अधिक ऑडियो ट्रांसक्रिप्ट करता है, या नियमित संकेतों पर खोज और कोड निष्पादन को ट्रिगर करता है, तो अपशिष्ट अब केवल संदर्भ विंडो के अंदर नहीं है।

एक उपयोगी आंतरिक मीट्रिक प्रति टिकाऊ कलाकृति की लागत है। आप एक प्रतिलेख प्राप्त करने के लिए कितना खर्च करते हैं जिसे कोई वास्तव में पढ़ता है, एक रिपोर्ट जिसे कोई वास्तव में भेजता है, या किसी फिक्स को वास्तव में विलय करता है? एक बार जब आप इसे माप लेते हैं, तो भंडारण प्रतिधारण नीतियां और टूल गेटिंग शीघ्र इंजीनियरिंग के समान ही मायने रखने लगती हैं।

बिल्डरों को आगे क्या करना चाहिए

अपने ग्रोक अकाउंटिंग को चार बकेट में विभाजित करें: टेक्स्ट टोकन, ऑडियो मिनट, टूल इनवोकेशन और संग्रहीत डेटा। कार्य-स्तरीय सीमाएँ जोड़ें ताकि कोई एजेंट चुपचाप उनमें से किसी को भी न फुला सके। पुरानी फ़ाइलों को आक्रामक तरीके से हटाएं, और प्रत्येक प्रतिलेखन को डिफ़ॉल्ट रूप से स्थायी भंडारण न बनने दें।

यदि आप प्रदाताओं की तुलना कर रहे हैं, तो हेडलाइन मॉडल मूल्य निर्धारण के बजाय पूर्ण रनटाइम स्टैक की तुलना करें। इसका मतलब है कि खोज शुल्क, कोड निष्पादन शुल्क, भंडारण शुल्क, और उन उपकरणों के कारण एजेंट को कितना अतिरिक्त संदर्भ जमा होता है, इसकी जाँच करना। असल खर्च अक्सर यहीं छिपा होता है। आगे पढ़ें टोकन वसूली यदि आप व्यापक फ़्रेमिंग चाहते हैं।

सूत्रों का कहना है