AI OS कैसे काम करता है
आर्किटेक्चर, रूटिंग एल्गोरिदम, एनरिचमेंट फ्रेशनेस, RAG रिट्रीवल, और ट्रेडिंग स्ट्रैटेजी चयन — अंदर क्या होता है।
आर्किटेक्चर पाइपलाइन
पांच बाहरी डेटा स्रोत एक एनरिचमेंट पाइपलाइन को फीड करते हैं। प्रोसेस्ड स्ट्रीम एक LLM राउटर और एक वेक्टर RAG स्टोर से होकर गुजरती है, फिर तीन उपभोक्ताओं तक पहुंचती है: पब्लिक पोर्टल, एडमिन डैशबोर्ड, और MCP सर्वर।
LLM रूटिंग एल्गोरिदम
प्रत्येक कार्य को पहले प्रकार के अनुसार वर्गीकृत किया जाता है, फिर उस बैकएंड पर भेजा जाता है जो प्रति यूनिट लागत और विलंबता के लिए गुणवत्ता को अधिकतम करता है। तेज़ ड्राफ्ट Groq को जाते हैं; संरचित निष्कर्षण और तर्क OpenAI को; बल्क जॉब Runpod को; एम्बेडिंग और फ्री-टियर कार्य Ollama को।
कार्य → बैकएंड डिस्पैच तालिका
लागत-अनुकूलन सूत्र
cost(task, backend) = price_per_token × estimated_tokens(task) latency(task, backend) = base_latency + tokens / throughput quality(task, backend) = exam_score(backend, task_type) route(task) = argmax( quality / (cost × √latency) )
संवर्धन ताजगी एल्गोरिदम
प्रत्येक संवर्धन क्रॉन अपेक्षित अंतराल और एक कठोर SLA के विरुद्ध बेंचमार्क किया जाता है। बीता हुआ समय बढ़ने पर स्वास्थ्य तीन क्षेत्रों में घटता है — OK → degraded → critical।
health(cron) = 1 if last_run_age < 1.5 × expected_interval → OK 0.5 if last_run_age < SLA → degraded 0 otherwise → critical
एजेंट प्रभावशीलता स्कोरिंग
एजेंट प्रदर्शन पांच अक्षों पर मापा जाता है और एक एकल प्रभावशीलता स्कोर में संक्षिप्त किया जाता है E जटिलता-भारित माध्य के माध्यम से। भारी कार्य अंतिम स्कोर में आनुपातिक रूप से अधिक योगदान करते हैं।
E = Σ(wᵢ × scoreᵢ) / Σ(wᵢ) where: wᵢ = complexity weight of task i scoreᵢ = outcome score (0 – 100) Axes (5 dimensions): Speed — task latency vs budget Cost — tokens × price per token Quality — exam score on task type Safety — guardrail pass rate Learning — hint reuse in context pack
RAG पुनर्प्राप्ति एल्गोरिदम
प्रत्येक क्वेरी को 768-आयामी वेक्टर में एम्बेड किया जाता है, कोसाइन समानता द्वारा LanceDB चंक्स के विरुद्ध मिलान किया जाता है, हाल ही में क्षय द्वारा पुनः रैंक किया जाता है, और मॉडल के संदर्भ विंडो में पैक किया जाता है।
query → embed(query) → cosine_similarity(query_vec, chunk_vecs)
→ top-K chunks → rerank by recency
→ context_pack → inject into prompt
ट्रेडिंग रणनीति चयन मैट्रिक्स
GOGA वास्तविक समय के संकेतों से वर्तमान बाजार व्यवस्था को वर्गीकृत करता है और उपयुक्त निष्पादन रणनीति का चयन करता है। प्रत्येक पंक्ति एक पहचानी गई स्थिति को उसके संकेतक सेट और की गई कार्रवाई से मैप करती है।
| स्थिति | संकेतक | रणनीति |
|---|---|---|
| पंप प्रवेश | 1mΔ>0.5%, Vol<2, Book>1.5 | वेक्टर/शॉट |
| डिप खरीद | RSI<30, 15mΔ<-2% | DCA ग्रिड |
| स्विंग होल्ड | PumpQ>60, Funding<0 | पैटर्न/अनुकूली |
| बचें | VolRatio>3, RSI>80 | प्रतीक्षा करें |