Вы офлайн — показываются кэшированные данные
B BibaMoneyна базе AI OS

Как работает AI OS

Архитектура, алгоритмы маршрутизации, свежесть обогащения, RAG-поиск и выбор торговой стратегии — что происходит под капотом.

01

Конвейер архитектуры

Пять внешних источников данных питают конвейер обогащения. Обработанный поток проходит через LLM-маршрутизатор и векторное RAG-хранилище, прежде чем достичь трех потребителей: публичного портала, панели администратора и MCP-сервера.

Источники данных Обработка Вывод Источники данных CoinGecko CoinPaprika RSS-ленты Gate.io Newsadmin Обогащение Конвейер LLM-маршрутизатор 5 бэкендов RAG-хранилище LanceDB Portal-Go Публичный UI Панель управления Админ-UI MCP-сервер 17 инструментов
02

Алгоритм маршрутизации LLM

Каждая задача сначала классифицируется по типу, затем отправляется в бэкенд, который максимизирует качество на единицу стоимости и задержки. Быстрые черновики идут в Groq; структурированное извлечение и рассуждение — в OpenAI; пакетные задачи — в Runpod; встраивания и работа на бесплатном уровне — в Ollama.

Таблица диспетчеризации задач → бэкенд

SEO_DRAFT Groq быстро, дешево
CLASSIFY Groq быстро, дешево
EXTRACT OpenAI структурированный вывод
REASONING OpenAI качество
CRITIQUE OpenAI качество
ПЛАН OpenAI качество
BATCH Runpod пользовательские модели
LOCAL_GEN Ollama бесплатно
EMBEDDING Ollama 768d векторы

Формула оптимизации затрат

cost(task, backend)    = price_per_token × estimated_tokens(task)
latency(task, backend) = base_latency + tokens / throughput
quality(task, backend) = exam_score(backend, task_type)

route(task) = argmax( quality / (cost × √latency) )
03

Алгоритм свежести обогащения

Каждый крон обогащения сравнивается с ожидаемым интервалом и жестким SLA. Состояние ухудшается через три зоны по мере увеличения прошедшего времени — OK → ухудшенное → критическое.

OK
ухудшенное
критическое
t = 0 1.5 × ожидаемое SLA
health(cron) =
  1   if last_run_age < 1.5 × expected_interval   → OK
  0.5 if last_run_age < SLA                        → degraded
  0   otherwise                                     → critical
04

Оценка эффективности агента

Производительность агента измеряется по пяти осям и сводится к единой оценке эффективности E через средневзвешенное по сложности. Более тяжелые задачи вносят пропорционально больший вклад в итоговую оценку.

Скорость Стоимость Качество Безопасность Обучение
E = Σ(wᵢ × scoreᵢ) / Σ(wᵢ)

where:
  wᵢ      = complexity weight of task i
  scoreᵢ  = outcome score (0 – 100)

Axes (5 dimensions):
  Speed    — task latency vs budget
  Cost     — tokens × price per token
  Quality  — exam score on task type
  Safety   — guardrail pass rate
  Learning — hint reuse in context pack
05

Алгоритм поиска RAG

Каждый запрос преобразуется в 768-мерный вектор, сопоставляется с фрагментами LanceDB по косинусному сходству, переранжируется по убыванию новизны и упаковывается в контекстное окно модели.

query → embed(query) → cosine_similarity(query_vec, chunk_vecs)
      → top-K chunks → rerank by recency
      → context_pack → inject into prompt
06

Матрица выбора торговой стратегии

GOGA классифицирует текущий рыночный режим по сигналам в реальном времени и выбирает подходящую стратегию исполнения. Каждая строка сопоставляет обнаруженное условие с набором индикаторов и предпринятым действием.

Условие Индикаторы Стратегия
Pump Entry 1mΔ>0.5%, Vol<2, Book>1.5 Вектор/Шот
Дип-бай RSI<30, 15mΔ<-2% Сетка DCA
Свинг-холд PumpQ>60, Funding<0 Паттерн/Адаптивный
Избегать VolRatio>3, RSI>80 Ожидание