Selode.AI 通过发布 Qwen-3.6-35B-A3B-VRAP 实现本地 AI 突破

selode huggingface

(SeaPRwire) –   終極開源智能體動力引擎

雪梨,新南威爾斯州,2026年5月12日  – 今日,Selode.AI 正式發布了 Qwen-3.6-35B-A3B-VRAP,這是一個先進的4位元AWQ量化模型,能以前沿水準的智慧,僅用1張GPU(而非2張)即可達到此準確度,從而實現使用單張消費級顯示卡。憑藉 Selode 專有的 VRAP 後量化剪枝方法,此版本為需要高性能智能體推理,同時要求顯著降低模型運作與功耗的開發者和研究人員,標誌著一個轉捩點。

高效能,低負載

該模型經 Selode.AI 優化為一個 21.2GB 的 4位元 AWQ 套件,專門設計以適應消費級 GPU(如 NVIDIA RTX 3090、4090 或 AMD 7900XTX)的 24GB VRAM 限制。

VRAP 優勢

「VRAP」標誌代表 Selode.AI 的標誌性優化流程。這項專有方法確保即使在 4位元量化下,模型仍能保留其未壓縮版本的細膩邏輯與「智能體」能力。透過應用 VRAP,Selode.AI 成功緩解了高壓縮模型中常見的「智慧崩潰」問題,確保模型不僅能處理文字——更能精確地思考複雜的多步驟任務。

關鍵功能一覽:

  • 全球首創應用於交錯架構的後量化剪枝方法: 使用全球首創的尖端技術,Selode.AI 為更小的 AWQ 量化模型帶來精確度(一致的混合精度準確性)。
  • 本地隱私,全球實力: 完全離線運行,讓用戶完全掌控自己的數據,同時保持高階能力。
  • 消費級相容性: 可安裝於單張高階消費級 GPU(24GB VRAM),為前沿 AI 開源模型消除了「硬體稅」。
  • 智能體精通: 專為自主任務、儲存庫規模的編碼及複雜技術推理而設計。
  • 大規模上下文支援: 旨在本地快速處理並推理長篇幅文件與程式碼庫。

本地推理的新時代

「Qwen-3.6-35B-A3B-VRAP 的發布是關於超越雲端,」Selode.AI 的一位發言人表示。「透過將我們的 VRAP 方法應用於 Qwen-3.6 架構,我們讓雪梨乃至全球的任何開發者都能在自己的桌面上運行世界級的智能體。這是前沿 AI,解鎖了。」

可用性

模型權重與設定檔現已可在 Hugging Face 上立即下載。

  • 下載連結: huggingface.co/selode-ai/Qwen-3.6-35B-A3B-VRAP-4-bit-AWQ-21.2GB
  • 官方網站: selode.ai

關於 Selode.AI: Selode.AI 是一家位於雪梨的 AI 技術社群,專注於為開源社群優化前沿模型,特別擅長用於本地推理的高效率量化及專有增強方法。

媒體聯絡:

  • 電子郵件: enquiries@selode.ai
  • LinkedIn: linkedin.com/showcase/selode-artificial-intelligence/
architecturedemo output

媒體聯絡

Selode.AI

enquiries@selode.ai

https://selode.ai/

來源 :Selode.AI

本文由第三方廠商內容提供者提供。SeaPRwire (https://www.seaprwire.com/)對此不作任何保證或陳述。

分類: 頭條新聞,日常新聞

SeaPRwire為公司和機構提供全球新聞稿發佈,覆蓋超過6,500個媒體庫、86,000名編輯和記者,以及350萬以上終端桌面和手機App。SeaPRwire支持英、日、德、韓、法、俄、印尼、馬來、越南、中文等多種語言新聞稿發佈。