稀宇科技宣布并开源新一代 MiniMax 神仙道1 系列模
IT之家 1 月 15 日新闻,稀宇科技(MiniMax)本日发布推出新一代 01 系列模子,包括基本言语年夜模子 MiniMax-Text-01 跟视觉多模态年夜模子 MiniMax-VL-01。为便利开辟者研讨,该公司还在 Github 上开源了两个模子的完全权重。这一系列模子的后续更新,包含代码跟多模态相干的后续强化仍待上传。该系列模子初次年夜范围实现线性留神力机制,攻破 Transformer 传统架构影象瓶颈,可能处置 400 万 token 的输入,可输入长度是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。据先容,这个模子的参数目高达 4560 亿,此中单次激活 459 亿,模子综合机能比肩海内顶尖模子,在年夜少数义务上追平了海内公认开始进的两个模子,GPT-4o-1120 以及 Claude-3.5-Sonnet-1022。在长文义务上,跟着输入长度变长,MiniMax-Text-01 机能衰减更少,明显优于谷歌 Gemini。因而,01 系列模子在处置长输入的时间有十分高的效力,濒临线性庞杂度。订价方面,IT之家发明该系列模子尺度订价是输入 1 元 / 百万输入 token、8 元 / 百万输出 token。