资讯

与此前已上线腾讯元宝的混元T1-preview相比,综合效果明显提升。 从放出的跑分成绩来看,混元T1正式版在多项评估指标上超越OpenAI o1、GPT-4.5,以及Deepseek R1。 如在大语言模型(LLM)评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于得分89.3的OpenAI o1,高于得分86 ...