Technology Innovation Institute(TII)——阿布扎比先进技术研究委员会(Advanced Technology Research Council,ATRC)旗下的应用研究机构——正式发布Falcon-H1 Arabic。这是一款基于混合式Mamba-Transformer架构全新打造的大型语言模型,标志着对以往Transformer架构路线的根本性突破。凭借卓越的综合性能,Falcon-H1 Arabic已在Open Arabic LLM Leaderboard(OALL)上确立其作为当前全球表现最优阿拉伯语AI模型的领先地位。
这一里程碑式的进展使Falcon-H1 Arabic确立为目前市场上表现最为领先的阿拉伯语人工智能模型。该模型在参数规模显著更小的情况下,依然全面超越多款体量数倍于己的同类模型,在准确率、上下文理解能力及语言表征等核心维度上均达到业界最先进水平。
阿联酋总统顾问、先进技术研究委员会(ATRC)秘书长Faisal al Bannai阁下表示:“Falcon-H1 Arabic彰显了我们持续推进的战略承诺,即进一步巩固阿拉伯联合酋长国作为全球先进技术与负责任人工智能枢纽的领先地位。通过打造真正契合本地区语言与文化特征的模型,我们正在推动更具可及性、更贴近实际、并能在社会层面产生深远影响的创新实践。这一成果充分印证了TII在人才储备与科研实力方面的深厚积淀。”
在今年早些时候发布的Falcon-Arabic系列模型获得广泛积极反响、并清晰反映出市场与开发者社区对高质量阿拉伯语大型语言模型的迫切需求之后,TII进一步深化相关研发,推出全新的Falcon-H1 Arabic模型家族。该系列提供3B、7B及34B三种参数规模,旨在灵活适配不同算力条件与多元化应用场景。Falcon-H1 Arabic在数据质量、阿拉伯语方言覆盖、长上下文处理稳定性以及数学推理能力等方面实现显著提升,使模型在实际应用中展现出更高的准确性、可靠性与语境感知能力,全面提升对阿拉伯语的理解深度与应用价值。
TII首席执行官Najwa Aaraj博士表示:“Falcon-H1 Arabic的推出,建立在我们多年持续推进阿拉伯语人工智能基础研究的坚实成果之上,并精准回应了包括开发者和企业在内的社区核心需求。通过在模型架构、数据质量及长上下文推理能力方面不断迭代升级,我们正在构建关键性技术能力,释放阿拉伯语在教育、医疗、治理、企业等多个领域的全新应用潜能。该模型是我们履行使命的重要里程碑——即打造世界一流的人工智能技术,既服务本地区发展,也为全球进步贡献力量。”
基准测试结果
在OALL Leaderboard这一覆盖多维度阿拉伯语理解与推理能力的权威评测榜单中,Falcon-H1 Arabic以全面领先的性能表现脱颖而出,清晰确立其行业领跑地位:
3B模型:平均得分达61.87%,较主流4B级竞品高出10个百分点,显著领先包括Microsoft的Phi-4 Mini在内的同级模型。
7B模型:平均得分71.47%,全面超越所有约10B参数规模模型,包括卡塔尔的Fanar-1-9B以及沙特阿拉伯的HUMAIN ALLaM 7B。
34B模型:得分高达75.36%,性能表现进一步突破,甚至超越多款70B以上参数规模的超大模型,包括中国的Qwen2.5 72B以及META的Llama-3.3 70B。
除在OALL榜单上展现领先优势外,Falcon-H1 Arabic系列模型在多项更具针对性的专业基准测试中同样取得卓越成绩,包括:(i)3LM,用于评估STEM领域的推理能力;(ii)ArabCulture,用于衡量文化与语境理解水平;以及(iii)AraDice,专注于阿拉伯语方言理解与识别能力。
综合各项评测结果,此次成果标志着阿拉伯语人工智能领域迎来关键性突破。Falcon-H1 Arabic不仅在通用及专项基准测试中全面超越多款参数规模数倍于己的模型,更在语言理解深度、推理能力与计算效率等核心维度上实现质的飞跃,树立了全新的行业标杆。由此,Falcon-H1 Arabic确立为迄今开发完成的最具能力与通用性的阿拉伯语大型语言模型体系。
TII人工智能与数字研究中心(Artificial Intelligence and Digital Research Centre,AIDRC)首席研究员Hakim Hacid 表示:“这一模型充分体现了我们打造阿拉伯语人工智能的核心理念——不仅在技术上更为先进,更能够在真实应用场景中切实发挥价值。通过在效率、理解深度以及语言覆盖范围上的持续提升,我们正在赋能人工智能系统,更好地支持本地区的机构、开发者与社区发展。”
该模型在上下文处理能力上实现重大跃升,支持最高256K tokens的超长上下文窗口,使模型能够在单次交互中高效处理大规模信息内容。实际应用中,用户可对冗长的法律文本、医疗记录、学术论文或企业级知识库进行连续、完整的分析,而不会出现语境中断或信息遗失——这一能力在此前同等规模的模型中尚属首次实现。
自2023年以来,TII的Falcon系列人工智能模型持续在多项区域性与全球性基准评测中位居首位。此次,Falcon-H1 Arabic在不同参数规模下全面领跑Open Arabic LLM Leaderboard,进一步巩固其领先优势。这一系列成绩充分体现了TII在打造具备主权属性、并可在全球最高技术舞台上竞争的人工智能能力方面的卓越实力,同时也有力推动了阿布扎比及更广泛的阿拉伯联合酋长国在阿拉伯语人工智能研究与创新领域的国际领导地位。
新一代模型现已通过TII对外开放的公共平台正式上线,用户可在其交互式体验环境(playground)中进行访问与试用。
来源:AETOSWire

阿布扎比TII推出Falcon-H1 Arabic,树立全球阿拉伯语AI模型新标杆(图片来源:AETOSWire)

阿布扎比TII推出Falcon-H1 Arabic,树立全球阿拉伯语AI模型新标杆(图片来源:AETOSWire)
Sims Limited首次入选FTSE4Good指数系列
火币大学校长于佳宁与火币大学校友应邀走访原
新研究评估Masimo Patient
昌德主任谈失眠:中医调理助安睡,及时干预莫
CSG与NetLync推动移动网络运营商
以活动为主导的参与平台Airmeet B轮融资
2025年美国西部国际光电展览会现已开放注册
兰-科尔蒂纳2026年冬奥会纪念币首发发布会在京
Financial year 2018: Boehrin
备受推崇的投资者法律顾问ROSEN鼓励Innovative
Cepton签署被Koito收购的最终协议
Telehouse Canada宣布领导层变动
移远通信推出两款Wi-Fi 7模组新品,赋能无线连
真心为民办实事 一日获赠两锦旗
NAGA Group AG集团营收5,530万欧元
LTIMindtree宣布建立合作伙伴关系并对客户
Clearstream Signs on to Regn
新研究发现,Masimo SedLine(R) PSi
IDEMIA与全球第一大建筑贷款协会全英房屋抵
Spot by NetApp调查强调了云运营在企业内的重要性
格瑞特维推出超低温FKM Fusion™ 665
乘风破浪 闪耀亮相 佛山环球港百日狂欢嘉年华
2023年国际农业博览会将以“农业改变世界”
互联网域名注册数量在2018年第四季度增加到3