你的位置:Kaiyun网页版·「中国」开云官方网站 登录入口 > 新闻 > 欧洲杯体育但该领域仍存在三个关节局限性:最初-Kaiyun网页版·「中国」开云官方网站 登录入口

欧洲杯体育但该领域仍存在三个关节局限性:最初-Kaiyun网页版·「中国」开云官方网站 登录入口

时间:2025-10-23 18:44 点击:156 次

FDABench团队 投稿量子位 | 公众号 QbitAI欧洲杯体育

数据智能体到底好不好用?测评一下就知谈了!

南洋理工大学、新加坡国立大学联袂华为开源推出首个罕见针对数据智能体(Data Agents)异构搀杂数据分析的空洞性基准测试FDABench

该基准横跨50+数据领域、树立了多种难度等第和任务类型,还独创了Agent-Expert互助框架,确保测试用例质地和数据一致性,同期守旧Data Agent、RAG、语义算子以及四种典型Data Agent责任流模样。

团队使用FDABench对多样数据智能体系统进行了评估,发现每个系统在反映质地、准确性、蔓延和token本钱方面齐进展出独有的上风。

底下详备来看。

将数据库、PDF、视频、音频异构数据源拔本塞原

濒临数据启动方案的需求日益增长,这催生了对粗略整合结构化和非结构化数据进行分析的数据智能体的挫折需求。

尽管数据智能体Data Agents在让用户扩充复杂分析任务方面展现出后劲,但该领域仍存在三个关节局限性:

最初,由于难以想象出能评估智能体在多源分析任务中各项期间的测试用例,全面的数据智能体Benchmark仍然缺失;其次,构建聚辘集构化和非结构化数据的可靠测试用例本钱昂贵且极其复杂;第三,现存基准的适合性和通用性有限,导致评估范围短促。

为应付这些挑战,团队提倡了FDABench,这是首个罕见为评估多源数据分析场景中的智能体而想象的数据智能体基准。

这个基准涵盖了2007个不同的测试任务,秘籍50多个领域,比如金融、电商,还有浮浅、中等、难三种难度。 推理所需数据包括结构化、PDF文档、视频、音频等异构数据源。

任务类型也分三种:单选题(比如算具体数值)、多选题(比如选多个正确论断,包含具体数值和空洞申报推理)、写申报(比如整合数据出分析申报),能全面测数据智能体的期间。

团队还想象了协调Agent-Expert互助框架,同期守旧Data Agent、RAG、语义算子以及四种典型Data Agent责任流模样(想象Planning、用具使用Tool-use、反念念Reflection、多智能体Multi-Agent),可无缝集成不同Data Agent系统架构。

无论数据智能体是靠“提前想象措施”、“调用用具”、“自我修正”一经“多智能体互助”责任,齐能兼容测试,无须换个数据智能体就从头搭测试框架。

计划东谈主员用FDABench测试了市面上常见的几种数据智能体。

一类是通用的数据分析系统,比如能生成财务申报的DAgent、能处置多模态数据的Taiji;

一类是擅长语义贯通的语义算子系统,比如能精确处置用户当然话语查询的LOTUS;

还有一类数据智能体Data Agent是带检索增强(RAG,能查外部数据补助分析)的系统,比如Data Agent+GraphRAG。

计划东谈主员也提供了关于不同基础模子和智能体架构的全面测试:

团队还尝试去对每种数据智能体进行计划资源拆解,统计了数据智能体每个阶段的耗时和总体系统蔓延:

测试后发现:

架构复杂度量度复杂Data Agent架构(如Multi-Agent、Reflection)在异构数据分析准确性上显耀优于浮浅架构,但代价是计划本钱成倍增多(6-20倍资源滥用),浮浅架构如Planning则在后果上占优但濒临复杂问题适合性有限;计划资源重分派效应不雅察到不同Data Agent架构骨子是通过从头分派计划支出完好意思优化——Reflection架构将26-29%计划用于重试机制相易高质地输出,Planning架构将32-35%用于生成阶段保证后果,这种“判辨负载重分派”为阐明任务场景选择合适架构提供了量化指点模子-架构适配性大界限Agenic Data下预锻练的模子即使是Non-Thinking Model(如Kimi-k2)在复杂Multi-Agent和Reflection架构下依旧进展超过,一些Thinking Model(如DeepSeek-R1)在复杂Data Agent架构中反而出现“双重推理刑事包袱”表象,这标明模子选择需要匹配架构复杂度。

归来一下等于,莫得齐全的Data智能体,有的快但复杂任务拉胯,有的准却花钱又慢,选的时刻要看需求。

而FDABench的作用,等于帮你了了测出哪个系统最适应你的需求。

论文地址:https://arxiv.org/pdf/2509.02473代码地址:https://github.com/fdabench/FDAbench

— 完 —

新闻

XINWEN

开云体育出入11.20元/公斤-Kaiyun网页版·「中国」开云官方网站 登录入口

市集 最高价 最廉价 大量价 北京向阳区大洋路概括市集 24.00 22.00 22.00 山西省长治市紫坊农家具概括往还市集有限公司 20.00 18.00 19.00 江苏丰县农业农村局 20.00 20.00 20.00 江苏凌家塘市集发展有限公司 24.00 18.00 21.00 江苏苏州南环桥农副家具批发市集 21.00 16.00 18.50 马鞍山市安民农副家具生意有限公司 20.00 16.00 18.00 天长市永福农副家具批发市集 27.00 25.00 26.00 亳州

开云体育最低报价8.00元/公斤-Kaiyun网页版·「中国」开云官方网站 登录入口

市集 最高价 最廉价 巨额价 山西省太原市河西农居品有限公司 12.00 8.00 10.00 江苏凌家塘市集发展有限公司 25.00 14.00 24.00 天长市永福农副居品批发市集 20.00 15.00 17.50 亳州农居品有限牵累公司 -- -- 11.00 济南堤口果品批发发展有限牵累公司 32.00 22.00 26.00 滕州市农副居品物流中心有限公司 28.00 10.00 11.00 河南万邦海外农居品物流股份有限公司 14.00 8.00 11.00 湖北黄商集团股份有

欧洲杯体育球队示意将视情况而定-Kaiyun网页版·「中国」开云官方网站 登录入口

雷速体育12月20日讯 克利夫兰骑士队时尚艾萨克·奥科罗因肩伤将缺席至少两周时分欧洲杯体育。 当地时分周四,骑士队官方对外皮露,奥科罗在12月17日骑士与篮网队的比赛第三节中右肩失慎扭伤,将在两周后对其伤势从头评估。具体何时省略复出,球队示意将视情况而定。 手脚2020年选秀大会上的5号秀,奥科罗已成长为骑士队最出色的谨慎球员之一,而且在遑急端的施展也可圈可点。本赛季,他在23场比赛中(其中16场首发)场均获得6.6分、2.3个篮板和21分钟的上场时分。 在当年两年中,他一直在辛劳晋升外线投篮

开云(中国)kaiyun网页版登录入口最好气势由媒体小组(20东说念主)评比出-Kaiyun网页版·「中国」开云官方网站 登录入口

直播吧12月20日讯 NBA官方公布了本届NBA杯的最好气势:字母哥、亚历山大、、申京和特雷-杨开云(中国)kaiyun网页版登录入口。 最好气势由媒体小组(20东说念主)评比出,依据是球员在小组赛和淘汰赛中的推崇。同期,弃取球员时不琢磨位置。 其中,字母哥与亚历山大全票(20票)、利拉德19票、特雷-杨12票、申京6票。 此外,哈滕和小瓦5票,杰伦-4票,杰伦威3票,库里、东契奇、福克斯、约基奇、大洛和唐斯王人拿了1票。

欧洲杯体育换来了朱利叶斯·兰德尔和唐特·迪文岑佐-Kaiyun网页版·「中国」开云官方网站 登录入口

雷速体育12月20日讯 当天NBA旧例赛纽约尼克斯客场挑战明尼苏达丛林狼队欧洲杯体育。 这是卡尔-安东尼·唐斯初次以尼克斯队球员的身份在明尼苏达州打球,亦然他自从9月进修营运转前被交游到尼克斯以来,初次对阵明尼苏达丛林狼。 唐斯示意,再次走进丛林狼队主场时,有一种“轻柔的嗅觉”,但也有“目生感”。 “我不习尚在明尼苏达下飞机后凯旋去酒店,”唐斯说。“我不知谈怎么去习尚这些,这自从我被选中以来就从未发生过。” “我仍是一个狂热的丛林狼球迷,是以我有契机的时候会看许多他们的比赛,他们仍然是我的兄弟

官网
www.gdhezhi.com
地址
新闻科技园大厦3066号
邮箱
75c007de@outlook.com

Powered by Kaiyun网页版·「中国」开云官方网站 登录入口 RSS地图 HTML地图

Powered by365建站
Kaiyun网页版·「中国」开云官方网站 登录入口-欧洲杯体育但该领域仍存在三个关节局限性:最初-Kaiyun网页版·「中国」开云官方网站 登录入口