个人介绍:郑云红,阿里云计算有限公司研发工程师,毕业于电子科技大学,2022 年加入阿里云 Flink SQL 引擎团队,是 Fluss 存储引擎,Flink SQL 模块的核心开发和 Apache Flink Contributor。2023 年开始专注于 Fluss 存储引擎的开发,作为 Fluss 核心开发,主要聚焦于 Fluss 的日志存储、远程存储模块。
演讲介绍:Fluss 是一款为流计算设计的下一代流存储,具备毫秒级流读流写、实时更新、CDC日志订阅、流式列裁剪、湖流一体等特性。本次议题我们将为大家介绍 Fluss 诞生的背景,Fluss 是怎么样才能解决传统流存储与 Flink SQL 构建实时数仓的诸多问题的,如双流Join大状态、数据不可查、去重成本高等痛点问题。并重点解读 Fluss 核心功能的实现原理,通过 Benchmark 结果和用户案例分析 Fluss 的主要应用场景和收益。
1. 如何解决 Kafka 不支持更新,不支持数据探查,网络成本高的问题?
个人介绍:在快手数据平台部负责Spark和Blaze向量化引擎的研发和维护,曾任职于百度、滴滴、蚂蚁集团等一线网络公司,对大数据技术体系有较丰富的经验。
演讲介绍:Blaze 是快手自研的基于向量化技术开发的一套 native 执行引擎,执行过程充分的利用 native 代码和 SIMD 指令向量化计算的优势,实现在用户无感知或少感知的情况下给 Spark SQL 作业带来显著的性能提升。目前 Blaze 已经在快手内存大规模落地并取得超预期收益,随着项目开源,目前也有一些公司参与使用和共建 Blaze,本次分享将介绍 Blaze 在技术上的实现以及在生产实践中的使用案例。
2. 了解如何通过 Blaze 引擎落地到生产环境,对线上大数据计算进行提速。
个人介绍:余俊,Aloudata 合伙人 & 技术副总裁。拥有 18 年网络技术和大数据平台相关架构经验。作为主架构师及核心研发主导并完成了 Alibaba B2B 首个海量分布式 KV 存储系统,作为网站架构师负责 Aliexpress 全球买全球卖交易系统的第一代架构设计。曾任蚂蚁集团大数据研发平台技术负责人。从零开始主导完成蚂蚁第一和第二代数据研发平台产品体系的建设,涵盖数据集成、研发、运维、质量基线及资产平台等完整数据研发平台产品体系,支撑蚂蚁数以千计的 ETL 研发工程师,搭建了蚂蚁面向金融行业的逻辑化智能数据研发平台,有丰富的海量数据及智能化数仓的落地实践经验。
演讲介绍:数据编织(Data Fabric)作为一种创新的数据管理架构理念,自 2019 年起 Gartner 便在其数据技术趋势报告中多次提及,并在 2024 年的数据管理技术成熟度曲线中明显提升了其成熟度,预测在未来 2-5 年内将实现大范围的应用。与此同时,众多企业也开始积极探索数据编织的应用场景和落地路径,却苦于缺乏清晰可参考的实践方法论与价值评估标准。本次分享将结合 Aloudata 的真实案例,介绍数据编织的五大应用场景和相应的最佳实践。
个人介绍:华东江苏大数据交易所数据资产专委会专家委员,大数据和AI领域老兵,在金融、汽车、零售、供应链等领域具备丰富的实战经验。曾担任奔驰汽车金融首席数据治理官,京东智能供应链解决方案总监等岗位。在数据要素大市场中,聚焦在从企业级数据治理,数据资产入表到数据资产交易流通变现等主要环节。
演讲介绍:国家从“顶层设计到细则”的各项政策正在慢慢地激活数据要素潜能。我们将为大家介绍从数据资源化到数据资产化、数据资本化,再到数据产品变现,企业如何能实现数据的合法合规的开发、利用与价值变现。同时,分享百望云在泛零售领域的大数据与AI模型的探索应用,为企业业务增长与数字化转型赋能方案。
听众收益:本次演讲将剖析数字时代下数据要素对公司发展的核心价值与战略意义,同时将系统地探讨确保数据合规合法开发、共享、交互及交易的关键要点与策略,助力企业规范数据管理。同时,重点解读企业数据资产入表的实施流程与数据要素相互连通的实现机制,旨在提升企业的运营效率、市场响应速度及数据驱动的决策能力,进而强化企业在数字化的经济时代的竞争力和可持续发展动力。
1. 从数据资产盘点登记、数据要素交换变现、数据驱动业务增长的端到端互联
演讲题目:Gravitino: 助力大数据赋能 AI 的统一元数据管理平台
演讲介绍:Apache Gravitino(incubating) 是下一代多云原生的高性能联邦式元数据管理服务,可以统一管理异构数据资产,包括数据仓库、数据湖、非结构化数据和AI资产等,帮助用户构建 Data Mesh和Data Fabric。目前 Gravitino 已经在小米、Bilibili、唯品会、马上消费金融等有生产级落地,本次分享将结合技术和案例,介绍Gravitino统一元数据如何助力 Data+AI 融合管理,为公司能够带来收益。
听众收益:了解当下Data和AI的前沿趋势,学习了解统一元数据湖的核心技术与实践,获取可落地的数据治理最佳实践。
个人介绍:负责大模型+数据智能应用评测标准体系和能力建设,牵头大模型+系列标准研制与评测相关工作,系列标准包含《大模型驱动的智能数据分析工具技术方面的要求》、《大模型驱动的智能知识图谱技术方面的要求》、《大模型驱动的智能问答系统技术方面的要求》、《检索增强生成(RAG)技术方面的要求》、《数据智能体技术总体要求》、《数据分析智能体技术方面的要求》等。
个人介绍:十余年金融行业解决方案相关工作,围绕AI技术(大模型、NLP、知识图谱等)在金融机构的应用。在明略科技、瑞莱智慧任职期间,曾多次主导金融AI项目0-1的落地。
演讲介绍:随着大模型技术的发展日益成熟和稳定,企业应用建设正迈入一个能力深层次地融合、业务场景协同发展的新阶段。在各行业、各业务领域中,对大模型的需求不断涌现,呈现出蓬勃的发展的新趋势。本次大模型企业应用实践将从营销服务、风险运营、内控合规、内部办公等具体场景出发,进行大模型应用建设典型案例分享。
听众收益:近距离了解国央企、金融机构等大中型企业大模型应用落地建设的实际场景。
落地挑战和方案重点:一套大模型不能包打天下。不同于科研及竞赛打榜,大模型实际落地中需要最大限度地考虑 RIO,大小模型协同配合,为大模型企业应用提供更大的价值。
个人介绍:岑润哲,现任数势科技数据智能产品总经理,前头部网络公司资深量化运营负责人,多年零售与金融行业数据挖掘与用户运营策略设计经验,曾为多家大规模的公司搭建从目标设定、数据诊断、策略设计到优化复盘的全链路数字化运营平台。
演讲介绍:数据分析与洞察是企业利用大模型提升角色效率的重要场景,本次演讲我们将重点分享Data Agent 在这两个方面的先进解决方案与技术。同时,此次分享我们也将聚焦银行、零售连锁门店两个具体行业,分享最佳实践,助力企业在数字化的经济时代实现创新突破与降本提效。
1. 企业数据分析与洞察的难点和挑战:取数不准、分析简单、洞察不够深入、与业务决策出现断层
2. 常见解决方案的技术路线API,前两者不能完全满足,数势科技选择:NLP2API - 基于现有产品的语义层开放出独立的 API 用于扩展应用
· 落地中的难点以及怎么样才能解决:query改写,记忆存储和召回,任务规划穿越,时间推理不准确,提高工具调用效果等
· 茶饮品牌案例:利用数据分析 Agent 满足门店督导、单品分析等核心业务场景需求,促进企业数字化升级
· 城商行案例:利用数据分析 Agent 灵活取数用数,实现数据价值民主化
5. 未来展望:大模型 Agent + 数据分析领域解决方案的未来发展方向
1. 行业前瞻性知识:了解大模型+Agent技术在数据智能分析领域最前沿的解决方案和实践。
2.实际操作策略:学习怎么样融合AI Agent与数据语义,实现数据洞察。
3.商业转型见解:获取启发,为企业利用人工智能技术在数据分析领域的技术探索和解决方案创新方面提供方向。
个人介绍:负责火山引擎 DataWind ChatBI 技术工作,在 BI 分析,指标平台等领域有丰富的落地经验,曾服务过 HULU,快手等公司。
演讲介绍:从2022年 GPT-3.5 横空出世以来,大语言模型和 BI 系统结合以实现自然语言查数,是各家 BI 引擎积极探索的方向。火山引擎从2023年 ChatBI 立项以来,经过多种形态的产品探索,最终在抖音集团内部取得取得初步的 PMF。本次演讲主要分享 DataWind ChatBI 的产品探索与演进、技术落地方案以及对未来 ChatBI 产品形态的演进思考。
个人介绍:现任深擎科技解决方案部门长。十余年金融科技解决方案经验,熟悉券商、银行、保险业务和数字化转型。正致力于打造大模型智能体赋能金融行业客户智能化升级。
演讲介绍:金融行业投资顾问服务水平传统上强烈依赖于每位顾问自身的专业能力和综合技能,优秀投顾难以大范围复制,大量客户至今没有办法获得高质量的投资顾问服务。深擎科技正致力于通过AI Agent平台和大模型智能体赋能投资顾问提升专业能力和工作效率,与国信证券、招商证券、国泰君安、中金财富等头部金融机构深度合作并初见成效,使其服务效率提升了5-7倍,覆盖了更多客户群体,助力业务增长。
个人介绍:蚂蚁图计算开源负责人,专注于TuGraph的开源技术演进、社区运营和商业化等工作。先后就职于腾讯、阿里云、蚂蚁,从事大数据平台、云数据库、图计算相关的产品设计和技术建设。在分布式计算、数据安全管理、数据中台架构、开源布道等领域有丰富的开发和实践经历,目前专注于TuGraph的开源建设与技术合作。
个人介绍:目前在蚂蚁集团任开源布道师,同时也是 Apache 基金会的 PPMC & Committer。
演讲介绍:主要讲 Ray 项目目前的发展现状及趋势,已经在蚂蚁集团的落地、对外贡献和开源等情况。
个人介绍:拥有数据分析行业近15年的工作经验,对数据治理、数据算法建模、数据分析等有深刻认识和丰富经验,拥有服装零售、商超连锁、医药零售、石化、电信BI等多个行业大数据项目的整体规划、方案设计与落地实施经验。
演讲介绍:AI 在制造业产品生命周期中发挥着关键作用。在最近一到两年中,Altair 成功地将 AI 技术应用于多个制造业场景,帮助用户减少相关成本并提高效率。此外,我们还积极探索大模型在企业落地的应用,有效解决了用户在数据查询和分析方面的需求。
2. 企业对自身场景需求尚不明确,尚无法准确定位数据分析和 AI 应用的目标。
个人介绍:英飞流创始人,长期搜索、AI、Infra 开发经历。目前致力于 RAG 创业,基本的产品包括下一代 RAG 引擎 RAGFlow 和 RAG 专用 AI 原生数据库 Infinity。
演讲介绍:多模态RAG,这里特指针对企业文档的RAG,虽然还没有完整的产品形态出现,但在工程实践上已经准备好。本分享是关于如何利用开源组件,解锁这些企业级的多模态问答场景。Agentic 和 RAG 的关系密不可分,何时用工作流,何时用智能体,两者组合使用怎么样才能解决问题,本分享带来总结。
落地挑战和方案重点:好的 RAG 必定要自己训练模型,有的模型可以用标准的,有的则需要在场景内优化,本分享会带来这方面的经验。
个人介绍:火山引擎 E-MapReduce 高级产品经理,在大数据和数据库领域有10年+经验积累,曾服务过蚂蚁等公司。
演讲介绍:数据的质量影响模型的效果,因此模型训练前的数据准备工作很重要。如何高效、低成本的存储和处理海量的文本、图片音、视频文件等非结构化数据是各家都在探索的方向。本次演讲主要分享火山引擎数据产品如EMR、LAS、DataLeap在相关领域的思考和最佳实践。
新闻推荐
【2025-04-06】
【2025-04-06】
【2025-04-06】
【2025-04-06】
【2025-04-06】
【2025-04-04】
【2025-04-04】
【2025-04-03】
【2025-04-03】
【2025-04-01】
【2025-04-01】
【2025-04-01】