咨询电话

400-111-5953

在线客服

微信客服

新手指引

帮助

关注企业微信公众号
扫一扫关注公众号!
暂无图片

面向高端制造业的数据治理产品与合成数据平台

提供商:数创弧光(深圳)科技有限公司 类型:数据服务 行业: 人工智能基础技术产业
挂牌价格:

面议

挂牌时间:2025-07-03 21:31:44

简介:(一)数据治理产品:动态知识库与AI搜索引擎 1、动态知识库:动态知识挖掘与语境建模中枢。为大语言模型(LLM)定制构建可持续进化的知识体系,提供从数据挖掘、知识建模(语境图谱技术)、到智能检索(AI搜索引擎)的全流程产品与服务,具体包括: (1)数据挖掘:从多元异构多模态的数据格式中提取信息,基于核心自研的数据清洗自动化工具,输出标准格式的数据。 (2)知识建模:基于自研的语境图谱技术(Context Graph),提取“知识点”构建知识脉络,构建会 "思考" 的知识网络。 (3)智能检索(AI搜索引擎):自然语言驱动的数据检索引擎。集合SQL-R1(适用于SQL数据库的精准找数需求)、思维图谱ToG(适用于多跳问题、宏观信息)和检索增强RAG(适用于普通问题、细节信息)的强大检索能力,识别用户提问,提供精准回答 (二)合成数据平台 1、数据合成:数据合成服务:提供低成本、高质量合成数据服务,解决模型训练与应用中数据稀缺与高定制成本的问题,可服务于模型的预训练、后训练环节。以原始数据为基础,服务于用户的垂类场景需求,实现数十倍的数据增量(同时避免“近期繁殖”和“同质化”的问题)。合成效果相较行业标杆案例(EntiGraph)全面提升25%以上,成本节约85%以上。
基本信息
接口说明
使用说明
交易须知
  • 数据提供商
    企业名称 数创弧光(深圳)科技有限公司
    企业简介 数创弧光(DataArc)是一家在沈向洋院士支持下、由IDEA研究院孵化的大模型合成数据技术公司,种子轮已获得多家头部机构投资。团队聚焦于合成数据技术,旨在解决大数据模型训练与应用中的数据稀缺与高定制成本问题,为行业伙伴提供高质量、低成本的数据支持,并通过合成数据驱动的智能体技术实现原始数据到模型能力的快速转化。团队在合成数据的质量与安全领域拥有核心技术优势,在合成数据的质量方面提出新的方法,相较于斯坦福的标杆工作能够提升25.4%的准确率,且成本节约85.7%。且此外提出了新的合成数据加密技术,能够让大模型理解同态加密的“暗语”,加密效果接近无损。现在团队已与多家早期合作伙伴展开深入合作。核心团队成员均来自IDEA研究院及国内外顶尖院校,具有复合背景。
    详情介绍

    聚焦服务于高端制造行业客户,已实现在大型制造业集团的产品落地




  • 接口说明

  • 使用说明

  • 交易须知